基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究
本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:科技進(jìn)步日新月異的今天,語音正逐步成為人機(jī)交互中的一種重要通道。然而在現(xiàn)實(shí)生活環(huán)境中,語音信號(hào)非常容易受到各種噪聲的影響,從而導(dǎo)致人機(jī)交互的延時(shí)問題和錯(cuò)誤識(shí)別問題。因此語音增強(qiáng)技術(shù)就顯得尤為重要,此技術(shù)就是消除語音信號(hào)中的噪聲,提升語音信號(hào)的性能,使得語音具有較高的清晰度、可理解度和流暢度。本文主要研究譜減法與深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)算法。譜減法是一種經(jīng)典的語音增強(qiáng)算法,此算法實(shí)現(xiàn)較簡(jiǎn)單,且容易理解,但是增強(qiáng)后的語音有殘留噪聲,一般稱為音樂噪聲。這種噪聲比較難以去除,為了解決這個(gè)問題。本文使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語音增強(qiáng)研究。深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)算法就是利用帶噪語音信號(hào)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使得網(wǎng)絡(luò)具有抗噪聲的能力,從而實(shí)現(xiàn)語音增強(qiáng)的目的。在訓(xùn)練過程中一般采用BP算法,但是隨著網(wǎng)絡(luò)隱含層數(shù)的增加,訓(xùn)練過程中容易出現(xiàn)局部最優(yōu)問題和過擬合問題。因此,本文采用的是逐層貪婪無監(jiān)督訓(xùn)練算法,將整個(gè)訓(xùn)練過程分成無監(jiān)督訓(xùn)練和有監(jiān)督訓(xùn)練兩個(gè)過程。在網(wǎng)絡(luò)訓(xùn)練過程中還有一個(gè)重要的參數(shù)就是網(wǎng)絡(luò)的隱含層數(shù),它與網(wǎng)絡(luò)的訓(xùn)練效果有著直接的關(guān)系。本文提出了偏差法來設(shè)置網(wǎng)絡(luò)的隱含層數(shù),對(duì)網(wǎng)絡(luò)適合隱含層數(shù)的設(shè)置進(jìn)行了一定的理論推導(dǎo),同時(shí)在實(shí)驗(yàn)中對(duì)其進(jìn)行了驗(yàn)證。但是深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)算法對(duì)于訓(xùn)練庫的要求比較高,訓(xùn)練時(shí)間長(zhǎng)。為了解決這個(gè)問題,本文提出了譜減法與深度神經(jīng)網(wǎng)絡(luò)結(jié)合的語音增強(qiáng)算法。譜減法與深度神經(jīng)網(wǎng)絡(luò)結(jié)合的語音增強(qiáng)算法解決了深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)算法中訓(xùn)練庫要求噪聲種類多的問題,同時(shí)也在一定程度上提升了語音增強(qiáng)效果。實(shí)驗(yàn)證明,此結(jié)合算法的效果優(yōu)于譜減法的其他結(jié)合算法。本文提出了偏差法來設(shè)置深度神經(jīng)網(wǎng)絡(luò)的隱含層數(shù),同時(shí),本文還提出了譜減法與深度神經(jīng)網(wǎng)絡(luò)結(jié)合的語音增強(qiáng)算法。最后,本文的實(shí)驗(yàn)對(duì)上述方法進(jìn)行了驗(yàn)證,實(shí)驗(yàn)結(jié)果表明這些方法是行之有效的,而且深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)算法具有很好的語音增強(qiáng)效果。
【關(guān)鍵詞】:語音增強(qiáng) 深度神經(jīng)網(wǎng)絡(luò) 譜減法 偏差法 隱含層數(shù)
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3;TP183
【目錄】:
- 摘要5-7
- Abstract7-11
- 第一章 緒論11-17
- 1.1 語音增強(qiáng)研究的目的和意義11
- 1.2 語音增強(qiáng)的研究歷史和現(xiàn)狀11-14
- 1.3 本文的研究目標(biāo)與研究?jī)?nèi)容14-15
- 1.4 本文的章節(jié)安排15-16
- 1.5 本章小結(jié)16-17
- 第二章 語音增強(qiáng)的基礎(chǔ)理論17-32
- 2.1 噪聲信號(hào)的分類17-18
- 2.2 語音信號(hào)的預(yù)處理18-22
- 2.2.1 預(yù)加重18
- 2.2.2 分幀加窗18-20
- 2.2.3 語音端點(diǎn)檢測(cè)20-22
- 2.3 譜減法22-27
- 2.3.1 基本譜減法22-24
- 2.3.2 改進(jìn)的譜減法24-25
- 2.3.3 減少音樂噪聲25-27
- 2.4 語音增強(qiáng)質(zhì)量評(píng)估27-31
- 2.4.1 主觀評(píng)價(jià)27-28
- 2.4.2 客觀評(píng)價(jià)28-31
- 2.5 本章小結(jié)31-32
- 第三章 深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)理論32-39
- 3.1 深度神經(jīng)網(wǎng)絡(luò)32-33
- 3.2 受限玻爾茲曼機(jī)33-34
- 3.3 能量函數(shù)和概率分布34-36
- 3.4 對(duì)比散度算法36-37
- 3.5 深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練37-38
- 3.6 本章小結(jié)38-39
- 第四章 深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)39-48
- 4.1 深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)結(jié)構(gòu)39-40
- 4.2 偏差法設(shè)置隱含層數(shù)40-42
- 4.3 語音增強(qiáng)系統(tǒng)的訓(xùn)練42-46
- 4.4 譜減法與深度神經(jīng)網(wǎng)絡(luò)的結(jié)合46-47
- 4.5 本章小結(jié)47-48
- 第五章 實(shí)驗(yàn)設(shè)計(jì)與實(shí)驗(yàn)結(jié)果的分析48-59
- 5.1 語音數(shù)據(jù)庫48
- 5.2 語音增強(qiáng)評(píng)價(jià)指標(biāo)48-49
- 5.3 譜減法實(shí)驗(yàn)結(jié)果49-50
- 5.4 深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)實(shí)驗(yàn)50-55
- 5.4.1 隱含層數(shù)的設(shè)置51-52
- 5.4.2 噪聲類型的數(shù)目52-53
- 5.4.3 輸入信號(hào)的上下文長(zhǎng)度53-54
- 5.4.4 深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)系統(tǒng)54-55
- 5.5 譜減法與深度神經(jīng)網(wǎng)絡(luò)結(jié)合算法55-58
- 5.6 本章小結(jié)58-59
- 第六章 總結(jié)與展望59-61
- 6.1 論文總結(jié)59-60
- 6.2 未來研究的展望60-61
- 致謝61-62
- 參考文獻(xiàn)62-67
- 攻讀碩士學(xué)位期間發(fā)表的論文67-68
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語音增強(qiáng)算法[J];上海交通大學(xué)學(xué)報(bào);2000年07期
2 姚峰英,張敏;用于語音增強(qiáng)的高頻信噪比度量[J];聲學(xué)學(xué)報(bào);2002年05期
3 彭煊,劉金福,王炳錫;基于獨(dú)立分量分析的語音增強(qiáng)[J];信號(hào)處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語音增強(qiáng)方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
5 楊匯軍,鄭海英,王立紅;語音增強(qiáng)方法的研究[J];遼寧工學(xué)院學(xué)報(bào);2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強(qiáng)新算法[J];傳感技術(shù)學(xué)報(bào);2004年01期
7 孫新德;一種改進(jìn)的語音增強(qiáng)方法及實(shí)現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
8 錢國(guó)青;趙鶴鳴;;基于改進(jìn)譜減算法的語音增強(qiáng)新方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運(yùn)偉;語音增強(qiáng)算法綜述[J];聲學(xué)與電子工程;2005年01期
10 楊毅;楊宇;余達(dá)太;;語音增強(qiáng)及其消噪能力研究[J];微電子學(xué)與計(jì)算機(jī);2006年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 陳凱;俞蒙槐;胡上序;付強(qiáng);;語音增強(qiáng)系統(tǒng)性能評(píng)測(cè)方法綜述[A];第四屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語音增強(qiáng)及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語音增強(qiáng)方法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國(guó)慶;;諧波能量匯集度在語音增強(qiáng)中的應(yīng)用[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
5 國(guó)雁萌;;一種極低信噪比條件下的語音增強(qiáng)方法[A];第六屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語音增強(qiáng)算法研究[A];中國(guó)聲學(xué)學(xué)會(huì)2005年青年學(xué)術(shù)會(huì)議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強(qiáng);覃團(tuán)發(fā);萬海斌;;語音增強(qiáng)算法的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
9 魏臻;張景達(dá);陸陽;;嵌入式系統(tǒng)中語音增強(qiáng)改進(jìn)算法的研究[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語音增強(qiáng)方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 歐世峰;變換域語音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
2 尹偉;基于模型的語音增強(qiáng)方法及質(zhì)量評(píng)估研究[D];武漢大學(xué);2009年
3 王海艷;基于統(tǒng)計(jì)模型的語音增強(qiáng)算法研究[D];吉林大學(xué);2011年
4 方瑜;語音增強(qiáng)相關(guān)問題研究[D];北京郵電大學(xué);2012年
5 姚峰英;語音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院上海冶金研究所;2001年
6 夏丙寅;面向移動(dòng)通信的單通道語音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
8 陶智;低信噪比環(huán)境下語音增強(qiáng)的研究[D];蘇州大學(xué);2011年
9 王娜;基于小波變換與約束方差噪聲譜估計(jì)的語音增強(qiáng)算法研究[D];燕山大學(xué);2011年
10 趙彥平;基于稀疏表示的語音增強(qiáng)方法研究[D];吉林大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 肖佩霖;雙通道語音增強(qiáng)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 陳成斌;針對(duì)于家居環(huán)境的語音增強(qiáng)系統(tǒng)的研究與開發(fā)[D];華南理工大學(xué);2015年
3 魏有權(quán);基于噪聲估計(jì)的語音增強(qiáng)算法研究[D];昆明理工大學(xué);2015年
4 胡勇;麥克風(fēng)陣列語音增強(qiáng)算法研究[D];電子科技大學(xué);2014年
5 曹后斌;有色背景噪聲環(huán)境下語音增強(qiáng)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 馬小惠;陣列語音增強(qiáng)在車載環(huán)境中的應(yīng)用[D];大連理工大學(xué);2015年
7 李達(dá);無線聲學(xué)傳感器網(wǎng)絡(luò)中分布式語音增強(qiáng)方法研究[D];大連理工大學(xué);2015年
8 高珍珍;基于梅爾頻譜域HMM的語音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2015年
9 宋環(huán)宇;全數(shù)字助聽器語音增強(qiáng)算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 王永杰;基于麥克風(fēng)陣列的語音增強(qiáng)算法研究[D];西安電子科技大學(xué);2014年
本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):323210
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/323210.html