深度學(xué)習(xí)在語音增強(qiáng)技術(shù)中的應(yīng)用研究
發(fā)布時(shí)間:2022-01-26 17:48
近年來,計(jì)算機(jī)與數(shù)字信號(hào)處理技術(shù)快速發(fā)展,語音通信在人機(jī)交互逐漸變成一種重要方式。然而各種各樣的干擾噪聲會(huì)導(dǎo)致人機(jī)交互的延遲或錯(cuò)誤識(shí)別問題。因此,解決噪聲干擾、增強(qiáng)語音質(zhì)量有著實(shí)際的意義。傳統(tǒng)增強(qiáng)方法會(huì)殘留部分噪聲,特別是音樂噪聲。此外,傳統(tǒng)方法對(duì)于信號(hào)間的關(guān)系以及特性做了一定的假設(shè),這并不符合實(shí)際環(huán)境情況。文章首先深入研究了語音增強(qiáng)技術(shù)和深度學(xué)習(xí)的基礎(chǔ)知識(shí)和相關(guān)理論,包括語音信號(hào)的預(yù)處理、特征提取以及深度學(xué)習(xí)模型的訓(xùn)練。其次給出了傳統(tǒng)的基于深度學(xué)習(xí)的語音增強(qiáng)框架,將帶噪語音信號(hào)特征作為深度神經(jīng)網(wǎng)絡(luò)的輸入,純凈語音信號(hào)特征作為網(wǎng)絡(luò)的輸出,利用深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征提取和映射能力復(fù)現(xiàn)純凈的語音信號(hào)。其次,譜減法是傳統(tǒng)語音增強(qiáng)算法中較為經(jīng)典的一種方法,其運(yùn)算量小,易實(shí)現(xiàn),但是其音質(zhì)并不理想,增強(qiáng)后的語音信號(hào)中存在很多音樂噪聲。本文利用傳統(tǒng)譜減法和深層網(wǎng)絡(luò)進(jìn)行聯(lián)合降噪,通過譜減法可以簡(jiǎn)單地去除大部分摻雜在語音信號(hào)中的噪聲,利用棧式自編碼濾除譜減法作用后剩余的噪聲,特別是音樂噪聲。實(shí)驗(yàn)中,從數(shù)據(jù)庫(kù)中隨機(jī)挑選4種噪聲來生成6種信噪比不同的帶噪語音信號(hào)。實(shí)驗(yàn)結(jié)果表明,兩種方法都能明顯減弱語音信號(hào)中...
【文章來源】:東北石油大學(xué)黑龍江省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
譜減法原理圖
[18]。維納濾波法的原理圖如圖 1-2 所示。圖1.2 維納濾波原理框圖語音增強(qiáng)其實(shí)質(zhì)就是最大限度地抑制或消除噪聲,使得最終得到原始語音的最佳估計(jì)。采用不同的準(zhǔn)則方法,得到的估計(jì)值也會(huì)不同。維納濾波采用的是最
22E e n E s n s n,使其最小即可。維納濾波相比較譜減法,最大的特點(diǎn)是濾波后的殘留噪聲不再是音樂噪聲。但該方法也不足之處,其缺點(diǎn)是過分依賴相關(guān)函數(shù),導(dǎo)致其消噪能力有限,且對(duì)于非平穩(wěn)噪聲處理效果不佳。1.3.3 自適應(yīng)濾波算法20世紀(jì) 60年代初,Jakowatz 等首先提出了自適應(yīng)濾波( Adaptive Filter,AD)的概念,該算法的作用是可實(shí)現(xiàn)從噪聲環(huán)境中提取出有用信號(hào)。相比較其它濾波算法,該算法具有更強(qiáng)適應(yīng)性。因此,近年來,該方法在語音增強(qiáng)領(lǐng)域中得到了極大的發(fā)展和應(yīng)用。濾波是為了獲取信號(hào)中所包含的有效信息。數(shù)字濾波器可實(shí)現(xiàn)將輸入的數(shù)字信號(hào)映射為輸出信號(hào),并從中提取出期望信息。通常,當(dāng)一個(gè)線性時(shí)不變?yōu)V波器的系數(shù)或內(nèi)部參數(shù)能夠隨輸入的數(shù)據(jù)按某一準(zhǔn)則改變,則稱該濾波器為自適應(yīng)濾波器。自適應(yīng)濾波的原理如圖 1-3 所示:
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)Dropout卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法研究[J]. 姜楓,張麗紅. 測(cè)試技術(shù)學(xué)報(bào). 2016(01)
[2]基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)研究[J]. 喬寬,楊中豪. 廣東通信技術(shù). 2015(06)
[3]基于小波變換的語音增強(qiáng)算法綜述[J]. 李如瑋,鮑長(zhǎng)春,竇慧晶. 數(shù)據(jù)采集與處理. 2009(03)
[4]基于雙正交小波包分解的自適應(yīng)閾值語音增強(qiáng)[J]. 李如瑋,鮑長(zhǎng)春,竇慧晶. 儀器儀表學(xué)報(bào). 2008(10)
[5]基于先驗(yàn)信噪比參數(shù)自適應(yīng)的頻域聯(lián)合語音增強(qiáng)方法[J]. 陳紫強(qiáng),曾慶寧,劉慶華. 電子與信息學(xué)報(bào). 2007(02)
[6]改進(jìn)的基于信號(hào)子空間的多通道語音增強(qiáng)算法[J]. 歐世峰,趙曉暉,顧海軍. 電子學(xué)報(bào). 2005(10)
[7]語音增強(qiáng)算法綜述[J]. 王晶,傅豐林,張運(yùn)偉. 聲學(xué)與電子工程. 2005(01)
[8]自適應(yīng)噪聲抵消的應(yīng)用研究[J]. 田玉靜,左紅偉. 青島建筑工程學(xué)院學(xué)報(bào). 2005(01)
碩士論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究[D]. 海蘭萍.青海師范大學(xué) 2012
[2]基于BP神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)研究[D]. 周元芬.貴州大學(xué) 2009
[3]基于AD神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)[D]. 李政洋.蘇州大學(xué) 2008
[4]基于RBF網(wǎng)絡(luò)的語音增強(qiáng)研究[D]. 郭利斌.天津大學(xué) 2006
[5]基于小波變換的語音增強(qiáng)方法研究及實(shí)時(shí)實(shí)現(xiàn)[D]. 譚東昱.湖南大學(xué) 2004
本文編號(hào):3610915
【文章來源】:東北石油大學(xué)黑龍江省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
譜減法原理圖
[18]。維納濾波法的原理圖如圖 1-2 所示。圖1.2 維納濾波原理框圖語音增強(qiáng)其實(shí)質(zhì)就是最大限度地抑制或消除噪聲,使得最終得到原始語音的最佳估計(jì)。采用不同的準(zhǔn)則方法,得到的估計(jì)值也會(huì)不同。維納濾波采用的是最
22E e n E s n s n,使其最小即可。維納濾波相比較譜減法,最大的特點(diǎn)是濾波后的殘留噪聲不再是音樂噪聲。但該方法也不足之處,其缺點(diǎn)是過分依賴相關(guān)函數(shù),導(dǎo)致其消噪能力有限,且對(duì)于非平穩(wěn)噪聲處理效果不佳。1.3.3 自適應(yīng)濾波算法20世紀(jì) 60年代初,Jakowatz 等首先提出了自適應(yīng)濾波( Adaptive Filter,AD)的概念,該算法的作用是可實(shí)現(xiàn)從噪聲環(huán)境中提取出有用信號(hào)。相比較其它濾波算法,該算法具有更強(qiáng)適應(yīng)性。因此,近年來,該方法在語音增強(qiáng)領(lǐng)域中得到了極大的發(fā)展和應(yīng)用。濾波是為了獲取信號(hào)中所包含的有效信息。數(shù)字濾波器可實(shí)現(xiàn)將輸入的數(shù)字信號(hào)映射為輸出信號(hào),并從中提取出期望信息。通常,當(dāng)一個(gè)線性時(shí)不變?yōu)V波器的系數(shù)或內(nèi)部參數(shù)能夠隨輸入的數(shù)據(jù)按某一準(zhǔn)則改變,則稱該濾波器為自適應(yīng)濾波器。自適應(yīng)濾波的原理如圖 1-3 所示:
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)Dropout卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法研究[J]. 姜楓,張麗紅. 測(cè)試技術(shù)學(xué)報(bào). 2016(01)
[2]基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)研究[J]. 喬寬,楊中豪. 廣東通信技術(shù). 2015(06)
[3]基于小波變換的語音增強(qiáng)算法綜述[J]. 李如瑋,鮑長(zhǎng)春,竇慧晶. 數(shù)據(jù)采集與處理. 2009(03)
[4]基于雙正交小波包分解的自適應(yīng)閾值語音增強(qiáng)[J]. 李如瑋,鮑長(zhǎng)春,竇慧晶. 儀器儀表學(xué)報(bào). 2008(10)
[5]基于先驗(yàn)信噪比參數(shù)自適應(yīng)的頻域聯(lián)合語音增強(qiáng)方法[J]. 陳紫強(qiáng),曾慶寧,劉慶華. 電子與信息學(xué)報(bào). 2007(02)
[6]改進(jìn)的基于信號(hào)子空間的多通道語音增強(qiáng)算法[J]. 歐世峰,趙曉暉,顧海軍. 電子學(xué)報(bào). 2005(10)
[7]語音增強(qiáng)算法綜述[J]. 王晶,傅豐林,張運(yùn)偉. 聲學(xué)與電子工程. 2005(01)
[8]自適應(yīng)噪聲抵消的應(yīng)用研究[J]. 田玉靜,左紅偉. 青島建筑工程學(xué)院學(xué)報(bào). 2005(01)
碩士論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究[D]. 海蘭萍.青海師范大學(xué) 2012
[2]基于BP神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)研究[D]. 周元芬.貴州大學(xué) 2009
[3]基于AD神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)[D]. 李政洋.蘇州大學(xué) 2008
[4]基于RBF網(wǎng)絡(luò)的語音增強(qiáng)研究[D]. 郭利斌.天津大學(xué) 2006
[5]基于小波變換的語音增強(qiáng)方法研究及實(shí)時(shí)實(shí)現(xiàn)[D]. 譚東昱.湖南大學(xué) 2004
本文編號(hào):3610915
本文鏈接:http://sikaile.net/kejilunwen/wltx/3610915.html
最近更新
教材專著