面向移動通信的單通道語音增強方法研究

發(fā)布時間：2019-08-04 11:21

【摘要】：近年來，單通道語音增強技術在移動語音通信系統(tǒng)中獲得了廣泛的應用，但在復雜噪聲場景中其性能往往不能達到實際應用的需求。本文從噪聲估計方法的改進、現(xiàn)有語音增強技術的融合、人工神經(jīng)網(wǎng)絡在語音增強中的應用，以及應用于移動通信系統(tǒng)網(wǎng)絡設備中的壓縮域語音增強方法等方面進行研究，提出了幾種適用于移動通信系統(tǒng)的單通道語音增強方法。本文的研究成果可以總結為以下幾個方面： 1.為提高噪聲估計方法對噪聲強度突變的跟蹤能力，本文在最小值控制遞歸平均方法基礎上，提出了一種噪聲估計加速方法。首先檢測含噪語音功率譜的突變情況，檢測到突變后設定具有自適應長度的拖尾段，并在拖尾段中利用多參數(shù)話音激活檢測方法判斷語音的存在性，而后結合噪聲估計與最小值比例參數(shù)，判定是否對噪聲估計進行強制更新。ITU-T G.160標準下的性能測試結果表明，噪聲估計加速方法不會對噪聲強度平穩(wěn)時的性能產(chǎn)生影響，但噪聲強度突變時的收斂時間得到了顯著的降低，同時有效消除了收斂過程中的音樂噪聲現(xiàn)象。 2.為結合不同語音增強算法的優(yōu)勢，本文提出了一種基于小波融合的語音增強方法。該方法首先利用雙正交小波包變換將含噪語音分解為若干個子帶；而后分別使用加權歐氏失真測度幅度譜估計器和過減型小波閾值方法在各子帶中進行增強；進一步，利用基于互相關和先驗信噪比的融合準則，將兩種方法所得輸出小波系數(shù)結合起來；最后利用逆小波包變換得到增強語音。利用ITU-T G.160標準進行性能測試，結果表明，與參考方法相比，所提方法可以獲得更好的客觀語音質(zhì)量。 3.通過在傳統(tǒng)的去噪自動編碼器（Denoising Auto-encoder，DA）中引入加權重建損失函數(shù)，本文提出了一種加權去噪自動編碼器（Weighted DenoisingAuto-encoder，WDA）模型，并用于描述純凈語音和含噪語音功率譜的關系。在此基礎上，提出一種基于WDA和噪聲分類的維納濾波語音增強方法。所提方法首先利用WDA模型估計純凈語音的功率譜，而后利用后驗信噪比控制的遞歸平均方法估計先驗信噪比，最終使用頻域維納濾波方法獲得增強語音。另外，引入一種基于高斯混合模型的在線噪聲分類方法，改善所提方法在不同噪聲環(huán)境中的適用性�；贗TU-T G.160的性能測試結果表明，與傳統(tǒng)的頻域維納濾波方法相比，所提方法在訓練集內(nèi)和集外噪聲環(huán)境中都可以獲得更好的客觀語音質(zhì)量。 4.基于ITU-T G.722.2編碼器的比特流，通過調(diào)整碼書增益參數(shù)，本文提出了一種兼容非連續(xù)傳輸模式和幀擦除情況的壓縮域語音增強方法。在非DTX模式，首先在壓縮域進行話音活動性檢測和背景噪聲分類；而后利用代數(shù)碼書能量估計噪聲強度，并根據(jù)噪聲類型估計信噪比；進而對自適應碼書和代數(shù)碼書增益進行聯(lián)合調(diào)整，并重新量化編碼。在非連續(xù)傳輸模式的非語音幀中，對對數(shù)幀能量進行衰減以消除噪聲的影響，同時保持譜包絡參數(shù)不變。在幀擦除發(fā)生時，對恢復得到的代數(shù)碼書增益進行指數(shù)衰減，重建代數(shù)碼書矢量，并對所有編碼參數(shù)進行重新編碼�；贗TU-T G.160標準的性能測試結果表明，所提方法可以在低復雜度前提下，獲得優(yōu)于現(xiàn)有壓縮域語音增強方法的噪聲衰減、信噪比提高和主客觀語音質(zhì)量。
【圖文】：

面向移動通信的單通道語音增強方法研究

時間 (s)0 1 2 3 4 5 6c)圖 2-11 噪聲強度突變時的語譜圖對比a) 含噪語音 b) 參考算法增強語音 c) 所提算法增強語音gure 2-11 Spectrogram comparison when the sudden change of noise intensity occursy speech b) enhanced speech of reference method c) enhanced speech of proposed me 2-11給出了白噪聲情況下含噪語音、參考算法增強語音以及所提算的語譜圖對比。噪聲強度在 3.4s左右發(fā)生突然增大的情況，突變前的8dB，突變后的信噪比為 6dB�？梢钥吹�，參考算法在噪聲突變后跟慢，收斂過程中的殘留噪聲不平穩(wěn)，，音樂噪聲明顯，而所提算法在突可快速的跟蹤噪聲變化，且收斂后殘留噪聲平穩(wěn)，語音質(zhì)量較好。外，本文采用對數(shù)譜失真（Logarithmic Spectral Distortion，LSD）[98]度突變情況下，語音質(zhì)量的客觀評價指標。測試中使用的含噪語音是和包含強度突變的噪聲信號混合得到，突變前含噪語音的信噪比為 18信噪比為 6dB。LSD指標在噪聲強度突變后的語音段中計算得到。2 種噪聲下的LSD測試結果如表 2-5所示。

面向移動通信的單通道語音增強方法研究

圖 5-8 基于濁音度的 VAD 示例a) 含噪語音波形 b) 平滑濁音度及其閾值 c) VAD 結果Figure 5-8 An example of voicing factor based VAD methodeform of noisy speech b) smoothed voicing factor and the threshold c) VA提出可以利用噪聲段 LPC 譜包絡中低頻部分所占的能量比區(qū)分為全帶分布噪聲（例如白噪聲、工廠噪聲等），以及低頻分聲等）。AD 結果為 0，即語音不存在的幀中，計算 NFFT= 256 點的 LP段 Nlow= 5 個頻點的能量占總能量的比例，如下所示：10_ / 20( )( )lowFFTNlpcien low NlpciE iRE i low——譜包絡低頻能量比參數(shù)；——使用含噪語音 ISF 參數(shù)計算得到的 LPC 譜包絡。
【學位授予單位】：北京工業(yè)大學
【學位級別】：博士
【學位授予年份】：2014
【分類號】：TN912.3

【參考文獻】

相關期刊論文前10條

1 曲天書,戴逸松,王樹勛;基于SURE無偏估計的自適應小波閾值去噪[J];電子學報;2002年02期

2 歐世峰;趙曉暉;;基于幀間相關性的最大后驗估計語音增強算法[J];電子學報;2007年10期

3 戴悟僧;小波變換的頻響特性及其在語音去噪中的應用[J];數(shù)據(jù)采集與處理;2000年01期

4 高亞召;李亞安;徐德民;;語音增強中小波收縮參數(shù)選擇分析[J];數(shù)據(jù)采集與處理;2009年03期

5 曹斌芳;李建奇;;基于自適應仿生小波變換的語音增強方法[J];數(shù)據(jù)采集與處理;2010年06期

6 李沖泥,胡光銳;一種改進的子波域語音增強方法[J];通信學報;1999年04期

7 金乃高;殷福亮;王冬霞;陳U

本文編號：2522908

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2522908.html

上一篇：Wi-Fi系統(tǒng)中信道估計和信號檢測算法的研究與實現(xiàn)
下一篇：針對Trivium型密碼算法的代數(shù)攻擊

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向移動通信的單通道語音增強方法研究