利用奇異譜分析的深度神經(jīng)網(wǎng)絡(luò)語音增強方法
發(fā)布時間:2021-07-30 13:06
針對現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)語音增強方法對帶噪語音的去噪能力有限、語音質(zhì)量提升不高的問題,提出了一種基于奇異譜分析的深度神經(jīng)網(wǎng)絡(luò)語音增強方法。通過引入奇異譜分析算法對帶噪語音進行預(yù)處理,以初步分離得到語音信號與噪聲。接著將語音信號與噪聲用于深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,以得到性能更優(yōu)的網(wǎng)絡(luò)模型,從而使得本文方法具有更好的性能。最后在重建干凈語音的環(huán)節(jié)中,同時使用神經(jīng)網(wǎng)絡(luò)估計得到的對數(shù)功率譜和帶噪語音的對數(shù)功率譜,并加入了權(quán)重系數(shù),使得本文提出的方法可以適應(yīng)不同信噪比的情形,有效的去除背景噪聲,降低語音信號的失真。本文通過仿真實驗驗證了該方法的有效性和魯棒性。
【文章來源】:信號處理. 2020,36(06)北大核心CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
信噪比為5 dB的帶噪語音
圖1(a) 信噪比為5 dB的帶噪語音使用奇異譜分析算法將語音和噪聲預(yù)分離之后,對全部分量進行短時傅里葉變換,得到幅度譜,平方后取對數(shù)得到對數(shù)功率譜。為后續(xù)的神經(jīng)網(wǎng)絡(luò)過程做準備。
本文提出的語音增強方法分為兩階段。圖2為深度神經(jīng)網(wǎng)絡(luò)地訓(xùn)練階段流程框圖,神經(jīng)網(wǎng)絡(luò)通過擬合特征數(shù)據(jù)和標簽數(shù)據(jù)完成監(jiān)督學(xué)習(xí),獲得神經(jīng)網(wǎng)絡(luò)模型。在對帶噪語音樣本(Noisy samples)的特征提取時,首先需要對帶噪語音樣本進行奇異譜分析(SSA):
【參考文獻】:
期刊論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的單通道語音增強方法回顧[J]. 鮑長春,項揚. 信號處理. 2019(12)
[2]利用深度全卷積編解碼網(wǎng)絡(luò)的單通道語音增強[J]. 時文華,張雄偉,鄒霞,孫蒙. 信號處理. 2019(04)
本文編號:3311457
【文章來源】:信號處理. 2020,36(06)北大核心CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
信噪比為5 dB的帶噪語音
圖1(a) 信噪比為5 dB的帶噪語音使用奇異譜分析算法將語音和噪聲預(yù)分離之后,對全部分量進行短時傅里葉變換,得到幅度譜,平方后取對數(shù)得到對數(shù)功率譜。為后續(xù)的神經(jīng)網(wǎng)絡(luò)過程做準備。
本文提出的語音增強方法分為兩階段。圖2為深度神經(jīng)網(wǎng)絡(luò)地訓(xùn)練階段流程框圖,神經(jīng)網(wǎng)絡(luò)通過擬合特征數(shù)據(jù)和標簽數(shù)據(jù)完成監(jiān)督學(xué)習(xí),獲得神經(jīng)網(wǎng)絡(luò)模型。在對帶噪語音樣本(Noisy samples)的特征提取時,首先需要對帶噪語音樣本進行奇異譜分析(SSA):
【參考文獻】:
期刊論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的單通道語音增強方法回顧[J]. 鮑長春,項揚. 信號處理. 2019(12)
[2]利用深度全卷積編解碼網(wǎng)絡(luò)的單通道語音增強[J]. 時文華,張雄偉,鄒霞,孫蒙. 信號處理. 2019(04)
本文編號:3311457
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3311457.html
最近更新
教材專著