復(fù)雜環(huán)境下基于深度學(xué)習(xí)的語音信號預(yù)處理方法研究
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TN912.3
【圖文】:
更新網(wǎng)絡(luò)參數(shù)。由于語音和噪聲在頻域上更具有區(qū)分性,有學(xué)者在后續(xù)的研究中逡逑使用淺層神經(jīng)網(wǎng)絡(luò)以頻域特征為輸入去預(yù)測干凈語音(Sorensen,邋1991;邋Wan邋etal.,逡逑1999;邋Xieetal.,邋1994),如圖1.4所示。在訓(xùn)練階段,先對帶噪語音和干凈語音提逡逑取頻域特征,基于最小均方誤差準則,以帶噪語音的頻域特征為輸入,以干凈語逡逑音的頻域特征為目標,利用反向錯誤傳播算法來更新網(wǎng)絡(luò)參數(shù);在增強測試階逡逑段,訓(xùn)練好的模型以帶噪語音的頻域特征為輸入,得到的模型輸出即為對干凈語逡逑音的頻域特征的估計。有了頻域特征估計之后,結(jié)合原始語音的相位信息進行逆逡逑傅里葉變換(IDFT),最后使用重疊相加法(Allen,邋1977)得到降噪后的時域語音逡逑信號。逡逑干凈語音逡逑…逡逑IDFT&重疊相加邋^邐-j逡逑邐1:邋_邋I逡逑淺層神經(jīng)網(wǎng)絡(luò)邋|相位逡逑邐邋邋I逡逑n邐|逡逑I逡逑邐邋邋邋a逡逑加窗分幀&DFT邋邐"逡逑tttti邋-邋mi邋丨逡逑帶噪語音逡逑圖1.4基于淺層神經(jīng)網(wǎng)絡(luò)的語音增強算法(王青,2018)。逡逑10逡逑
更新網(wǎng)絡(luò)參數(shù)。由于語音和噪聲在頻域上更具有區(qū)分性,有學(xué)者在后續(xù)的研究中逡逑使用淺層神經(jīng)網(wǎng)絡(luò)以頻域特征為輸入去預(yù)測干凈語音(Sorensen,邋1991;邋Wan邋etal.,逡逑1999;邋Xieetal.,邋1994),如圖1.4所示。在訓(xùn)練階段,先對帶噪語音和干凈語音提逡逑取頻域特征,基于最小均方誤差準則,以帶噪語音的頻域特征為輸入,以干凈語逡逑音的頻域特征為目標,利用反向錯誤傳播算法來更新網(wǎng)絡(luò)參數(shù);在增強測試階逡逑段,訓(xùn)練好的模型以帶噪語音的頻域特征為輸入,得到的模型輸出即為對干凈語逡逑音的頻域特征的估計。有了頻域特征估計之后,結(jié)合原始語音的相位信息進行逆逡逑傅里葉變換(IDFT),最后使用重疊相加法(Allen,邋1977)得到降噪后的時域語音逡逑信號。逡逑干凈語音逡逑…逡逑IDFT&重疊相加邋^邐-j逡逑邐1:邋_邋I逡逑淺層神經(jīng)網(wǎng)絡(luò)邋|相位逡逑邐邋邋I逡逑n邐|逡逑I逡逑邐邋邋邋a逡逑加窗分幀&DFT邋邐"逡逑tttti邋-邋mi邋丨逡逑帶噪語音逡逑圖1.4基于淺層神經(jīng)網(wǎng)絡(luò)的語音增強算法(王青,2018)。逡逑10逡逑
【相似文獻】
相關(guān)期刊論文 前10條
1 石玲;;基于計算機聲卡的譜相減語音增強系統(tǒng)分析[J];信息與電腦(理論版);2010年02期
2 孫濤;;基于計算機聲卡的譜相減語音增強系統(tǒng)分析[J];南昌教育學(xué)院學(xué)報;2010年05期
3 張曉雷;;基于深度學(xué)習(xí)的語音增強簡述[J];網(wǎng)絡(luò)新媒體技術(shù);2019年02期
4 李璐君;屈丹;;一種基于組合深層模型的語音增強方法[J];信息工程大學(xué)學(xué)報;2018年04期
5 袁文浩;婁迎曦;梁春燕;夏斌;;利用生成噪聲提高語音增強方法的泛化能力[J];電子學(xué)報;2019年04期
6 陰法明;唐於烽;;基于深度置信網(wǎng)絡(luò)的語音增強算法[J];電子器件;2018年05期
7 余華;唐於烽;趙力;;基于改進深度置信網(wǎng)絡(luò)的語音增強算法[J];數(shù)據(jù)采集與處理;2018年05期
8 薛慧君;李盛;路國華;張楊;焦騰;王健琪;荊西京;;提升小波用于非接觸語音增強算法的研究[J];醫(yī)療衛(wèi)生裝備;2013年05期
9 胡海波;劉柏森;許銀;;基于小波變換的語音增強研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2011年01期
10 褚偉;;基于條件深度卷積生成對抗網(wǎng)絡(luò)的語音增強研究[J];智能計算機與應(yīng)用;2019年04期
相關(guān)會議論文 前10條
1 王世偉;胡笑滸;鄭成詩;李曉東;;一種改進的基于能量差語音增強算法[A];中國聲學(xué)學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2011年
2 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學(xué)學(xué)會2003年青年學(xué)術(shù)會議[CYCA'03]論文集[C];2003年
3 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學(xué)學(xué)會2005年青年學(xué)術(shù)會議[CYCA'05]論文集[C];2005年
4 童峰;許肖梅;洪青陽;;一種帶階數(shù)估計的語音增強算法[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年
5 袁榕嶸;吳鳴;楊軍;;雙麥克風(fēng)語音增強快速算法[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
6 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年
7 李海峰;韓紀慶;鄭鐵然;;元音、輔音粗判自適應(yīng)電話語音增強方法[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
8 高登峰;楊波;郭東岳;;基于深度神經(jīng)網(wǎng)絡(luò)的地空通話語音增強方法[A];第一屆空中交通管理系統(tǒng)技術(shù)學(xué)術(shù)年會論文集[C];2018年
9 樓廈廈;鄭成詩;李曉東;;濾波器權(quán)值約束對自適應(yīng)零限波束形成語音增強算法魯棒性影響分析[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集(上)[C];2007年
10 任玉寶;;基于聯(lián)合字典學(xué)習(xí)的語音增強算法[A];中國聲學(xué)學(xué)會水聲學(xué)分會2019年學(xué)術(shù)會議論文集[C];2019年
相關(guān)重要報紙文章 前3條
1 ;NMS Sonata Ⅲ/Studio Sound級語音增強系統(tǒng)話音更清晰[N];中國計算機報;2003年
2 本報記者 馬楠;NMS市場目標轉(zhuǎn)向無線服務(wù)提供商[N];通信產(chǎn)業(yè)報;2001年
3 ;VoIP服務(wù)不只是便宜的通話[N];網(wǎng)絡(luò)世界;2002年
相關(guān)博士學(xué)位論文 前10條
1 高天;復(fù)雜環(huán)境下基于深度學(xué)習(xí)的語音信號預(yù)處理方法研究[D];中國科學(xué)技術(shù)大學(xué);2018年
2 童仁杰;基于信號稀疏特性的語音增強算法研究[D];中國科學(xué)技術(shù)大學(xué);2018年
3 王青;基于深層神經(jīng)網(wǎng)絡(luò)的多目標學(xué)習(xí)和融合的語音增強研究[D];中國科學(xué)技術(shù)大學(xué);2018年
4 王冬霞;麥克風(fēng)陣列語音增強的若干方法研究[D];大連理工大學(xué);2007年
5 歐世峰;變換域語音增強算法的研究[D];吉林大學(xué);2008年
6 孫琦;基于子空間的低計算復(fù)雜度語音增強算法研究[D];吉林大學(xué);2017年
7 夏丙寅;面向移動通信的單通道語音增強方法研究[D];北京工業(yè)大學(xué);2014年
8 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學(xué)院上海冶金研究所;2001年
9 張龍;有監(jiān)督學(xué)習(xí)條件下的單通道語音增強算法研究[D];中國科學(xué)技術(shù)大學(xué);2017年
10 劉威;單通道語音水印與語音增強算法研究[D];東南大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 曲耀文;家庭環(huán)境中的語音增強系統(tǒng)設(shè)計[D];西南科技大學(xué);2018年
2 吳佳雯;基于表示學(xué)習(xí)的語音增強算法研究[D];廈門大學(xué);2017年
3 曾帆;遠距離麥克風(fēng)陣列語音增強及系統(tǒng)實現(xiàn)[D];廈門大學(xué);2018年
4 許銘;車載環(huán)境下語音處理關(guān)鍵技術(shù)的研究[D];遼寧工業(yè)大學(xué);2019年
5 賈翔宇;基于張量模型的語音增強算法研究[D];中國科學(xué)技術(shù)大學(xué);2019年
6 吉慧芳;改進相位譜信息及相位重構(gòu)的語音增強算法研究[D];太原理工大學(xué);2019年
7 王雁;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強算法[D];太原理工大學(xué);2019年
8 武正平;基于稀疏編碼的語音增強算法研究[D];太原理工大學(xué);2019年
9 閆寧;基于多標準融合的快速盲聲源分離算法研究[D];山東大學(xué);2019年
10 白爽冉;基于深度神經(jīng)網(wǎng)絡(luò)的有監(jiān)督語音增強研究[D];山東大學(xué);2019年
本文編號:2738883
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2738883.html