混響環(huán)境下的遠(yuǎn)程語音增強(qiáng)方法研究
【圖文】:
時保證算法穩(wěn)健性。Kinoshita等人[8]從提交至REVERB邋Challenge的近三十篇文獻(xiàn)中,,遴選逡逑出各類針對混響環(huán)境的語音增強(qiáng)識別算法,給出了由這些方法子集組成的混響語音處理流逡逑程,如圖1邋-1所示。其中語音增強(qiáng)部分(Enhancement邋Part)作為識別部分(Recognition邋Part)逡逑的必要前級模塊,包含多通道的語音增強(qiáng)和單通道語音增強(qiáng)/特征提取的子模塊。REVERB逡逑Challenge提供純凈語音集和仿真數(shù)據(jù)集作為訓(xùn)練集,同時給出仿真和實(shí)錄數(shù)據(jù)集作為各類逡逑語音增強(qiáng)算法的驗證集。從圖1-1中可以看到,語音增強(qiáng)部分的輸出作為識別模塊的前級,逡逑Enhancement邋part邐Recognition邋part逡逑邐A邐邋邐A邐逡逑(邋\(邋\逡逑^邐I邋i邐I邋i邐I邋i邐I邋邐逡逑r邋Multi-channel邋lchSE/FE.^邋Robust邋feature邋^邐^邋c0mbinat,0n邋f逡逑SE邐extraction邐3邐/逡逑^^邋^,逡逑AM邋LM邐/逡逑S邋/逡逑Adapt邐I逡逑LZ邐/逡逑圖1-1邋REVERB邋Challenge去混響語音處理流程逡逑其性能的優(yōu)劣直接影響后級中的穩(wěn)健語音特征提取、譯碼模塊以及最終的識別結(jié)果。因此,逡逑2逡逑
.1邋愿邐(2-17)逡逑由于室內(nèi)混響的復(fù)雜本質(zhì),對室內(nèi)b8學(xué)的分析和合成需要不同的模型。圖2-1給出了建模逡逑和仿真室內(nèi)聲學(xué)的常見方法,圖內(nèi)所示的建模方法可以劃分為:波動(Wave-based)模型、逡逑射線(Ray-based)模型和統(tǒng)計模型,聯(lián)合以上模型能夠?qū)θJ譜(Audio邋Spectrum)進(jìn)行分逡逑析。然而對于語音信號的有限帶寬性,準(zhǔn)確而又簡單的模型更為適用。逡逑2.3統(tǒng)計混響棋型逡逑在室內(nèi)環(huán)境中對聲學(xué)過程建模是一a極其復(fù)雜的過程,常用的方法為統(tǒng)計室內(nèi)聲學(xué)逡逑(SRA)。SRA利用房間體積!/、混響時間r6n、臨界距離Dc、聲源-麥克風(fēng)距離等一系列參數(shù)逡逑紿出對聲學(xué)系統(tǒng)傳遞函數(shù)的統(tǒng)計描述。為了描述單夂平面波的福度和相位分布,SRA基于逡逑的重要假設(shè)可以歸結(jié)為:在室內(nèi)任意一點(diǎn)產(chǎn)生的聲壓近似隨機(jī),因此聲場均勻分布在整a逡逑12逡逑
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN912.35
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉鵬;;基于深度學(xué)習(xí)的語音增強(qiáng)方法研究[J];智能計算機(jī)與應(yīng)用;2019年05期
2 石玲;;基于計算機(jī)聲卡的譜相減語音增強(qiáng)系統(tǒng)分析[J];信息與電腦(理論版);2010年02期
3 孫濤;;基于計算機(jī)聲卡的譜相減語音增強(qiáng)系統(tǒng)分析[J];南昌教育學(xué)院學(xué)報;2010年05期
4 張曉雷;;基于深度學(xué)習(xí)的語音增強(qiáng)簡述[J];網(wǎng)絡(luò)新媒體技術(shù);2019年02期
5 李璐君;屈丹;;一種基于組合深層模型的語音增強(qiáng)方法[J];信息工程大學(xué)學(xué)報;2018年04期
6 袁文浩;婁迎曦;梁春燕;夏斌;;利用生成噪聲提高語音增強(qiáng)方法的泛化能力[J];電子學(xué)報;2019年04期
7 陰法明;唐於烽;;基于深度置信網(wǎng)絡(luò)的語音增強(qiáng)算法[J];電子器件;2018年05期
8 余華;唐於烽;趙力;;基于改進(jìn)深度置信網(wǎng)絡(luò)的語音增強(qiáng)算法[J];數(shù)據(jù)采集與處理;2018年05期
9 薛慧君;李盛;路國華;張楊;焦騰;王健琪;荊西京;;提升小波用于非接觸語音增強(qiáng)算法的研究[J];醫(yī)療衛(wèi)生裝備;2013年05期
10 胡海波;劉柏森;許銀;;基于小波變換的語音增強(qiáng)研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2011年01期
相關(guān)會議論文 前10條
1 王世偉;胡笑滸;鄭成詩;李曉東;;一種改進(jìn)的基于能量差語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2011年
2 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會2003年青年學(xué)術(shù)會議[CYCA'03]論文集[C];2003年
3 閻兆立;杜利民;;維納后濾波語音增強(qiáng)算法研究[A];中國聲學(xué)學(xué)會2005年青年學(xué)術(shù)會議[CYCA'05]論文集[C];2005年
4 童峰;許肖梅;洪青陽;;一種帶階數(shù)估計的語音增強(qiáng)算法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
5 袁榕嶸;吳鳴;楊軍;;雙麥克風(fēng)語音增強(qiáng)快速算法[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
6 國雁萌;;一種極低信噪比條件下的語音增強(qiáng)方法[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
7 李海峰;韓紀(jì)慶;鄭鐵然;;元音、輔音粗判自適應(yīng)電話語音增強(qiáng)方法[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
8 高登峰;楊波;郭東岳;;基于深度神經(jīng)網(wǎng)絡(luò)的地空通話語音增強(qiáng)方法[A];第一屆空中交通管理系統(tǒng)技術(shù)學(xué)術(shù)年會論文集[C];2018年
9 樓廈廈;鄭成詩;李曉東;;濾波器權(quán)值約束對自適應(yīng)零限波束形成語音增強(qiáng)算法魯棒性影響分析[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集(上)[C];2007年
10 任玉寶;;基于聯(lián)合字典學(xué)習(xí)的語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會水聲學(xué)分會2019年學(xué)術(shù)會議論文集[C];2019年
相關(guān)重要報紙文章 前3條
1 ;NMS Sonata Ⅲ/Studio Sound級語音增強(qiáng)系統(tǒng)話音更清晰[N];中國計算機(jī)報;2003年
2 本報記者 馬楠;NMS市場目標(biāo)轉(zhuǎn)向無線服務(wù)提供商[N];通信產(chǎn)業(yè)報;2001年
3 ;VoIP服務(wù)不只是便宜的通話[N];網(wǎng)絡(luò)世界;2002年
相關(guān)博士學(xué)位論文 前10條
1 江文斌;面向復(fù)雜場景的極低碼率語音編解碼和語音增強(qiáng)關(guān)鍵技術(shù)研究[D];上海交通大學(xué);2018年
2 高天;復(fù)雜環(huán)境下基于深度學(xué)習(xí)的語音信號預(yù)處理方法研究[D];中國科學(xué)技術(shù)大學(xué);2018年
3 童仁杰;基于信號稀疏特性的語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2018年
4 王青;基于深層神經(jīng)網(wǎng)絡(luò)的多目標(biāo)學(xué)習(xí)和融合的語音增強(qiáng)研究[D];中國科學(xué)技術(shù)大學(xué);2018年
5 王冬霞;麥克風(fēng)陣列語音增強(qiáng)的若干方法研究[D];大連理工大學(xué);2007年
6 歐世峰;變換域語音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
7 孫琦;基于子空間的低計算復(fù)雜度語音增強(qiáng)算法研究[D];吉林大學(xué);2017年
8 夏丙寅;面向移動通信的單通道語音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
9 姚峰英;語音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國科學(xué)院上海冶金研究所;2001年
10 張龍;有監(jiān)督學(xué)習(xí)條件下的單通道語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 許瑞龍;基于自動編碼器和生成對抗網(wǎng)絡(luò)的語音增強(qiáng)方法研究[D];江西理工大學(xué);2019年
2 續(xù)嬌;基于自適應(yīng)波束成形的語音增強(qiáng)算法研究與實(shí)現(xiàn)[D];北京交通大學(xué);2019年
3 程澤豐;混響環(huán)境下的遠(yuǎn)程語音增強(qiáng)方法研究[D];浙江大學(xué);2019年
4 黃張翼;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法研究[D];重慶郵電大學(xué);2018年
5 吳佳雯;基于表示學(xué)習(xí)的語音增強(qiáng)算法研究[D];廈門大學(xué);2017年
6 曾帆;遠(yuǎn)距離麥克風(fēng)陣列語音增強(qiáng)及系統(tǒng)實(shí)現(xiàn)[D];廈門大學(xué);2018年
7 許銘;車載環(huán)境下語音處理關(guān)鍵技術(shù)的研究[D];遼寧工業(yè)大學(xué);2019年
8 賈翔宇;基于張量模型的語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2019年
9 吉慧芳;改進(jìn)相位譜信息及相位重構(gòu)的語音增強(qiáng)算法研究[D];太原理工大學(xué);2019年
10 王雁;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法[D];太原理工大學(xué);2019年
本文編號:2628325
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2628325.html