混響環(huán)境下的遠(yuǎn)程語(yǔ)音增強(qiáng)方法研究
【圖文】:
時(shí)保證算法穩(wěn)健性。Kinoshita等人[8]從提交至REVERB邋Challenge的近三十篇文獻(xiàn)中,,遴選逡逑出各類針對(duì)混響環(huán)境的語(yǔ)音增強(qiáng)識(shí)別算法,給出了由這些方法子集組成的混響語(yǔ)音處理流逡逑程,如圖1邋-1所示。其中語(yǔ)音增強(qiáng)部分(Enhancement邋Part)作為識(shí)別部分(Recognition邋Part)逡逑的必要前級(jí)模塊,包含多通道的語(yǔ)音增強(qiáng)和單通道語(yǔ)音增強(qiáng)/特征提取的子模塊。REVERB逡逑Challenge提供純凈語(yǔ)音集和仿真數(shù)據(jù)集作為訓(xùn)練集,同時(shí)給出仿真和實(shí)錄數(shù)據(jù)集作為各類逡逑語(yǔ)音增強(qiáng)算法的驗(yàn)證集。從圖1-1中可以看到,語(yǔ)音增強(qiáng)部分的輸出作為識(shí)別模塊的前級(jí),逡逑Enhancement邋part邐Recognition邋part逡逑邐A邐邋邐A邐逡逑(邋\(邋\逡逑^邐I邋i邐I邋i邐I邋i邐I邋邐逡逑r邋Multi-channel邋lchSE/FE.^邋Robust邋feature邋^邐^邋c0mbinat,0n邋f逡逑SE邐extraction邐3邐/逡逑^^邋^,逡逑AM邋LM邐/逡逑S邋/逡逑Adapt邐I逡逑LZ邐/逡逑圖1-1邋REVERB邋Challenge去混響語(yǔ)音處理流程逡逑其性能的優(yōu)劣直接影響后級(jí)中的穩(wěn)健語(yǔ)音特征提取、譯碼模塊以及最終的識(shí)別結(jié)果。因此,逡逑2逡逑
.1邋愿邐(2-17)逡逑由于室內(nèi)混響的復(fù)雜本質(zhì),對(duì)室內(nèi)b8學(xué)的分析和合成需要不同的模型。圖2-1給出了建模逡逑和仿真室內(nèi)聲學(xué)的常見方法,圖內(nèi)所示的建模方法可以劃分為:波動(dòng)(Wave-based)模型、逡逑射線(Ray-based)模型和統(tǒng)計(jì)模型,聯(lián)合以上模型能夠?qū)θJ譜(Audio邋Spectrum)進(jìn)行分逡逑析。然而對(duì)于語(yǔ)音信號(hào)的有限帶寬性,準(zhǔn)確而又簡(jiǎn)單的模型更為適用。逡逑2.3統(tǒng)計(jì)混響棋型逡逑在室內(nèi)環(huán)境中對(duì)聲學(xué)過(guò)程建模是一a極其復(fù)雜的過(guò)程,常用的方法為統(tǒng)計(jì)室內(nèi)聲學(xué)逡逑(SRA)。SRA利用房間體積!/、混響時(shí)間r6n、臨界距離Dc、聲源-麥克風(fēng)距離等一系列參數(shù)逡逑紿出對(duì)聲學(xué)系統(tǒng)傳遞函數(shù)的統(tǒng)計(jì)描述。為了描述單夂平面波的福度和相位分布,SRA基于逡逑的重要假設(shè)可以歸結(jié)為:在室內(nèi)任意一點(diǎn)產(chǎn)生的聲壓近似隨機(jī),因此聲場(chǎng)均勻分布在整a逡逑12逡逑
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TN912.35
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉鵬;;基于深度學(xué)習(xí)的語(yǔ)音增強(qiáng)方法研究[J];智能計(jì)算機(jī)與應(yīng)用;2019年05期
2 石玲;;基于計(jì)算機(jī)聲卡的譜相減語(yǔ)音增強(qiáng)系統(tǒng)分析[J];信息與電腦(理論版);2010年02期
3 孫濤;;基于計(jì)算機(jī)聲卡的譜相減語(yǔ)音增強(qiáng)系統(tǒng)分析[J];南昌教育學(xué)院學(xué)報(bào);2010年05期
4 張曉雷;;基于深度學(xué)習(xí)的語(yǔ)音增強(qiáng)簡(jiǎn)述[J];網(wǎng)絡(luò)新媒體技術(shù);2019年02期
5 李璐君;屈丹;;一種基于組合深層模型的語(yǔ)音增強(qiáng)方法[J];信息工程大學(xué)學(xué)報(bào);2018年04期
6 袁文浩;婁迎曦;梁春燕;夏斌;;利用生成噪聲提高語(yǔ)音增強(qiáng)方法的泛化能力[J];電子學(xué)報(bào);2019年04期
7 陰法明;唐於烽;;基于深度置信網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)算法[J];電子器件;2018年05期
8 余華;唐於烽;趙力;;基于改進(jìn)深度置信網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)算法[J];數(shù)據(jù)采集與處理;2018年05期
9 薛慧君;李盛;路國(guó)華;張楊;焦騰;王健琪;荊西京;;提升小波用于非接觸語(yǔ)音增強(qiáng)算法的研究[J];醫(yī)療衛(wèi)生裝備;2013年05期
10 胡海波;劉柏森;許銀;;基于小波變換的語(yǔ)音增強(qiáng)研究[J];黑龍江工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年01期
相關(guān)會(huì)議論文 前10條
1 王世偉;胡笑滸;鄭成詩(shī);李曉東;;一種改進(jìn)的基于能量差語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2011年
2 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
3 閻兆立;杜利民;;維納后濾波語(yǔ)音增強(qiáng)算法研究[A];中國(guó)聲學(xué)學(xué)會(huì)2005年青年學(xué)術(shù)會(huì)議[CYCA'05]論文集[C];2005年
4 童峰;許肖梅;洪青陽(yáng);;一種帶階數(shù)估計(jì)的語(yǔ)音增強(qiáng)算法[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
5 袁榕嶸;吳鳴;楊軍;;雙麥克風(fēng)語(yǔ)音增強(qiáng)快速算法[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
6 國(guó)雁萌;;一種極低信噪比條件下的語(yǔ)音增強(qiáng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
7 李海峰;韓紀(jì)慶;鄭鐵然;;元音、輔音粗判自適應(yīng)電話語(yǔ)音增強(qiáng)方法[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
8 高登峰;楊波;郭東岳;;基于深度神經(jīng)網(wǎng)絡(luò)的地空通話語(yǔ)音增強(qiáng)方法[A];第一屆空中交通管理系統(tǒng)技術(shù)學(xué)術(shù)年會(huì)論文集[C];2018年
9 樓廈廈;鄭成詩(shī);李曉東;;濾波器權(quán)值約束對(duì)自適應(yīng)零限波束形成語(yǔ)音增強(qiáng)算法魯棒性影響分析[A];中國(guó)聲學(xué)學(xué)會(huì)2007年青年學(xué)術(shù)會(huì)議論文集(上)[C];2007年
10 任玉寶;;基于聯(lián)合字典學(xué)習(xí)的語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)水聲學(xué)分會(huì)2019年學(xué)術(shù)會(huì)議論文集[C];2019年
相關(guān)重要報(bào)紙文章 前3條
1 ;NMS Sonata Ⅲ/Studio Sound級(jí)語(yǔ)音增強(qiáng)系統(tǒng)話音更清晰[N];中國(guó)計(jì)算機(jī)報(bào);2003年
2 本報(bào)記者 馬楠;NMS市場(chǎng)目標(biāo)轉(zhuǎn)向無(wú)線服務(wù)提供商[N];通信產(chǎn)業(yè)報(bào);2001年
3 ;VoIP服務(wù)不只是便宜的通話[N];網(wǎng)絡(luò)世界;2002年
相關(guān)博士學(xué)位論文 前10條
1 江文斌;面向復(fù)雜場(chǎng)景的極低碼率語(yǔ)音編解碼和語(yǔ)音增強(qiáng)關(guān)鍵技術(shù)研究[D];上海交通大學(xué);2018年
2 高天;復(fù)雜環(huán)境下基于深度學(xué)習(xí)的語(yǔ)音信號(hào)預(yù)處理方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年
3 童仁杰;基于信號(hào)稀疏特性的語(yǔ)音增強(qiáng)算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年
4 王青;基于深層神經(jīng)網(wǎng)絡(luò)的多目標(biāo)學(xué)習(xí)和融合的語(yǔ)音增強(qiáng)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年
5 王冬霞;麥克風(fēng)陣列語(yǔ)音增強(qiáng)的若干方法研究[D];大連理工大學(xué);2007年
6 歐世峰;變換域語(yǔ)音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
7 孫琦;基于子空間的低計(jì)算復(fù)雜度語(yǔ)音增強(qiáng)算法研究[D];吉林大學(xué);2017年
8 夏丙寅;面向移動(dòng)通信的單通道語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
9 姚峰英;語(yǔ)音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院上海冶金研究所;2001年
10 張龍;有監(jiān)督學(xué)習(xí)條件下的單通道語(yǔ)音增強(qiáng)算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 許瑞龍;基于自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D];江西理工大學(xué);2019年
2 續(xù)嬌;基于自適應(yīng)波束成形的語(yǔ)音增強(qiáng)算法研究與實(shí)現(xiàn)[D];北京交通大學(xué);2019年
3 程澤豐;混響環(huán)境下的遠(yuǎn)程語(yǔ)音增強(qiáng)方法研究[D];浙江大學(xué);2019年
4 黃張翼;基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D];重慶郵電大學(xué);2018年
5 吳佳雯;基于表示學(xué)習(xí)的語(yǔ)音增強(qiáng)算法研究[D];廈門大學(xué);2017年
6 曾帆;遠(yuǎn)距離麥克風(fēng)陣列語(yǔ)音增強(qiáng)及系統(tǒng)實(shí)現(xiàn)[D];廈門大學(xué);2018年
7 許銘;車載環(huán)境下語(yǔ)音處理關(guān)鍵技術(shù)的研究[D];遼寧工業(yè)大學(xué);2019年
8 賈翔宇;基于張量模型的語(yǔ)音增強(qiáng)算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2019年
9 吉慧芳;改進(jìn)相位譜信息及相位重構(gòu)的語(yǔ)音增強(qiáng)算法研究[D];太原理工大學(xué);2019年
10 王雁;基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)算法[D];太原理工大學(xué);2019年
本文編號(hào):2628325
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2628325.html