混響環(huán)境下的遠(yuǎn)程語音增強(qiáng)方法研究

發(fā)布時間：2020-04-15 08:00

【摘要】：語音是人與人溝通、人機(jī)交互的重要手段之一。在室內(nèi)環(huán)境中除了噪聲,由四壁和上下表面反射引起的混響是造成語音質(zhì)量和可懂度下降的主要原因。期望信號與室內(nèi)聲學(xué)脈沖響應(yīng)進(jìn)行卷積,麥克風(fēng)接收的信號為直達(dá)信號與混響成分的疊加�；祉懺跁r頻域引起的拖尾,往往導(dǎo)致語音信號的包絡(luò)和精細(xì)結(jié)構(gòu)產(chǎn)生失真。同時噪聲和潛在干擾的存在,以及語音自身的非平穩(wěn)性使得室內(nèi)語音增強(qiáng)問題更為復(fù)雜。本文將對室內(nèi)環(huán)境下,麥克風(fēng)采集的遠(yuǎn)程語音信號增強(qiáng)方法展開研究�？紤]固定波束形成尤其是差分波束形成在室內(nèi)時變聲學(xué)環(huán)境中的局限性,在自適應(yīng)波束形成的基礎(chǔ)上,本文提出了基于傳遞函數(shù)廣義旁瓣抵消器(Transfer Function-Generalized Sidelobe Canceller,TF-GSC)和改進(jìn)極小值控制遞歸平均(Improved Minima Controlled Re-cursive Averaging,IMCRA)的遠(yuǎn)程語音增強(qiáng)框架,利用空-時聯(lián)合處理方法對混響語音進(jìn)行去混響和消噪,同時保證去混響方法在噪聲存在下的穩(wěn)健性。不以聲源空間位置和聲學(xué)傳遞函數(shù)信息為先驗,本文將TF-GSC結(jié)構(gòu)替換為多通道線性預(yù)測(Multichannel Linear Prediction,MCLP)盲去混響框架,介紹了最小絕對值和方法、基于組稀疏性假設(shè)的最小絕對值收縮和選擇(Least Absolute Shrinkage and Selection Operator,LASSO)方法和基于最大化對數(shù)似然函數(shù)的歸一化延遲線性預(yù)測方法。本文將IMCRA作為以上盲去混響方法的后置濾波器,討論了非相干噪聲對GSC和MCLP語音增強(qiáng)框架的影響。仿真和實(shí)驗說明在混響占主導(dǎo)的室內(nèi)環(huán)境下,多通道線性預(yù)測框架的語音增強(qiáng)性能優(yōu)于GSC框架,后置濾波為兩種語音增強(qiáng)框架的必要補(bǔ)充。本文設(shè)計搭建了一套多通道遠(yuǎn)程語音采集處理系統(tǒng),實(shí)現(xiàn)實(shí)時語音數(shù)據(jù)的采集、處理和發(fā)送,同時以實(shí)錄數(shù)據(jù)驗證基于GSC和MCLP框架的遠(yuǎn)程語音增強(qiáng)方法的有效性。
【圖文】：

流程圖,語音處理,流程,語音增強(qiáng)

時保證算法穩(wěn)健性。Ｋｉｎｏｓｈｉｔａ等人［８］從提交至ＲＥＶＥＲＢ邋Ｃｈａｌｌｅｎｇｅ的近三十篇文獻(xiàn)中，，遴選逡逑出各類針對混響環(huán)境的語音增強(qiáng)識別算法，給出了由這些方法子集組成的混響語音處理流逡逑程，如圖１邋－１所示。其中語音增強(qiáng)部分（Ｅｎｈａｎｃｅｍｅｎｔ邋Ｐａｒｔ）作為識別部分（Ｒｅｃｏｇｎｉｔｉｏｎ邋Ｐａｒｔ）逡逑的必要前級模塊，包含多通道的語音增強(qiáng)和單通道語音增強(qiáng)／特征提取的子模塊。ＲＥＶＥＲＢ逡逑Ｃｈａｌｌｅｎｇｅ提供純凈語音集和仿真數(shù)據(jù)集作為訓(xùn)練集，同時給出仿真和實(shí)錄數(shù)據(jù)集作為各類逡逑語音增強(qiáng)算法的驗證集。從圖１－１中可以看到，語音增強(qiáng)部分的輸出作為識別模塊的前級，逡逑Ｅｎｈａｎｃｅｍｅｎｔ邋ｐａｒｔ邐Ｒｅｃｏｇｎｉｔｉｏｎ邋ｐａｒｔ逡逑邐Ａ邐邋邐Ａ邐逡逑（邋＼（邋＼逡逑＾邐Ｉ邋ｉ邐Ｉ邋ｉ邐Ｉ邋ｉ邐Ｉ邋邐逡逑ｒ邋Ｍｕｌｔｉ－ｃｈａｎｎｅｌ邋ｌｃｈＳＥ／ＦＥ．＾邋Ｒｏｂｕｓｔ邋ｆｅａｔｕｒｅ邋＾邐＾邋ｃ0ｍｂｉｎａｔ，0ｎ邋ｆ逡逑ＳＥ邐ｅｘｔｒａｃｔｉｏｎ邐３邐／逡逑＾＾邋＾，逡逑ＡＭ邋ＬＭ邐／逡逑Ｓ邋／逡逑Ａｄａｐｔ邐Ｉ逡逑ＬＺ邐／逡逑圖１－１邋ＲＥＶＥＲＢ邋Ｃｈａｌｌｅｎｇｅ去混響語音處理流程逡逑其性能的優(yōu)劣直接影響后級中的穩(wěn)健語音特征提取、譯碼模塊以及最終的識別結(jié)果。因此，逡逑２逡逑

均勻分布,室內(nèi)聲學(xué),常見方法,建模

．１邋愿邐（２－１７）逡逑由于室內(nèi)混響的復(fù)雜本質(zhì)，對室內(nèi)b8學(xué)的分析和合成需要不同的模型。圖２－１給出了建模逡逑和仿真室內(nèi)聲學(xué)的常見方法，圖內(nèi)所示的建模方法可以劃分為：波動（Ｗａｖｅ－ｂａｓｅｄ）模型、逡逑射線（Ｒａｙ－ｂａｓｅｄ）模型和統(tǒng)計模型，聯(lián)合以上模型能夠?qū)θJ譜（Ａｕｄｉｏ邋Ｓｐｅｃｔｒｕｍ）進(jìn)行分逡逑析。然而對于語音信號的有限帶寬性，準(zhǔn)確而又簡單的模型更為適用。逡逑２．３統(tǒng)計混響棋型逡逑在室內(nèi)環(huán)境中對聲學(xué)過程建模是一ａ極其復(fù)雜的過程，常用的方法為統(tǒng)計室內(nèi)聲學(xué)逡逑（ＳＲＡ）。ＳＲＡ利用房間體積！／、混響時間ｒ６ｎ、臨界距離Ｄｃ、聲源－麥克風(fēng)距離等一系列參數(shù)逡逑紿出對聲學(xué)系統(tǒng)傳遞函數(shù)的統(tǒng)計描述。為了描述單夂平面波的福度和相位分布，ＳＲＡ基于逡逑的重要假設(shè)可以歸結(jié)為：在室內(nèi)任意一點(diǎn)產(chǎn)生的聲壓近似隨機(jī)，因此聲場均勻分布在整ａ逡逑１２逡逑
【學(xué)位授予單位】：浙江大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2019
【分類號】：TN912.35

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 劉鵬;;基于深度學(xué)習(xí)的語音增強(qiáng)方法研究[J];智能計算機(jī)與應(yīng)用;2019年05期

2 石玲;;基于計算機(jī)聲卡的譜相減語音增強(qiáng)系統(tǒng)分析[J];信息與電腦(理論版);2010年02期

3 孫濤;;基于計算機(jī)聲卡的譜相減語音增強(qiáng)系統(tǒng)分析[J];南昌教育學(xué)院學(xué)報;2010年05期

4 張曉雷;;基于深度學(xué)習(xí)的語音增強(qiáng)簡述[J];網(wǎng)絡(luò)新媒體技術(shù);2019年02期

5 李璐君;屈丹;;一種基于組合深層模型的語音增強(qiáng)方法[J];信息工程大學(xué)學(xué)報;2018年04期

6 袁文浩;婁迎曦;梁春燕;夏斌;;利用生成噪聲提高語音增強(qiáng)方法的泛化能力[J];電子學(xué)報;2019年04期

7 陰法明;唐於烽;;基于深度置信網(wǎng)絡(luò)的語音增強(qiáng)算法[J];電子器件;2018年05期

8 余華;唐於烽;趙力;;基于改進(jìn)深度置信網(wǎng)絡(luò)的語音增強(qiáng)算法[J];數(shù)據(jù)采集與處理;2018年05期

9 薛慧君;李盛;路國華;張楊;焦騰;王健琪;荊西京;;提升小波用于非接觸語音增強(qiáng)算法的研究[J];醫(yī)療衛(wèi)生裝備;2013年05期

10 胡海波;劉柏森;許銀;;基于小波變換的語音增強(qiáng)研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2011年01期

相關(guān)會議論文前10條

1 王世偉;胡笑滸;鄭成詩;李曉東;;一種改進(jìn)的基于能量差語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2011年

2 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會2003年青年學(xué)術(shù)會議[CYCA'03]論文集[C];2003年

3 閻兆立;杜利民;;維納后濾波語音增強(qiáng)算法研究[A];中國聲學(xué)學(xué)會2005年青年學(xué)術(shù)會議[CYCA'05]論文集[C];2005年

4 童峰;許肖梅;洪青陽;;一種帶階數(shù)估計的語音增強(qiáng)算法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年

5 袁榕嶸;吳鳴;楊軍;;雙麥克風(fēng)語音增強(qiáng)快速算法[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年

6 國雁萌;;一種極低信噪比條件下的語音增強(qiáng)方法[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

7 李海峰;韓紀(jì)慶;鄭鐵然;;元音、輔音粗判自適應(yīng)電話語音增強(qiáng)方法[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議（NCMMSC7）論文集[C];2003年

8 高登峰;楊波;郭東岳;;基于深度神經(jīng)網(wǎng)絡(luò)的地空通話語音增強(qiáng)方法[A];第一屆空中交通管理系統(tǒng)技術(shù)學(xué)術(shù)年會論文集[C];2018年

9 樓廈廈;鄭成詩;李曉東;;濾波器權(quán)值約束對自適應(yīng)零限波束形成語音增強(qiáng)算法魯棒性影響分析[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集（上）[C];2007年

10 任玉寶;;基于聯(lián)合字典學(xué)習(xí)的語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會水聲學(xué)分會2019年學(xué)術(shù)會議論文集[C];2019年

相關(guān)重要報紙文章前3條

1 ;NMS Sonata Ⅲ/Studio Sound級語音增強(qiáng)系統(tǒng)話音更清晰[N];中國計算機(jī)報;2003年

2 本報記者馬楠;NMS市場目標(biāo)轉(zhuǎn)向無線服務(wù)提供商[N];通信產(chǎn)業(yè)報;2001年

3 ;VoIP服務(wù)不只是便宜的通話[N];網(wǎng)絡(luò)世界;2002年

相關(guān)博士學(xué)位論文前10條

1 江文斌;面向復(fù)雜場景的極低碼率語音編解碼和語音增強(qiáng)關(guān)鍵技術(shù)研究[D];上海交通大學(xué);2018年

2 高天;復(fù)雜環(huán)境下基于深度學(xué)習(xí)的語音信號預(yù)處理方法研究[D];中國科學(xué)技術(shù)大學(xué);2018年

3 童仁杰;基于信號稀疏特性的語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2018年

4 王青;基于深層神經(jīng)網(wǎng)絡(luò)的多目標(biāo)學(xué)習(xí)和融合的語音增強(qiáng)研究[D];中國科學(xué)技術(shù)大學(xué);2018年

5 王冬霞;麥克風(fēng)陣列語音增強(qiáng)的若干方法研究[D];大連理工大學(xué);2007年

6 歐世峰;變換域語音增強(qiáng)算法的研究[D];吉林大學(xué);2008年

7 孫琦;基于子空間的低計算復(fù)雜度語音增強(qiáng)算法研究[D];吉林大學(xué);2017年

8 夏丙寅;面向移動通信的單通道語音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年

9 姚峰英;語音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國科學(xué)院上海冶金研究所;2001年

10 張龍;有監(jiān)督學(xué)習(xí)條件下的單通道語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2017年

相關(guān)碩士學(xué)位論文前10條

1 許瑞龍;基于自動編碼器和生成對抗網(wǎng)絡(luò)的語音增強(qiáng)方法研究[D];江西理工大學(xué);2019年

2 續(xù)嬌;基于自適應(yīng)波束成形的語音增強(qiáng)算法研究與實(shí)現(xiàn)[D];北京交通大學(xué);2019年

3 程澤豐;混響環(huán)境下的遠(yuǎn)程語音增強(qiáng)方法研究[D];浙江大學(xué);2019年

4 黃張翼;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法研究[D];重慶郵電大學(xué);2018年

5 吳佳雯;基于表示學(xué)習(xí)的語音增強(qiáng)算法研究[D];廈門大學(xué);2017年

6 曾帆;遠(yuǎn)距離麥克風(fēng)陣列語音增強(qiáng)及系統(tǒng)實(shí)現(xiàn)[D];廈門大學(xué);2018年

7 許銘;車載環(huán)境下語音處理關(guān)鍵技術(shù)的研究[D];遼寧工業(yè)大學(xué);2019年

8 賈翔宇;基于張量模型的語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2019年

9 吉慧芳;改進(jìn)相位譜信息及相位重構(gòu)的語音增強(qiáng)算法研究[D];太原理工大學(xué);2019年

10 王雁;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法[D];太原理工大學(xué);2019年

本文編號：2628325

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/2628325.html

上一篇：大流量下吉林市聯(lián)通EPC核心網(wǎng)網(wǎng)絡(luò)改造
下一篇：北斗三號B1C信號模擬產(chǎn)生與性能分析

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

混響環(huán)境下的遠(yuǎn)程語音增強(qiáng)方法研究