基于計(jì)算聽覺場(chǎng)景分析的混合語音分離

發(fā)布時(shí)間：2019-01-27 10:49

【摘要】：基于計(jì)算聽覺場(chǎng)景分析的語音分離技術(shù)在人工智能、機(jī)器感知和自動(dòng)語音分離等領(lǐng)域有著非常廣泛的應(yīng)用,逐漸成為人們研究的熱點(diǎn),尤其是噪聲環(huán)境下的語音信號(hào)分離最為困難。本文在基于計(jì)算聽覺場(chǎng)景分析的理論上,對(duì)噪聲環(huán)境下的混合語音信號(hào)分離進(jìn)行了研究,主要針對(duì)原有的利用雙耳時(shí)間差和雙耳強(qiáng)度差作為語音分離線索的混合語音分離系統(tǒng)存在的問題進(jìn)行了深入的研究與改進(jìn)。首先,本文提出了一種將基音周期性特征與雙耳時(shí)間差和雙耳強(qiáng)度差特征相結(jié)合的分離算法,并設(shè)計(jì)了雙重掩蔽模型。改進(jìn)后的算法利用了兩種語音分離線索,從兩個(gè)不同的角度對(duì)混合語音信號(hào)進(jìn)行分析處理,并經(jīng)過雙重掩蔽來實(shí)現(xiàn)對(duì)目標(biāo)語音的純凈分離。其次,針對(duì)原有系統(tǒng)存在的掩蔽干擾聲音不徹底的問題,本文加入了以基音周期性特征作為語音分離線索的分離方法,同時(shí)設(shè)計(jì)出合理的初次掩蔽模型,將混合語音中的噪聲和雜音去除,并結(jié)合后續(xù)的二次掩蔽模型,達(dá)到了掩蔽更全面,去除干擾聲音更徹底的效果。再次,針對(duì)原有系統(tǒng)存在的對(duì)于相對(duì)時(shí)延較大的一路語音不能精確分離的問題,本文在基于雙耳時(shí)間差和雙耳強(qiáng)度差特征進(jìn)行混合語音分離的部分,對(duì)二次掩蔽模型進(jìn)行了重新的定義與改進(jìn),使系統(tǒng)分離目標(biāo)更加明確,能夠精確分離任意一路語音信號(hào)。最后,通過大量實(shí)驗(yàn)對(duì)改進(jìn)后的系統(tǒng)進(jìn)行了性能評(píng)估,并且與原有語音分離系統(tǒng)進(jìn)行了分析比較,能夠明顯的體現(xiàn)改進(jìn)系統(tǒng)的有效性和優(yōu)越性。改進(jìn)后的混合語音分離系統(tǒng)對(duì)語音與噪聲的分離、混疊語音的分離都是有效的,分離效果也有明顯提高。
[Abstract]:Speech separation technology based on computational auditory scene analysis has been widely used in artificial intelligence, machine perception and automatic speech separation, and has gradually become a hot research topic. Especially in noisy environment, speech signal separation is the most difficult. In this paper, based on the theory of computational auditory scene analysis, the mixed speech signal separation in noisy environment is studied. The existing problems of hybrid speech separation system using binaural time difference and binaural intensity difference as cues of speech separation are studied and improved deeply. Firstly, this paper proposes a separation algorithm which combines pitch periodicity with binaural time difference and binaural intensity difference, and designs a double masking model. The improved algorithm uses two kinds of speech separation cues to analyze and process the mixed speech signal from two different angles and realizes the pure separation of the target speech by double masking. Secondly, aiming at the problem of incomplete masking interference in the original system, this paper adds the pitch periodic feature as the separation method of speech separation clue, and designs a reasonable initial masking model. The noise and noise in the mixed speech are removed and combined with the subsequent secondary masking model to achieve a more comprehensive masking effect and a more thorough removal of the interference sound. Thirdly, aiming at the problem that the original system can not be separated accurately for a group of speech with relatively long time delay, this paper presents a method of mixed speech separation based on the features of binaural time difference and binaural intensity difference. The quadratic masking model is redefined and improved to make the separation target more clear and to separate any speech signal accurately. Finally, through a large number of experiments, the performance of the improved system is evaluated, and compared with the original speech separation system, it can obviously reflect the effectiveness and superiority of the improved system. The improved mixed speech separation system is effective for the separation of speech and noise, and the separation effect is also improved.
【學(xué)位授予單位】：燕山大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2016
【分類號(hào)】：TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 施劍;杜利民;;基于麥克陣列的實(shí)時(shí)盲語音分離系統(tǒng)[J];微計(jì)算機(jī)應(yīng)用;2008年05期

2 張磊;劉繼芳;項(xiàng)學(xué)智;;基于計(jì)算聽覺場(chǎng)景分析的混合語音分離[J];計(jì)算機(jī)工程;2010年14期

3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計(jì)算機(jī)應(yīng)用研究;2010年11期

4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語音分離[J];上海交通大學(xué)學(xué)報(bào);2000年01期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語音分離[J];上海交通大學(xué)學(xué)報(bào);2000年02期

6 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號(hào)處理;2005年05期

7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測(cè)的自適應(yīng)語音分離方法的研究[J];聲學(xué)學(xué)報(bào);2006年03期

8 董優(yōu)麗;謝勤嵐;;不確定信號(hào)源個(gè)數(shù)的語音分離[J];現(xiàn)代電子技術(shù);2008年03期

9 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識(shí)與技術(shù);2012年03期

10 劉俊良;于鳳芹;;基于分離度變步長(zhǎng)的自然梯度算法的語音分離[J];計(jì)算機(jī)工程與應(yīng)用;2013年21期

相關(guān)會(huì)議論文前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個(gè)推廣參數(shù)矢量算法在語音分離中的應(yīng)用[A];中國(guó)航海學(xué)會(huì)通信導(dǎo)航專業(yè)委員會(huì)2004學(xué)術(shù)年會(huì)論文集[C];2004年

2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進(jìn)遺傳算法的混疊語音分離研究[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)（CCSP-2001）論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場(chǎng)定位及語音分離[A];第二屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術(shù)[A];2004年全國(guó)物理聲學(xué)會(huì)議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對(duì)頻率線索和空間線索的線性整合[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識(shí)和功能——中國(guó)心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年

相關(guān)博士學(xué)位論文前2條

1 趙立恒;基于計(jì)算聽覺場(chǎng)景分析的單聲道語音分離研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

2 王雨;基于計(jì)算聽覺場(chǎng)景分析的單通道語音分離研究[D];華東理工大學(xué);2013年

相關(guān)碩士學(xué)位論文前10條

1 趙訓(xùn)川;基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語音分離的研究[D];燕山大學(xué);2015年

2 何求知;單通道語音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年

3 曹猛;基于計(jì)算聽覺場(chǎng)景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語音分離[D];太原理工大學(xué);2016年

4 李梟雄;基于雙耳空間信息的語音分離研究[D];東南大學(xué);2015年

5 王瑜;基于計(jì)算聽覺場(chǎng)景分析的三通道語音分離研究[D];燕山大學(xué);2016年

6 王菁;基于計(jì)算聽覺場(chǎng)景分析的混合語音分離[D];燕山大學(xué);2016年

7 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年

8 童開國(guó);多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學(xué);2012年

9 陳雪勤;基于計(jì)算聲場(chǎng)景分析的混疊語音分離研究[D];蘇州大學(xué);2002年

10 丁文;非負(fù)矩陣的分解及其在單聲道語音分離中的應(yīng)用[D];南昌大學(xué);2014年

，

本文編號(hào)：2416188

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/2416188.html

上一篇：基于多普勒頻率差的拖曳式誘餌干擾檢測(cè)
下一篇：基于協(xié)同過濾的無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)定位算法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于計(jì)算聽覺場(chǎng)景分析的混合語音分離