天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于計算聽覺場景分析的混合語音分離

發(fā)布時間:2019-01-27 10:49
【摘要】:基于計算聽覺場景分析的語音分離技術(shù)在人工智能、機器感知和自動語音分離等領(lǐng)域有著非常廣泛的應(yīng)用,逐漸成為人們研究的熱點,尤其是噪聲環(huán)境下的語音信號分離最為困難。本文在基于計算聽覺場景分析的理論上,對噪聲環(huán)境下的混合語音信號分離進行了研究,主要針對原有的利用雙耳時間差和雙耳強度差作為語音分離線索的混合語音分離系統(tǒng)存在的問題進行了深入的研究與改進。首先,本文提出了一種將基音周期性特征與雙耳時間差和雙耳強度差特征相結(jié)合的分離算法,并設(shè)計了雙重掩蔽模型。改進后的算法利用了兩種語音分離線索,從兩個不同的角度對混合語音信號進行分析處理,并經(jīng)過雙重掩蔽來實現(xiàn)對目標(biāo)語音的純凈分離。其次,針對原有系統(tǒng)存在的掩蔽干擾聲音不徹底的問題,本文加入了以基音周期性特征作為語音分離線索的分離方法,同時設(shè)計出合理的初次掩蔽模型,將混合語音中的噪聲和雜音去除,并結(jié)合后續(xù)的二次掩蔽模型,達到了掩蔽更全面,去除干擾聲音更徹底的效果。再次,針對原有系統(tǒng)存在的對于相對時延較大的一路語音不能精確分離的問題,本文在基于雙耳時間差和雙耳強度差特征進行混合語音分離的部分,對二次掩蔽模型進行了重新的定義與改進,使系統(tǒng)分離目標(biāo)更加明確,能夠精確分離任意一路語音信號。最后,通過大量實驗對改進后的系統(tǒng)進行了性能評估,并且與原有語音分離系統(tǒng)進行了分析比較,能夠明顯的體現(xiàn)改進系統(tǒng)的有效性和優(yōu)越性。改進后的混合語音分離系統(tǒng)對語音與噪聲的分離、混疊語音的分離都是有效的,分離效果也有明顯提高。
[Abstract]:Speech separation technology based on computational auditory scene analysis has been widely used in artificial intelligence, machine perception and automatic speech separation, and has gradually become a hot research topic. Especially in noisy environment, speech signal separation is the most difficult. In this paper, based on the theory of computational auditory scene analysis, the mixed speech signal separation in noisy environment is studied. The existing problems of hybrid speech separation system using binaural time difference and binaural intensity difference as cues of speech separation are studied and improved deeply. Firstly, this paper proposes a separation algorithm which combines pitch periodicity with binaural time difference and binaural intensity difference, and designs a double masking model. The improved algorithm uses two kinds of speech separation cues to analyze and process the mixed speech signal from two different angles and realizes the pure separation of the target speech by double masking. Secondly, aiming at the problem of incomplete masking interference in the original system, this paper adds the pitch periodic feature as the separation method of speech separation clue, and designs a reasonable initial masking model. The noise and noise in the mixed speech are removed and combined with the subsequent secondary masking model to achieve a more comprehensive masking effect and a more thorough removal of the interference sound. Thirdly, aiming at the problem that the original system can not be separated accurately for a group of speech with relatively long time delay, this paper presents a method of mixed speech separation based on the features of binaural time difference and binaural intensity difference. The quadratic masking model is redefined and improved to make the separation target more clear and to separate any speech signal accurately. Finally, through a large number of experiments, the performance of the improved system is evaluated, and compared with the original speech separation system, it can obviously reflect the effectiveness and superiority of the improved system. The improved mixed speech separation system is effective for the separation of speech and noise, and the separation effect is also improved.
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.3

【相似文獻】

相關(guān)期刊論文 前10條

1 施劍;杜利民;;基于麥克陣列的實時盲語音分離系統(tǒng)[J];微計算機應(yīng)用;2008年05期

2 張磊;劉繼芳;項學(xué)智;;基于計算聽覺場景分析的混合語音分離[J];計算機工程;2010年14期

3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計算機應(yīng)用研究;2010年11期

4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年01期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年02期

6 張雪峰,劉建強,馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號處理;2005年05期

7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應(yīng)語音分離方法的研究[J];聲學(xué)學(xué)報;2006年03期

8 董優(yōu)麗;謝勤嵐;;不確定信號源個數(shù)的語音分離[J];現(xiàn)代電子技術(shù);2008年03期

9 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識與技術(shù);2012年03期

10 劉俊良;于鳳芹;;基于分離度變步長的自然梯度算法的語音分離[J];計算機工程與應(yīng)用;2013年21期

相關(guān)會議論文 前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個推廣參數(shù)矢量算法在語音分離中的應(yīng)用[A];中國航海學(xué)會通信導(dǎo)航專業(yè)委員會2004學(xué)術(shù)年會論文集[C];2004年

2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進遺傳算法的混疊語音分離研究[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場定位及語音分離[A];第二屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術(shù)[A];2004年全國物理聲學(xué)會議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對頻率線索和空間線索的線性整合[A];增強心理學(xué)服務(wù)社會的意識和功能——中國心理學(xué)會成立90周年紀(jì)念大會暨第十四屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2011年

相關(guān)博士學(xué)位論文 前2條

1 趙立恒;基于計算聽覺場景分析的單聲道語音分離研究[D];中國科學(xué)技術(shù)大學(xué);2012年

2 王雨;基于計算聽覺場景分析的單通道語音分離研究[D];華東理工大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 趙訓(xùn)川;基于計算聽覺場景分析和麥克風(fēng)陣列的語音分離的研究[D];燕山大學(xué);2015年

2 何求知;單通道語音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年

3 曹猛;基于計算聽覺場景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語音分離[D];太原理工大學(xué);2016年

4 李梟雄;基于雙耳空間信息的語音分離研究[D];東南大學(xué);2015年

5 王瑜;基于計算聽覺場景分析的三通道語音分離研究[D];燕山大學(xué);2016年

6 王菁;基于計算聽覺場景分析的混合語音分離[D];燕山大學(xué);2016年

7 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年

8 童開國;多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學(xué);2012年

9 陳雪勤;基于計算聲場景分析的混疊語音分離研究[D];蘇州大學(xué);2002年

10 丁文;非負(fù)矩陣的分解及其在單聲道語音分離中的應(yīng)用[D];南昌大學(xué);2014年

,

本文編號:2416188

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2416188.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c51ec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com