基于計算聽覺場景分析的混合語音分離
[Abstract]:Speech separation technology based on computational auditory scene analysis has been widely used in artificial intelligence, machine perception and automatic speech separation, and has gradually become a hot research topic. Especially in noisy environment, speech signal separation is the most difficult. In this paper, based on the theory of computational auditory scene analysis, the mixed speech signal separation in noisy environment is studied. The existing problems of hybrid speech separation system using binaural time difference and binaural intensity difference as cues of speech separation are studied and improved deeply. Firstly, this paper proposes a separation algorithm which combines pitch periodicity with binaural time difference and binaural intensity difference, and designs a double masking model. The improved algorithm uses two kinds of speech separation cues to analyze and process the mixed speech signal from two different angles and realizes the pure separation of the target speech by double masking. Secondly, aiming at the problem of incomplete masking interference in the original system, this paper adds the pitch periodic feature as the separation method of speech separation clue, and designs a reasonable initial masking model. The noise and noise in the mixed speech are removed and combined with the subsequent secondary masking model to achieve a more comprehensive masking effect and a more thorough removal of the interference sound. Thirdly, aiming at the problem that the original system can not be separated accurately for a group of speech with relatively long time delay, this paper presents a method of mixed speech separation based on the features of binaural time difference and binaural intensity difference. The quadratic masking model is redefined and improved to make the separation target more clear and to separate any speech signal accurately. Finally, through a large number of experiments, the performance of the improved system is evaluated, and compared with the original speech separation system, it can obviously reflect the effectiveness and superiority of the improved system. The improved mixed speech separation system is effective for the separation of speech and noise, and the separation effect is also improved.
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.3
【相似文獻】
相關(guān)期刊論文 前10條
1 施劍;杜利民;;基于麥克陣列的實時盲語音分離系統(tǒng)[J];微計算機應(yīng)用;2008年05期
2 張磊;劉繼芳;項學(xué)智;;基于計算聽覺場景分析的混合語音分離[J];計算機工程;2010年14期
3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計算機應(yīng)用研究;2010年11期
4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年01期
5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年02期
6 張雪峰,劉建強,馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號處理;2005年05期
7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應(yīng)語音分離方法的研究[J];聲學(xué)學(xué)報;2006年03期
8 董優(yōu)麗;謝勤嵐;;不確定信號源個數(shù)的語音分離[J];現(xiàn)代電子技術(shù);2008年03期
9 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識與技術(shù);2012年03期
10 劉俊良;于鳳芹;;基于分離度變步長的自然梯度算法的語音分離[J];計算機工程與應(yīng)用;2013年21期
相關(guān)會議論文 前5條
1 史曉非;王憲峰;黃耀P;劉人杰;;一個推廣參數(shù)矢量算法在語音分離中的應(yīng)用[A];中國航海學(xué)會通信導(dǎo)航專業(yè)委員會2004學(xué)術(shù)年會論文集[C];2004年
2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進遺傳算法的混疊語音分離研究[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場定位及語音分離[A];第二屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2004年
4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術(shù)[A];2004年全國物理聲學(xué)會議論文集[C];2004年
5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對頻率線索和空間線索的線性整合[A];增強心理學(xué)服務(wù)社會的意識和功能——中國心理學(xué)會成立90周年紀(jì)念大會暨第十四屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2011年
相關(guān)博士學(xué)位論文 前2條
1 趙立恒;基于計算聽覺場景分析的單聲道語音分離研究[D];中國科學(xué)技術(shù)大學(xué);2012年
2 王雨;基于計算聽覺場景分析的單通道語音分離研究[D];華東理工大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 趙訓(xùn)川;基于計算聽覺場景分析和麥克風(fēng)陣列的語音分離的研究[D];燕山大學(xué);2015年
2 何求知;單通道語音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年
3 曹猛;基于計算聽覺場景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語音分離[D];太原理工大學(xué);2016年
4 李梟雄;基于雙耳空間信息的語音分離研究[D];東南大學(xué);2015年
5 王瑜;基于計算聽覺場景分析的三通道語音分離研究[D];燕山大學(xué);2016年
6 王菁;基于計算聽覺場景分析的混合語音分離[D];燕山大學(xué);2016年
7 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年
8 童開國;多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學(xué);2012年
9 陳雪勤;基于計算聲場景分析的混疊語音分離研究[D];蘇州大學(xué);2002年
10 丁文;非負(fù)矩陣的分解及其在單聲道語音分離中的應(yīng)用[D];南昌大學(xué);2014年
,本文編號:2416188
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2416188.html