多通道語音增強算法研究
本文選題:麥克風陣列 + 卡爾曼濾波 ; 參考:《湖北工業(yè)大學》2017年碩士論文
【摘要】:在生活環(huán)境中,語音信息都會受到周圍噪聲的干擾,從而影響許多語音設(shè)備的性能。麥克風陣列具有空間選擇特性與高信號增益特性,從而可以獲得更多的有效語音信息,這樣就可以把噪聲更好的從語音中分離出來。但是僅僅只用單一的麥克風陣列算法也難滿足要求,近年來,基于麥克風陣列的語音增強方法和其它算法相結(jié)合的方法己經(jīng)逐漸成為語音增強技術(shù)的研究熱點。本論文也著手研究基于麥克風陣列的結(jié)合算法的語音增強算法。主要工作如下:針對傳統(tǒng)的卡爾曼濾波中噪聲譜估計問題,提出一種基于能量直方圖噪聲功率譜估計的改進方法。其基本方法是基于過去功率譜值的直方圖來得到噪聲譜估計,即對新進的每一幀,首先在幾百毫秒的時間窗上構(gòu)建一個功率譜值的直方圖。利用直方圖中最大值所對應(yīng)的的功率值代替噪聲功率譜值。通過兩個仿真實驗來驗證算法的消噪性能。實驗一是最小統(tǒng)計跟蹤的噪聲譜估計算法與基于能量數(shù)量值的噪聲譜估計的改進算法的噪聲譜估計仿真。仿真結(jié)果顯示改進的噪聲譜估計方法更接近真實的噪聲。實驗二是把改進噪聲譜估計算法引入到卡爾曼濾波中,對改進的卡爾曼濾波算法濾波算法進行仿真驗證。仿真圖顯示信號的語音成分保留下來,沒有造成語音過估計。但改進的卡爾曼濾波的還是存留較多的背景噪聲,這是因為單一通道的語音增強算法并不能滿足要求,需要利用多麥克風陣列獲得更多的語音信息完成去噪。針對改進的卡爾曼濾波存在的問題,以及傳統(tǒng)麥克風陣列語音增強算法存在的不足,本文提出了將改進的卡爾曼濾波與廣義旁瓣相消器相結(jié)合的方法。利用改進卡爾曼濾波作為后置濾波,克服了GSC對非相干噪聲的抑制不明顯以及殘留較多的噪聲的缺點。通過仿真實驗比較幾種算法,結(jié)果顯示相對于傳統(tǒng)的GSC自適應(yīng)算法和后置濾波算法,改進算法濾波后的背景噪聲更小,具有更高的輸出信噪比。同時采取主觀和客觀的評價機制對幾種算法進行比較,都證明了基于GSC結(jié)構(gòu)的改進算法的消噪性能更好。
[Abstract]:In the living environment, the speech information will be disturbed by the surrounding noise, which will affect the performance of many speech devices. The microphone array has the characteristics of spatial selection and high signal gain, so that more effective speech information can be obtained, and the noise can be better separated from the speech. However, only a single microphone array algorithm is difficult to meet the requirements. In recent years, speech enhancement methods based on microphone array and other algorithms have gradually become the focus of research on speech enhancement technology. This thesis also studies the speech enhancement algorithm based on microphone array. The main work is as follows: aiming at the problem of noise spectrum estimation in traditional Kalman filtering, an improved method based on energy histogram noise power spectrum estimation is proposed. The basic method is to estimate the noise spectrum based on the histogram of the past power spectrum, that is, to construct a histogram of the power spectrum at the time window of several hundred milliseconds for every new frame. The noise power spectrum is replaced by the power value corresponding to the maximum value in the histogram. Two simulation experiments are carried out to verify the performance of the algorithm. The first experiment is the simulation of the noise spectrum estimation algorithm based on the minimum statistical tracking and the improved noise spectrum estimation algorithm based on the energy quantity. Simulation results show that the improved noise spectrum estimation method is closer to the real noise. In the second experiment, the improved noise spectrum estimation algorithm is introduced into the Kalman filter, and the improved Kalman filtering algorithm is simulated and verified. The simulation diagram shows that the speech component of the signal is preserved, and the speech is not overestimated. But the improved Kalman filter still has more background noise, which is because the single channel speech enhancement algorithm can not meet the requirements, and needs to use multi-microphone array to obtain more speech information to complete the de-noising. Aiming at the problems of the improved Kalman filter and the shortcomings of the traditional microphone array speech enhancement algorithm, this paper proposes a method to combine the improved Kalman filter with the generalized sidelobe canceller. The improved Kalman filter is used as the post-filter to overcome the shortcomings of the GSC in suppressing incoherent noise which is not obvious and that there is more residual noise. The simulation results show that compared with the traditional GSC adaptive algorithm and post-filtering algorithm, the improved algorithm has less background noise and higher output signal-to-noise ratio than the traditional GSC adaptive algorithm and post-filter algorithm. At the same time, the subjective and objective evaluation mechanisms are used to compare several algorithms. It is proved that the improved algorithm based on GSC structure has better performance in noise reduction.
【學位授予單位】:湖北工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TN912.35
【相似文獻】
相關(guān)期刊論文 前10條
1 李倩,王讓定,陳金兒;基于改進閾值的小波域語音增強算法[J];寧波大學學報(理工版);2005年03期
2 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語音增強算法[J];上海交通大學學報;2000年07期
3 姚峰英,張敏;用于語音增強的高頻信噪比度量[J];聲學學報;2002年05期
4 彭煊,劉金福,王炳錫;基于獨立分量分析的語音增強[J];信號處理;2002年05期
5 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語音增強方法[J];解放軍理工大學學報(自然科學版);2003年01期
6 楊匯軍,鄭海英,王立紅;語音增強方法的研究[J];遼寧工學院學報;2003年05期
7 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強新算法[J];傳感技術(shù)學報;2004年01期
8 孫新德;一種改進的語音增強方法及實現(xiàn)[J];鄭州航空工業(yè)管理學院學報(社會科學版);2005年04期
9 錢國青;趙鶴鳴;;基于改進譜減算法的語音增強新方法[J];計算機工程與應(yīng)用;2005年35期
10 王晶,傅豐林,張運偉;語音增強算法綜述[J];聲學與電子工程;2005年01期
相關(guān)會議論文 前10條
1 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學術(shù)會議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語音增強及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學術(shù)會議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語音增強方法[A];第十四屆全國信號處理學術(shù)年會(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國慶;;諧波能量匯集度在語音增強中的應(yīng)用[A];第六屆全國信息獲取與處理學術(shù)會議論文集(2)[C];2008年
5 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學學會2003年青年學術(shù)會議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學學會2005年青年學術(shù)會議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強;覃團發(fā);萬海斌;;語音增強算法的研究[A];2005通信理論與技術(shù)新進展——第十屆全國青年通信學術(shù)會議論文集[C];2005年
9 魏臻;張景達;陸陽;;嵌入式系統(tǒng)中語音增強改進算法的研究[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語音增強方法[A];2007北京地區(qū)高校研究生學術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
相關(guān)博士學位論文 前10條
1 張龍;有監(jiān)督學習條件下的單通道語音增強算法研究[D];中國科學技術(shù)大學;2017年
2 歐世峰;變換域語音增強算法的研究[D];吉林大學;2008年
3 尹偉;基于模型的語音增強方法及質(zhì)量評估研究[D];武漢大學;2009年
4 王海艷;基于統(tǒng)計模型的語音增強算法研究[D];吉林大學;2011年
5 方瑜;語音增強相關(guān)問題研究[D];北京郵電大學;2012年
6 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學院上海冶金研究所;2001年
7 夏丙寅;面向移動通信的單通道語音增強方法研究[D];北京工業(yè)大學;2014年
8 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語音增強方法研究[D];中國科學技術(shù)大學;2015年
9 陶智;低信噪比環(huán)境下語音增強的研究[D];蘇州大學;2011年
10 王娜;基于小波變換與約束方差噪聲譜估計的語音增強算法研究[D];燕山大學;2011年
相關(guān)碩士學位論文 前10條
1 肖佩霖;雙通道語音增強系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學;2011年
2 陳成斌;針對于家居環(huán)境的語音增強系統(tǒng)的研究與開發(fā)[D];華南理工大學;2015年
3 魏有權(quán);基于噪聲估計的語音增強算法研究[D];昆明理工大學;2015年
4 胡勇;麥克風陣列語音增強算法研究[D];電子科技大學;2014年
5 曹后斌;有色背景噪聲環(huán)境下語音增強系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學;2014年
6 馬小惠;陣列語音增強在車載環(huán)境中的應(yīng)用[D];大連理工大學;2015年
7 李達;無線聲學傳感器網(wǎng)絡(luò)中分布式語音增強方法研究[D];大連理工大學;2015年
8 高珍珍;基于梅爾頻譜域HMM的語音增強方法研究[D];北京工業(yè)大學;2015年
9 宋環(huán)宇;全數(shù)字助聽器語音增強算法研究[D];哈爾濱工業(yè)大學;2014年
10 王永杰;基于麥克風陣列的語音增強算法研究[D];西安電子科技大學;2014年
,本文編號:2004218
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2004218.html