基于單信道的語音增強(qiáng)算法的研究與改進(jìn)
本文選題:語音增強(qiáng) 切入點:譜減法 出處:《廣東工業(yè)大學(xué)》2016年碩士論文
【摘要】:在語音通信中經(jīng)常受到各種各樣噪聲的干擾,噪聲干擾嚴(yán)重時還可能會使人聽覺疲勞或者使語音處理系統(tǒng)性能惡化。為了能夠從含有各類噪聲的語音信號中盡可能恢復(fù)出原始的語音信號,需要使用語音增強(qiáng)技術(shù)來抑制或者降低噪聲,提高語音信號的質(zhì)量和可懂度。語音增強(qiáng)按信號獲取方式的不同,可以分為單信道、雙信道和多信道。目前大多數(shù)實際應(yīng)用的語音信號處理系統(tǒng)多數(shù)都還是單信道下工作的,而且由于單信道的語音增強(qiáng)獲取得到的信息更少,難度要超過雙信道和多信道語音增強(qiáng)。因此,非常有必要對基于單信道的語音增強(qiáng)進(jìn)行研究和嘗試改進(jìn)。鑒于以上分析,本論文的研究工作主要從如下三個方面進(jìn)行:1、實際應(yīng)用環(huán)境中噪聲利,類多樣化,不同的噪聲都有著不一樣的特性,所以在實際應(yīng)用中要根據(jù)具體的噪聲情況選用不同的語音增強(qiáng)算法,才能達(dá)到最好的語音增強(qiáng)效果。為此,本文深入闡述了譜減算法、維納濾波算法和最小均方誤差算法的基本原理和實現(xiàn)過程。分別在高斯白噪聲、粉紅噪聲和多說話人babble噪聲下進(jìn)行大量測試。實驗結(jié)果顯示,三種算法在各種噪聲環(huán)境下均能提高語音的質(zhì)量,但是不一定都能夠提高語音的可懂度。2、對噪聲的估計在語音增強(qiáng)技術(shù)中至關(guān)重要,噪聲估計過低時會導(dǎo)致殘留較多的背景噪聲,而噪聲估計過高時會削弱掉微弱的語音信息,不準(zhǔn)確的估計最終都會導(dǎo)致語音失真。為此,本文研究了VAD噪聲估計算法和基于后驗信噪比的時間遞歸平均的噪聲估計算法。由于時間遞歸平均的算法中存在平滑因子階躍(0或者1)的現(xiàn)象,本文提出了一種改進(jìn)措施,改進(jìn)后保證了平滑因子取值比較合理。最后通過結(jié)果顯示,改進(jìn)的算法在低信噪比環(huán)境下有比較好的改善效果。3、譜減算法簡單高效,實時性很高,適用范圍比較廣泛,但是譜減算法的缺點是輸出均伴有起伏較大且刺耳的音樂噪聲。為了解決音樂噪聲,人們提出了很多的改進(jìn)措施。最常用的一種是在減法過程中增加一個或者多個修正系數(shù),以減少音樂噪聲的影響,但是修正系數(shù)需要根據(jù)實驗或者經(jīng)驗來確定,適應(yīng)性比較差。為此,本文研究了基于參數(shù)最優(yōu)控制的譜減算法,并且采用改進(jìn)的引導(dǎo)判決法來估計先驗信噪比,從而確定最優(yōu)的修正系數(shù)。實驗結(jié)果顯示,本文的改進(jìn)算法對語音的可懂度提高有限,但對語音質(zhì)量的改善效果明顯。
[Abstract]:In speech communication, it is often disturbed by various kinds of noise. Noise interference may also cause hearing fatigue or deterioration of speech processing system performance. In order to be able to recover the original speech signal as much as possible from the speech signal containing all kinds of noise, It is necessary to use speech enhancement technology to suppress or reduce noise and improve the quality and intelligibility of speech signal. At present, most of the speech signal processing systems used in practical applications are still working in single channel, and because of the speech enhancement of single channel, less information can be obtained. It is more difficult than dual-channel and multi-channel speech enhancement. Therefore, it is necessary to study and try to improve the speech enhancement based on single channel. The research work of this paper is mainly carried out in three aspects as follows: 1. In the practical application environment, noise is convenient, various kinds of noise, different noise have different characteristics. Therefore, different speech enhancement algorithms should be selected according to the specific noise in practical application to achieve the best speech enhancement effect. The basic principle and implementation process of Wiener filtering algorithm and minimum mean square error algorithm are tested under Gao Si white noise, pink noise and multi-speaker babble noise respectively. The experimental results show that, The three algorithms can improve the quality of speech in all kinds of noise environments, but not all of them can improve the intelligibility of speech. The estimation of noise is very important in speech enhancement technology. If the noise estimation is too low, it will lead to more background noise, and when the noise estimation is too high, the weak speech information will be weakened, and the inaccurate estimation will eventually lead to speech distortion. In this paper, VAD noise estimation algorithm and time recursive average noise estimation algorithm based on a posteriori signal-to-noise ratio (SNR) are studied. Due to the existence of smoothing factor step 0 or 1) in the time recursive averaging algorithm, an improved method is proposed in this paper. Finally, the result shows that the improved algorithm has better effect of improving in low signal-to-noise ratio environment. The spectral subtraction algorithm is simple and efficient, real-time is very high, and the range of application is wide. However, the disadvantage of spectral subtraction algorithm is that the output is accompanied by large and sharp music noise. In order to solve the music noise, many improvements have been put forward. One of the most commonly used methods is to add one or more correction coefficients in the process of subtraction. In order to reduce the influence of music noise, but the correction coefficient needs to be determined by experiment or experience, the adaptability is poor. Therefore, the spectral subtraction algorithm based on parameter optimal control is studied in this paper. The improved guide decision method is used to estimate the prior signal-to-noise ratio (SNR) and to determine the optimal correction coefficient. The experimental results show that the improved algorithm improves speech intelligibility limited but improves speech quality obviously.
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.35
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語音增強(qiáng)算法[J];上海交通大學(xué)學(xué)報;2000年07期
2 姚峰英,張敏;用于語音增強(qiáng)的高頻信噪比度量[J];聲學(xué)學(xué)報;2002年05期
3 彭煊,劉金福,王炳錫;基于獨立分量分析的語音增強(qiáng)[J];信號處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語音增強(qiáng)方法[J];解放軍理工大學(xué)學(xué)報(自然科學(xué)版);2003年01期
5 楊匯軍,鄭海英,王立紅;語音增強(qiáng)方法的研究[J];遼寧工學(xué)院學(xué)報;2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強(qiáng)新算法[J];傳感技術(shù)學(xué)報;2004年01期
7 孫新德;一種改進(jìn)的語音增強(qiáng)方法及實現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(社會科學(xué)版);2005年04期
8 錢國青;趙鶴鳴;;基于改進(jìn)譜減算法的語音增強(qiáng)新方法[J];計算機(jī)工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運(yùn)偉;語音增強(qiáng)算法綜述[J];聲學(xué)與電子工程;2005年01期
10 楊毅;楊宇;余達(dá)太;;語音增強(qiáng)及其消噪能力研究[J];微電子學(xué)與計算機(jī);2006年07期
相關(guān)會議論文 前10條
1 陳凱;俞蒙槐;胡上序;付強(qiáng);;語音增強(qiáng)系統(tǒng)性能評測方法綜述[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語音增強(qiáng)及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學(xué)術(shù)會議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語音增強(qiáng)方法[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國慶;;諧波能量匯集度在語音增強(qiáng)中的應(yīng)用[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
5 國雁萌;;一種極低信噪比條件下的語音增強(qiáng)方法[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強(qiáng)算法[A];中國聲學(xué)學(xué)會2003年青年學(xué)術(shù)會議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語音增強(qiáng)算法研究[A];中國聲學(xué)學(xué)會2005年青年學(xué)術(shù)會議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強(qiáng);覃團(tuán)發(fā);萬海斌;;語音增強(qiáng)算法的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國青年通信學(xué)術(shù)會議論文集[C];2005年
9 魏臻;張景達(dá);陸陽;;嵌入式系統(tǒng)中語音增強(qiáng)改進(jìn)算法的研究[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語音增強(qiáng)方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 歐世峰;變換域語音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
2 尹偉;基于模型的語音增強(qiáng)方法及質(zhì)量評估研究[D];武漢大學(xué);2009年
3 王海艷;基于統(tǒng)計模型的語音增強(qiáng)算法研究[D];吉林大學(xué);2011年
4 方瑜;語音增強(qiáng)相關(guān)問題研究[D];北京郵電大學(xué);2012年
5 姚峰英;語音增強(qiáng)系統(tǒng)的研究與實現(xiàn)[D];中國科學(xué)院上海冶金研究所;2001年
6 夏丙寅;面向移動通信的單通道語音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法研究[D];中國科學(xué)技術(shù)大學(xué);2015年
8 陶智;低信噪比環(huán)境下語音增強(qiáng)的研究[D];蘇州大學(xué);2011年
9 王娜;基于小波變換與約束方差噪聲譜估計的語音增強(qiáng)算法研究[D];燕山大學(xué);2011年
10 趙彥平;基于稀疏表示的語音增強(qiáng)方法研究[D];吉林大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 肖佩霖;雙通道語音增強(qiáng)系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 魏有權(quán);基于噪聲估計的語音增強(qiáng)算法研究[D];昆明理工大學(xué);2015年
3 郭栗;特定人語音增強(qiáng)算法的研究[D];上海交通大學(xué);2015年
4 紀(jì)志春;基于字典學(xué)習(xí)的語音增強(qiáng)算法研究[D];大連海事大學(xué);2016年
5 尹波;基于麥克風(fēng)小陣列的語音增強(qiáng)算法的研究[D];湖北工業(yè)大學(xué);2016年
6 張建偉;基于噪聲譜估計和信噪比約束的語音增強(qiáng)研究[D];安徽大學(xué);2016年
7 魏泉水;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法研究[D];南京大學(xué);2016年
8 王鵬宇;壓縮感知技術(shù)在語音增強(qiáng)和EEG信號中的應(yīng)用研究[D];福州大學(xué);2014年
9 魏清泉;有色噪聲下語音增強(qiáng)算法及應(yīng)用研究[D];福州大學(xué);2014年
10 黃劍文;多通道語音增強(qiáng)算法及應(yīng)用研究[D];福州大學(xué);2014年
,本文編號:1688067
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1688067.html