基于單信道的語(yǔ)音增強(qiáng)算法的研究與改進(jìn)
本文選題:語(yǔ)音增強(qiáng) 切入點(diǎn):譜減法 出處:《廣東工業(yè)大學(xué)》2016年碩士論文
【摘要】:在語(yǔ)音通信中經(jīng)常受到各種各樣噪聲的干擾,噪聲干擾嚴(yán)重時(shí)還可能會(huì)使人聽(tīng)覺(jué)疲勞或者使語(yǔ)音處理系統(tǒng)性能惡化。為了能夠從含有各類噪聲的語(yǔ)音信號(hào)中盡可能恢復(fù)出原始的語(yǔ)音信號(hào),需要使用語(yǔ)音增強(qiáng)技術(shù)來(lái)抑制或者降低噪聲,提高語(yǔ)音信號(hào)的質(zhì)量和可懂度。語(yǔ)音增強(qiáng)按信號(hào)獲取方式的不同,可以分為單信道、雙信道和多信道。目前大多數(shù)實(shí)際應(yīng)用的語(yǔ)音信號(hào)處理系統(tǒng)多數(shù)都還是單信道下工作的,而且由于單信道的語(yǔ)音增強(qiáng)獲取得到的信息更少,難度要超過(guò)雙信道和多信道語(yǔ)音增強(qiáng)。因此,非常有必要對(duì)基于單信道的語(yǔ)音增強(qiáng)進(jìn)行研究和嘗試改進(jìn)。鑒于以上分析,本論文的研究工作主要從如下三個(gè)方面進(jìn)行:1、實(shí)際應(yīng)用環(huán)境中噪聲利,類多樣化,不同的噪聲都有著不一樣的特性,所以在實(shí)際應(yīng)用中要根據(jù)具體的噪聲情況選用不同的語(yǔ)音增強(qiáng)算法,才能達(dá)到最好的語(yǔ)音增強(qiáng)效果。為此,本文深入闡述了譜減算法、維納濾波算法和最小均方誤差算法的基本原理和實(shí)現(xiàn)過(guò)程。分別在高斯白噪聲、粉紅噪聲和多說(shuō)話人babble噪聲下進(jìn)行大量測(cè)試。實(shí)驗(yàn)結(jié)果顯示,三種算法在各種噪聲環(huán)境下均能提高語(yǔ)音的質(zhì)量,但是不一定都能夠提高語(yǔ)音的可懂度。2、對(duì)噪聲的估計(jì)在語(yǔ)音增強(qiáng)技術(shù)中至關(guān)重要,噪聲估計(jì)過(guò)低時(shí)會(huì)導(dǎo)致殘留較多的背景噪聲,而噪聲估計(jì)過(guò)高時(shí)會(huì)削弱掉微弱的語(yǔ)音信息,不準(zhǔn)確的估計(jì)最終都會(huì)導(dǎo)致語(yǔ)音失真。為此,本文研究了VAD噪聲估計(jì)算法和基于后驗(yàn)信噪比的時(shí)間遞歸平均的噪聲估計(jì)算法。由于時(shí)間遞歸平均的算法中存在平滑因子階躍(0或者1)的現(xiàn)象,本文提出了一種改進(jìn)措施,改進(jìn)后保證了平滑因子取值比較合理。最后通過(guò)結(jié)果顯示,改進(jìn)的算法在低信噪比環(huán)境下有比較好的改善效果。3、譜減算法簡(jiǎn)單高效,實(shí)時(shí)性很高,適用范圍比較廣泛,但是譜減算法的缺點(diǎn)是輸出均伴有起伏較大且刺耳的音樂(lè)噪聲。為了解決音樂(lè)噪聲,人們提出了很多的改進(jìn)措施。最常用的一種是在減法過(guò)程中增加一個(gè)或者多個(gè)修正系數(shù),以減少音樂(lè)噪聲的影響,但是修正系數(shù)需要根據(jù)實(shí)驗(yàn)或者經(jīng)驗(yàn)來(lái)確定,適應(yīng)性比較差。為此,本文研究了基于參數(shù)最優(yōu)控制的譜減算法,并且采用改進(jìn)的引導(dǎo)判決法來(lái)估計(jì)先驗(yàn)信噪比,從而確定最優(yōu)的修正系數(shù)。實(shí)驗(yàn)結(jié)果顯示,本文的改進(jìn)算法對(duì)語(yǔ)音的可懂度提高有限,但對(duì)語(yǔ)音質(zhì)量的改善效果明顯。
[Abstract]:In speech communication, it is often disturbed by various kinds of noise. Noise interference may also cause hearing fatigue or deterioration of speech processing system performance. In order to be able to recover the original speech signal as much as possible from the speech signal containing all kinds of noise, It is necessary to use speech enhancement technology to suppress or reduce noise and improve the quality and intelligibility of speech signal. At present, most of the speech signal processing systems used in practical applications are still working in single channel, and because of the speech enhancement of single channel, less information can be obtained. It is more difficult than dual-channel and multi-channel speech enhancement. Therefore, it is necessary to study and try to improve the speech enhancement based on single channel. The research work of this paper is mainly carried out in three aspects as follows: 1. In the practical application environment, noise is convenient, various kinds of noise, different noise have different characteristics. Therefore, different speech enhancement algorithms should be selected according to the specific noise in practical application to achieve the best speech enhancement effect. The basic principle and implementation process of Wiener filtering algorithm and minimum mean square error algorithm are tested under Gao Si white noise, pink noise and multi-speaker babble noise respectively. The experimental results show that, The three algorithms can improve the quality of speech in all kinds of noise environments, but not all of them can improve the intelligibility of speech. The estimation of noise is very important in speech enhancement technology. If the noise estimation is too low, it will lead to more background noise, and when the noise estimation is too high, the weak speech information will be weakened, and the inaccurate estimation will eventually lead to speech distortion. In this paper, VAD noise estimation algorithm and time recursive average noise estimation algorithm based on a posteriori signal-to-noise ratio (SNR) are studied. Due to the existence of smoothing factor step 0 or 1) in the time recursive averaging algorithm, an improved method is proposed in this paper. Finally, the result shows that the improved algorithm has better effect of improving in low signal-to-noise ratio environment. The spectral subtraction algorithm is simple and efficient, real-time is very high, and the range of application is wide. However, the disadvantage of spectral subtraction algorithm is that the output is accompanied by large and sharp music noise. In order to solve the music noise, many improvements have been put forward. One of the most commonly used methods is to add one or more correction coefficients in the process of subtraction. In order to reduce the influence of music noise, but the correction coefficient needs to be determined by experiment or experience, the adaptability is poor. Therefore, the spectral subtraction algorithm based on parameter optimal control is studied in this paper. The improved guide decision method is used to estimate the prior signal-to-noise ratio (SNR) and to determine the optimal correction coefficient. The experimental results show that the improved algorithm improves speech intelligibility limited but improves speech quality obviously.
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.35
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語(yǔ)音增強(qiáng)算法[J];上海交通大學(xué)學(xué)報(bào);2000年07期
2 姚峰英,張敏;用于語(yǔ)音增強(qiáng)的高頻信噪比度量[J];聲學(xué)學(xué)報(bào);2002年05期
3 彭煊,劉金福,王炳錫;基于獨(dú)立分量分析的語(yǔ)音增強(qiáng)[J];信號(hào)處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語(yǔ)音增強(qiáng)方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
5 楊匯軍,鄭海英,王立紅;語(yǔ)音增強(qiáng)方法的研究[J];遼寧工學(xué)院學(xué)報(bào);2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語(yǔ)音增強(qiáng)新算法[J];傳感技術(shù)學(xué)報(bào);2004年01期
7 孫新德;一種改進(jìn)的語(yǔ)音增強(qiáng)方法及實(shí)現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
8 錢(qián)國(guó)青;趙鶴鳴;;基于改進(jìn)譜減算法的語(yǔ)音增強(qiáng)新方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運(yùn)偉;語(yǔ)音增強(qiáng)算法綜述[J];聲學(xué)與電子工程;2005年01期
10 楊毅;楊宇;余達(dá)太;;語(yǔ)音增強(qiáng)及其消噪能力研究[J];微電子學(xué)與計(jì)算機(jī);2006年07期
相關(guān)會(huì)議論文 前10條
1 陳凱;俞蒙槐;胡上序;付強(qiáng);;語(yǔ)音增強(qiáng)系統(tǒng)性能評(píng)測(cè)方法綜述[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語(yǔ)音增強(qiáng)及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語(yǔ)音增強(qiáng)方法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國(guó)慶;;諧波能量匯集度在語(yǔ)音增強(qiáng)中的應(yīng)用[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
5 國(guó)雁萌;;一種極低信噪比條件下的語(yǔ)音增強(qiáng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語(yǔ)音增強(qiáng)算法研究[A];中國(guó)聲學(xué)學(xué)會(huì)2005年青年學(xué)術(shù)會(huì)議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強(qiáng);覃團(tuán)發(fā);萬(wàn)海斌;;語(yǔ)音增強(qiáng)算法的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
9 魏臻;張景達(dá);陸陽(yáng);;嵌入式系統(tǒng)中語(yǔ)音增強(qiáng)改進(jìn)算法的研究[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語(yǔ)音增強(qiáng)方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 歐世峰;變換域語(yǔ)音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
2 尹偉;基于模型的語(yǔ)音增強(qiáng)方法及質(zhì)量評(píng)估研究[D];武漢大學(xué);2009年
3 王海艷;基于統(tǒng)計(jì)模型的語(yǔ)音增強(qiáng)算法研究[D];吉林大學(xué);2011年
4 方瑜;語(yǔ)音增強(qiáng)相關(guān)問(wèn)題研究[D];北京郵電大學(xué);2012年
5 姚峰英;語(yǔ)音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院上海冶金研究所;2001年
6 夏丙寅;面向移動(dòng)通信的單通道語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
8 陶智;低信噪比環(huán)境下語(yǔ)音增強(qiáng)的研究[D];蘇州大學(xué);2011年
9 王娜;基于小波變換與約束方差噪聲譜估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];燕山大學(xué);2011年
10 趙彥平;基于稀疏表示的語(yǔ)音增強(qiáng)方法研究[D];吉林大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 肖佩霖;雙通道語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 魏有權(quán);基于噪聲估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];昆明理工大學(xué);2015年
3 郭栗;特定人語(yǔ)音增強(qiáng)算法的研究[D];上海交通大學(xué);2015年
4 紀(jì)志春;基于字典學(xué)習(xí)的語(yǔ)音增強(qiáng)算法研究[D];大連海事大學(xué);2016年
5 尹波;基于麥克風(fēng)小陣列的語(yǔ)音增強(qiáng)算法的研究[D];湖北工業(yè)大學(xué);2016年
6 張建偉;基于噪聲譜估計(jì)和信噪比約束的語(yǔ)音增強(qiáng)研究[D];安徽大學(xué);2016年
7 魏泉水;基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)算法研究[D];南京大學(xué);2016年
8 王鵬宇;壓縮感知技術(shù)在語(yǔ)音增強(qiáng)和EEG信號(hào)中的應(yīng)用研究[D];福州大學(xué);2014年
9 魏清泉;有色噪聲下語(yǔ)音增強(qiáng)算法及應(yīng)用研究[D];福州大學(xué);2014年
10 黃劍文;多通道語(yǔ)音增強(qiáng)算法及應(yīng)用研究[D];福州大學(xué);2014年
,本文編號(hào):1688067
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1688067.html