基于最小均方差幅度譜估計(jì)器的語音增強(qiáng)算法研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2018-04-22 03:28
本文選題:語音增強(qiáng) + MMSE。 參考:《南京航空航天大學(xué)》2017年碩士論文
【摘要】:語音增強(qiáng)算法是語音信號(hào)處理領(lǐng)域的重要技術(shù),旨在提高低信噪比環(huán)境中語音信號(hào)的質(zhì)量和可懂度,為進(jìn)一步處理語音打下基礎(chǔ)。在較低信噪比或者高度不平穩(wěn)噪聲環(huán)境中,語音的質(zhì)量和可懂度會(huì)急劇下降,導(dǎo)致人類或者機(jī)器無法很好的識(shí)別或者傳輸,所以提高語音信號(hào)的質(zhì)量對(duì)于語音的處理十分重要,具有較高的研究意義和應(yīng)用價(jià)值。本文在分析經(jīng)典語音增強(qiáng)算法的基礎(chǔ)上,重點(diǎn)對(duì)基于最小均方誤差(Minimum Mean Square Error,MMSE)幅度譜估計(jì)器的語音增強(qiáng)算法進(jìn)行了研究和改進(jìn),并使用MATLAB工具對(duì)算法性能進(jìn)行了評(píng)估;最后,將該算法移植到DM642芯片上實(shí)現(xiàn)音頻采集處理和播放,并對(duì)算法進(jìn)行了定點(diǎn)優(yōu)化,提升了其實(shí)時(shí)性。本文主要內(nèi)容如下:1.分析了語音增強(qiáng)算法的研究現(xiàn)狀和各類算法的優(yōu)缺點(diǎn),通過對(duì)比選擇基于MMSE幅度譜估計(jì)的語音增強(qiáng)算法進(jìn)行研究,指出該算法存在著先驗(yàn)信噪比估計(jì)不足、噪聲估計(jì)誤差較大、DSP實(shí)現(xiàn)實(shí)時(shí)性較差等問題。2.針對(duì)MMSE幅度譜估計(jì)器所使用判決引導(dǎo)(Decision Directed,DD)先驗(yàn)信噪比估計(jì)算法延遲較大的缺點(diǎn),提出了新的基于熵值變化的DDBSE(DD Based on Single frequency Entropy,DDBSE)先驗(yàn)信噪比計(jì)算方法。該算法基于熵值變化,能夠快速追蹤語音的變化,從而改善DD算法的不足,為幅度估計(jì)器提供更精確的信噪比估計(jì)。3.針對(duì)噪聲估計(jì)不足的問題,提出了基于無偏噪聲估計(jì)(Unbiased MMSE)和語音活動(dòng)檢測(cè)(Voice Activity Detection,VAD)的新的噪聲估計(jì)算法UMVAD。該算法能夠減小噪聲的過估計(jì)和欠估計(jì),提供最小的中值估計(jì)均方誤差。實(shí)驗(yàn)結(jié)果表明,DDBSE與UMVAD結(jié)合,能在分段信噪比和綜合評(píng)分上取得較好的效果,特別適合于低信噪比和不平穩(wěn)噪聲環(huán)境中的語音增強(qiáng)。4.對(duì)VAD算法進(jìn)行改進(jìn),提出了雙閾值VAD判決方式,改進(jìn)后統(tǒng)計(jì)VAD結(jié)合能量熵(Energy-Entropy,EE)特征和平均峰值點(diǎn)偏差(Mean-Delta,MD)特征,能夠取得較為滿意的整體命中率;同時(shí),基于噪聲分類思路,結(jié)合支持向量機(jī)(Supported Vector Machine,SVM)對(duì)算法中可調(diào)參數(shù)進(jìn)行優(yōu)化,并將噪聲分類器結(jié)合到算法中,提出了具有環(huán)境意識(shí)的語音增強(qiáng)算法。5.在DSP芯片DM642上實(shí)現(xiàn)了本文的語音增強(qiáng)算法,設(shè)計(jì)了一個(gè)語音采集播放系統(tǒng),并對(duì)浮點(diǎn)算法進(jìn)行了定點(diǎn)化。相比于浮點(diǎn)型算法,本文所提的定點(diǎn)型算法取得了83%左右的處理速度提升,并且實(shí)現(xiàn)了音頻信號(hào)的實(shí)時(shí)采集處理和播放,能夠?qū)⑻幚硪粠臅r(shí)間限制在8毫秒左右。
[Abstract]:璇煶澧炲己綆楁硶鏄闊充俊鍙峰鐞嗛鍩熺殑閲嶈鎶,
本文編號(hào):1785412
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1785412.html
最近更新
教材專著