當(dāng)前位置：主頁 > 科技論文 > 網(wǎng)絡(luò)通信論文 >

低信噪比環(huán)境下語音增強(qiáng)及相關(guān)技術(shù)研究

發(fā)布時(shí)間：2020-08-28 18:29

　　語音是人與人之間最直接、最便捷的交流方式,噪聲的存在降低了語音信號的清晰度和可懂度,影響了人們的正常交流。在低信噪比環(huán)境下,噪聲的干擾給語音信號處理帶來很大困難。因此,低信噪比環(huán)境下,人們需要更優(yōu)良的語音增強(qiáng)技術(shù)對含噪語音進(jìn)行降噪,以便后續(xù)進(jìn)行高效的語音識別等處理。因此研究低信噪比環(huán)境下的語音增強(qiáng)技術(shù)具有重要的理論意義和實(shí)際價(jià)值。本文的研究目標(biāo)是在低信噪比環(huán)境下降低噪聲對語音的干擾,提升語音增強(qiáng)的效果。為此,本文首先從語音端點(diǎn)檢測出發(fā),提出了一種基于MFCC倒譜距離的自適應(yīng)語音端點(diǎn)檢測方法。接著基于精準(zhǔn)的端點(diǎn)檢測,針對維納濾波語音增強(qiáng)算法由于端點(diǎn)檢測不準(zhǔn)確導(dǎo)致增強(qiáng)效果不佳的問題,對檢測環(huán)節(jié)進(jìn)行了改進(jìn),提升了增強(qiáng)效果。為了解決更復(fù)雜噪聲下的去噪問題,文章最后研究了基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)技術(shù)。本文所做的工作和創(chuàng)新如下:(1)通過對語音增強(qiáng)技術(shù)發(fā)展進(jìn)程的調(diào)研,我們了解了語音增強(qiáng)技術(shù)的發(fā)展近況及其相關(guān)的語音處理技術(shù)。重點(diǎn)對語音端點(diǎn)檢測技術(shù)做了一定的研究和調(diào)研工作,介紹了多種常用的語音端點(diǎn)檢測方法并將他們逐個(gè)實(shí)現(xiàn)以便用于后期的比較。另外,詳述了譜減法、維納濾波法和神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)法的模型框架和實(shí)現(xiàn)過程。(2)針對傳統(tǒng)語音端點(diǎn)檢測算法在惡劣噪聲環(huán)境下難以保證檢測精度的問題,本文提出了一種基于MFCC倒譜距離的結(jié)合多窗譜估計(jì)的自適應(yīng)端點(diǎn)檢測方法。在語音檢測階段,首先計(jì)算各幀與無話幀之間的MFCC倒譜距離,以此為特征,選取合適的閾值來進(jìn)行判決。該閾值與前導(dǎo)無話幀的MFCC系數(shù)和噪聲的平均MFCC系數(shù)之間的差值密切相關(guān),該算法可以在不同的噪聲環(huán)境中自適應(yīng)的調(diào)整閾值,從而提高了語音端點(diǎn)檢測精度。實(shí)驗(yàn)數(shù)據(jù)表明,該端點(diǎn)檢測方法和其他常用檢測算法相比,在低信噪比環(huán)境下仍具有較高的端點(diǎn)檢測率,對噪聲具有強(qiáng)的魯棒性。(3)針對傳統(tǒng)維納濾波語音增強(qiáng)算法由于端點(diǎn)檢測不夠精準(zhǔn)導(dǎo)致噪聲估計(jì)不精確從而最終影響語音增強(qiáng)質(zhì)量的問題,本文采用基于MFCC倒譜距離的自適應(yīng)端點(diǎn)檢測方法來對維納濾波增強(qiáng)算法的噪聲段進(jìn)行準(zhǔn)確估計(jì)。實(shí)驗(yàn)表明,改進(jìn)后的算法能夠提高增強(qiáng)語音的質(zhì)量。(4)針對上述方法在非平穩(wěn)噪聲低信噪比下效果欠佳的問題,我們搭建了神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)系統(tǒng),取得了不錯(cuò)的語音增強(qiáng)效果。接下來利用維納濾波語音增強(qiáng)算法對訓(xùn)練及測試語音進(jìn)行預(yù)增強(qiáng)后再送入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試,即將兩種語音增強(qiáng)方法結(jié)合,進(jìn)一步提升了復(fù)雜噪聲環(huán)境低信噪比下的語音增強(qiáng)效果。
【學(xué)位單位】：南京郵電大學(xué)
【學(xué)位級別】：碩士
【學(xué)位年份】：2018
【中圖分類】：TN912.3
【部分圖文】：

發(fā)生機(jī)理,語音,聲道,鼻腔

究生學(xué)位論文第二章語的差異導(dǎo)致的。第三個(gè)部門叫調(diào)音區(qū)，就是對已經(jīng)產(chǎn)生的聲嘴唇、牙齒、鼻腔等來完成。我們能分別不同人說話是因?yàn)樵拑?nèi)容以及前鼻音、后鼻音包括輔音等都是經(jīng)由這個(gè)區(qū)域完的口腔和鼻腔即聲道發(fā)出，我們把這個(gè)聲道叫做聲學(xué)共振腔實(shí)是經(jīng)過多個(gè)器官共同協(xié)作來完成的。

聽覺系統(tǒng)

圖 2.3 人耳的聽覺系統(tǒng)圖人耳中，都可以用這三個(gè)要素來進(jìn)行衡量：音色、音調(diào)和響受，它是由振幅決定的。人耳對音強(qiáng)的感知范圍是 10-16~102者粗的一種感受，人耳能夠聽到的聲音的振動(dòng)頻率是 20Hz~，是每個(gè)發(fā)聲的事物最具個(gè)性的屬性，我們可以根據(jù)音色來的研究成果，以下是一些針對人耳特性的研究結(jié)論：首先，位不敏感。人耳具有很強(qiáng)的聽辨能力，我們時(shí)常在一個(gè)兩人某個(gè)人的聲音，這個(gè)現(xiàn)象俗稱雞尾酒效應(yīng)[41]。比方說，在聽某一種聲音，他可以做到對周圍的其他噪聲充耳不聞，但名字時(shí)會立即引起他的注意。具體來說，就是指人的耳朵可能夠無視除此之外的其他聲音但也自動(dòng)地監(jiān)視著這些外界聲種刺激，能馬上做出反應(yīng)。它與人耳的雙耳輸入效應(yīng)有關(guān)，

譜圖,矩形窗,和頻,時(shí)域波形

( ) ( ) ( )ws n s n w n號處理領(lǐng)域，使用的窗函數(shù)有很多種，目前來說主要有矩形窗、漢明窗、布萊克曼窗等，其中矩形窗、漢明窗和漢寧窗使用的最多。矩形窗窗函數(shù)的時(shí)域可以表示成下列形式：1, 0 ( 1)( )0,n Nw n 其他可以表示為：1( )2sin( )2( )sin( )2Nj Tj TRNTW e eT 時(shí)域波形圖和頻譜圖如圖 2.6 所示。

【參考文獻(xiàn)】

相關(guān)期刊論文前10條

1 沈曉園;聶紅亮;趙碩;;淺談電氣自動(dòng)化控制中的人工智能技術(shù)[J];化工管理;2015年30期

2 喬寬;楊中豪;;基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)研究[J];廣東通信技術(shù);2015年06期

3 張守斌;魏峻山;胡世祥;高鋒亮;秦承華;王洪燕;劉硯華;;中國環(huán)境噪聲污染防治現(xiàn)狀及建議[J];中國環(huán)境監(jiān)測;2015年03期

4 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2012年08期

5 孫林慧;楊震;;基于數(shù)據(jù)驅(qū)動(dòng)字典和稀疏表示的語音增強(qiáng)[J];信號處理;2011年12期

6 曹梅雙;曾慶寧;陳芙蓉;;一種基于廣義奇異值分解的語音增強(qiáng)算法[J];微電子學(xué)與計(jì)算機(jī);2010年03期

7 李如瑋;鮑長春;竇慧晶;;基于雙正交小波包分解的自適應(yīng)閾值語音增強(qiáng)[J];儀器儀表學(xué)報(bào);2008年10期

8 何淵淘;鄧偉;;多層感知器三種學(xué)習(xí)算法的比較[J];蘇州大學(xué)學(xué)報(bào)(工科版);2008年01期

9 唐永鋒;霍春寶;;噪聲環(huán)境下語音信號端點(diǎn)檢測算法的研究與改進(jìn)[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年11期

10 武光利;戴玉剛;馬寧;;基于短時(shí)平均幅度和短時(shí)平均過零率的藏語語音端點(diǎn)檢測研究[J];福建電腦;2007年03期

本文編號：2807979

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2807979.html

上一篇：全角模式半球諧振陀螺建模與控制算法研究
下一篇：基于雙耳聽覺時(shí)延估計(jì)的聲源定位研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

低信噪比環(huán)境下語音增強(qiáng)及相關(guān)技術(shù)研究