天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

嘈雜環(huán)境下特定目標(biāo)語(yǔ)音搜索方法研究

發(fā)布時(shí)間:2020-11-02 22:16
   語(yǔ)音搜索是用來(lái)判定特定目標(biāo)身份信息的一種識(shí)別技術(shù),應(yīng)用領(lǐng)域較為廣泛,所以嘈雜環(huán)境下特定目標(biāo)語(yǔ)音搜索方法成為當(dāng)前研究的熱點(diǎn),具有重要的理論和實(shí)際意義。本文從語(yǔ)音信號(hào)的基本理論入手,著重研究了特征參數(shù)的提取、高斯混合模型的訓(xùn)練方式、噪聲參數(shù)估計(jì)及語(yǔ)音增強(qiáng)算法,并提出了一種基于語(yǔ)音增強(qiáng)算法與高斯混合模型相結(jié)合的嘈雜環(huán)境下語(yǔ)音搜索方法。本文對(duì)語(yǔ)音搜索的逐個(gè)環(huán)節(jié)進(jìn)行了詳細(xì)研究,首先對(duì)語(yǔ)音信號(hào)的預(yù)處理過程進(jìn)行了簡(jiǎn)要分析,研究了幾種常用的端點(diǎn)檢測(cè)方法,指出了其在嘈雜環(huán)境下的不足。其次分析了幾種典型特征參數(shù)的提取方法,并對(duì)梅爾倒譜系數(shù)進(jìn)行一階差分處理得到ΔMFCC,將MFCC與ΔMFCC相融合,以提高系統(tǒng)搜索的準(zhǔn)確性。然后對(duì)嘈雜環(huán)境中的噪聲特性進(jìn)行了研究,主要分析了有聲/無(wú)聲段檢測(cè)與連續(xù)噪聲譜兩種噪聲估計(jì)的方法,并將改進(jìn)的譜熵法用于有聲/無(wú)聲段檢測(cè)。經(jīng)仿真實(shí)驗(yàn)表明,有聲/無(wú)聲段檢測(cè)僅能對(duì)平穩(wěn)噪聲進(jìn)行有效估計(jì),而連續(xù)噪聲譜對(duì)平穩(wěn)噪聲和非平穩(wěn)噪聲均有較好的處理效果。在噪聲估計(jì)的基礎(chǔ)上,為了提高語(yǔ)音信號(hào)的信噪比,減少信號(hào)失真。對(duì)譜減法,維納濾波算法,基于最小均方誤差的MMSE算法進(jìn)行了研究,并提出了新的動(dòng)態(tài)Dynamic-MMSE算法。經(jīng)仿真實(shí)驗(yàn)表明,本文提出的新算法較上述算法性能上有了一定提升。為了提高特定目標(biāo)語(yǔ)音搜索的識(shí)別率,對(duì)諸多識(shí)別模型進(jìn)行了研究。最終確定采用高斯混合模型及期望最大化算法(EM算法)將融合后的特征參數(shù)進(jìn)行特定目標(biāo)語(yǔ)音搜索,優(yōu)勢(shì)在于并不需要完整的數(shù)據(jù)便可對(duì)概率模型的特征參數(shù)進(jìn)行最優(yōu)估計(jì),對(duì)于嘈雜環(huán)境下的語(yǔ)音搜索尤為適用。經(jīng)一系列仿真實(shí)驗(yàn)表明,將梅爾倒譜系數(shù)與ΔMFCC融合后的特征參數(shù)能更好的反映特定目標(biāo)的個(gè)性信息,經(jīng)噪聲參數(shù)估計(jì)和語(yǔ)音增強(qiáng)后,能將語(yǔ)音信號(hào)從帶噪語(yǔ)音信號(hào)中較好的分離出來(lái),將融合后的特征參數(shù),經(jīng)高斯混合模型訓(xùn)練識(shí)別后,在嘈雜環(huán)境下,特定目標(biāo)的識(shí)別率有了明顯提升。
【學(xué)位單位】:哈爾濱理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN912.3
【部分圖文】:

預(yù)加重,語(yǔ)音信號(hào),前后對(duì)比


而高頻部分能量卻較低。低頻部分包含了語(yǔ)音的主要信息,所以在處理語(yǔ)音原始信號(hào)時(shí),期望獲得更多的低頻信號(hào)。語(yǔ)音信號(hào)的頻率范圍為300Hz~3400Hz,高頻部分在 800Hz 以上。對(duì)頻譜進(jìn)行分析時(shí),高頻部分的頻帶較窄,難以分析。預(yù)加重后的語(yǔ)音信號(hào) s(n),主要是加重高頻部分,可以提高語(yǔ)音信號(hào)的分辨率,使頻譜更加平緩,利于聲道參數(shù)和頻譜的研究。預(yù)加重通過預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn),通常選用一階數(shù)字濾波器:1H ( z ) 1αz = (2-1)α 為預(yù)加重系數(shù),識(shí)別率會(huì)隨著 α 的大小而改變,通常選取 α 值為0.9375。語(yǔ)音信號(hào)的預(yù)加重公式如下:( ) ( ) ( 1)a p pS n = S n αS n (2-2)其中pS 和aS 為預(yù)加重前后的信號(hào)。下圖 2-1 為語(yǔ)音信號(hào)“2”預(yù)加重前后的頻譜圖,由圖可看出,高頻部分得到提升,且語(yǔ)音信號(hào)的頻譜也較為平坦。

端點(diǎn)檢測(cè),短時(shí)能量,語(yǔ)音信號(hào),短時(shí)過零率


2. 假設(shè)前若干幀為無(wú)聲段,統(tǒng)計(jì)噪聲的短時(shí)過零率與短時(shí)能量。3. 根據(jù)嘈雜的背景環(huán)境及語(yǔ)音信號(hào)的短時(shí)能量和過零率選取其高低門限值記為1amp 、2amp 和1zcr 、2zcr 。4. 采用短時(shí)能量門限確定起止點(diǎn),在通過短時(shí)過零率對(duì)門限進(jìn)行修正,最終得到語(yǔ)音信號(hào)的起止點(diǎn)。下圖 2-2 采用雙門限端點(diǎn)檢測(cè)的方法在純凈語(yǔ)音下對(duì)數(shù)字“3”進(jìn)行端點(diǎn)檢測(cè)的結(jié)果。第一張圖為語(yǔ)音信號(hào)的時(shí)域波形及雙門限端點(diǎn)檢測(cè)的結(jié)果,第二張圖為語(yǔ)音信號(hào)的短時(shí)能量波形,第三張為短時(shí)過零率的波形。圖 2-3 為嘈雜環(huán)境下的仿真效果對(duì)比圖。由此可見,在純凈語(yǔ)音環(huán)境下,經(jīng)典的雙門限端點(diǎn)檢測(cè)算法能有效檢測(cè)出語(yǔ)音信號(hào)的起止點(diǎn),但在嘈雜環(huán)境下,性能急劇下降。

端點(diǎn)檢測(cè),短時(shí)能量,語(yǔ)音信號(hào),短時(shí)過零率


2. 假設(shè)前若干幀為無(wú)聲段,統(tǒng)計(jì)噪聲的短時(shí)過零率與短時(shí)能量。3. 根據(jù)嘈雜的背景環(huán)境及語(yǔ)音信號(hào)的短時(shí)能量和過零率選取其高低門限值記為1amp 、2amp 和1zcr 、2zcr 。4. 采用短時(shí)能量門限確定起止點(diǎn),在通過短時(shí)過零率對(duì)門限進(jìn)行修正,最終得到語(yǔ)音信號(hào)的起止點(diǎn)。下圖 2-2 采用雙門限端點(diǎn)檢測(cè)的方法在純凈語(yǔ)音下對(duì)數(shù)字“3”進(jìn)行端點(diǎn)檢測(cè)的結(jié)果。第一張圖為語(yǔ)音信號(hào)的時(shí)域波形及雙門限端點(diǎn)檢測(cè)的結(jié)果,第二張圖為語(yǔ)音信號(hào)的短時(shí)能量波形,第三張為短時(shí)過零率的波形。圖 2-3 為嘈雜環(huán)境下的仿真效果對(duì)比圖。由此可見,在純凈語(yǔ)音環(huán)境下,經(jīng)典的雙門限端點(diǎn)檢測(cè)算法能有效檢測(cè)出語(yǔ)音信號(hào)的起止點(diǎn),但在嘈雜環(huán)境下,性能急劇下降。
【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李軼南;張雄偉;賈沖;陳亮;曾理;;稀疏低秩噪聲模型下無(wú)監(jiān)督實(shí)時(shí)單通道語(yǔ)音增強(qiáng)算法[J];聲學(xué)學(xué)報(bào);2015年04期

2 李世紹;高勇;;低信噪比下基于FastIca和MMSE-LSA的語(yǔ)音識(shí)別[J];電聲技術(shù);2014年01期

3 夏樂樂;孫永榮;王勇;;基于自適應(yīng)噪聲估計(jì)的語(yǔ)音增強(qiáng)技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2014年23期

4 胡旭琰;鄒月嫻;王文敏;;基于MDT特征補(bǔ)償?shù)脑肼曯敯粽Z(yǔ)音識(shí)別算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期

5 趙改華;周彬;張雄偉;;基于超高斯混合模型的語(yǔ)音幅度譜增強(qiáng)算法[J];通信技術(shù);2013年06期

6 林琳;陳虹;陳建;;基于魯棒聽覺特征的說(shuō)話人識(shí)別[J];電子學(xué)報(bào);2013年03期

7 吳海洋;楊飛然;周琳;吳鎮(zhèn)揚(yáng);;矢量泰勒級(jí)數(shù)特征補(bǔ)償?shù)恼f(shuō)話人識(shí)別[J];聲學(xué)學(xué)報(bào);2013年01期

8 陳聯(lián)武;郭武;戴禮榮;;聲紋識(shí)別中合成語(yǔ)音的魯棒性[J];模式識(shí)別與人工智能;2011年06期

9 游大濤;韓紀(jì)慶;鄧世文;;基于長(zhǎng)短時(shí)能量均值的活動(dòng)語(yǔ)音檢測(cè)算法[J];智能計(jì)算機(jī)與應(yīng)用;2011年04期

10 陳黎;徐東平;;基于SVM-GMM的開集說(shuō)話人識(shí)別方法[J];計(jì)算機(jī)工程;2011年14期


相關(guān)碩士學(xué)位論文 前1條

1 李克粉;噪聲環(huán)境下的語(yǔ)音識(shí)別方法研究與改進(jìn)[D];江蘇科技大學(xué);2013年



本文編號(hào):2867646

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2867646.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶321db***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com