嘈雜環(huán)境下特定目標(biāo)語(yǔ)音搜索方法研究
【學(xué)位單位】:哈爾濱理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN912.3
【部分圖文】:
而高頻部分能量卻較低。低頻部分包含了語(yǔ)音的主要信息,所以在處理語(yǔ)音原始信號(hào)時(shí),期望獲得更多的低頻信號(hào)。語(yǔ)音信號(hào)的頻率范圍為300Hz~3400Hz,高頻部分在 800Hz 以上。對(duì)頻譜進(jìn)行分析時(shí),高頻部分的頻帶較窄,難以分析。預(yù)加重后的語(yǔ)音信號(hào) s(n),主要是加重高頻部分,可以提高語(yǔ)音信號(hào)的分辨率,使頻譜更加平緩,利于聲道參數(shù)和頻譜的研究。預(yù)加重通過預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn),通常選用一階數(shù)字濾波器:1H ( z ) 1αz = (2-1)α 為預(yù)加重系數(shù),識(shí)別率會(huì)隨著 α 的大小而改變,通常選取 α 值為0.9375。語(yǔ)音信號(hào)的預(yù)加重公式如下:( ) ( ) ( 1)a p pS n = S n αS n (2-2)其中pS 和aS 為預(yù)加重前后的信號(hào)。下圖 2-1 為語(yǔ)音信號(hào)“2”預(yù)加重前后的頻譜圖,由圖可看出,高頻部分得到提升,且語(yǔ)音信號(hào)的頻譜也較為平坦。
2. 假設(shè)前若干幀為無(wú)聲段,統(tǒng)計(jì)噪聲的短時(shí)過零率與短時(shí)能量。3. 根據(jù)嘈雜的背景環(huán)境及語(yǔ)音信號(hào)的短時(shí)能量和過零率選取其高低門限值記為1amp 、2amp 和1zcr 、2zcr 。4. 采用短時(shí)能量門限確定起止點(diǎn),在通過短時(shí)過零率對(duì)門限進(jìn)行修正,最終得到語(yǔ)音信號(hào)的起止點(diǎn)。下圖 2-2 采用雙門限端點(diǎn)檢測(cè)的方法在純凈語(yǔ)音下對(duì)數(shù)字“3”進(jìn)行端點(diǎn)檢測(cè)的結(jié)果。第一張圖為語(yǔ)音信號(hào)的時(shí)域波形及雙門限端點(diǎn)檢測(cè)的結(jié)果,第二張圖為語(yǔ)音信號(hào)的短時(shí)能量波形,第三張為短時(shí)過零率的波形。圖 2-3 為嘈雜環(huán)境下的仿真效果對(duì)比圖。由此可見,在純凈語(yǔ)音環(huán)境下,經(jīng)典的雙門限端點(diǎn)檢測(cè)算法能有效檢測(cè)出語(yǔ)音信號(hào)的起止點(diǎn),但在嘈雜環(huán)境下,性能急劇下降。
2. 假設(shè)前若干幀為無(wú)聲段,統(tǒng)計(jì)噪聲的短時(shí)過零率與短時(shí)能量。3. 根據(jù)嘈雜的背景環(huán)境及語(yǔ)音信號(hào)的短時(shí)能量和過零率選取其高低門限值記為1amp 、2amp 和1zcr 、2zcr 。4. 采用短時(shí)能量門限確定起止點(diǎn),在通過短時(shí)過零率對(duì)門限進(jìn)行修正,最終得到語(yǔ)音信號(hào)的起止點(diǎn)。下圖 2-2 采用雙門限端點(diǎn)檢測(cè)的方法在純凈語(yǔ)音下對(duì)數(shù)字“3”進(jìn)行端點(diǎn)檢測(cè)的結(jié)果。第一張圖為語(yǔ)音信號(hào)的時(shí)域波形及雙門限端點(diǎn)檢測(cè)的結(jié)果,第二張圖為語(yǔ)音信號(hào)的短時(shí)能量波形,第三張為短時(shí)過零率的波形。圖 2-3 為嘈雜環(huán)境下的仿真效果對(duì)比圖。由此可見,在純凈語(yǔ)音環(huán)境下,經(jīng)典的雙門限端點(diǎn)檢測(cè)算法能有效檢測(cè)出語(yǔ)音信號(hào)的起止點(diǎn),但在嘈雜環(huán)境下,性能急劇下降。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李軼南;張雄偉;賈沖;陳亮;曾理;;稀疏低秩噪聲模型下無(wú)監(jiān)督實(shí)時(shí)單通道語(yǔ)音增強(qiáng)算法[J];聲學(xué)學(xué)報(bào);2015年04期
2 李世紹;高勇;;低信噪比下基于FastIca和MMSE-LSA的語(yǔ)音識(shí)別[J];電聲技術(shù);2014年01期
3 夏樂樂;孫永榮;王勇;;基于自適應(yīng)噪聲估計(jì)的語(yǔ)音增強(qiáng)技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2014年23期
4 胡旭琰;鄒月嫻;王文敏;;基于MDT特征補(bǔ)償?shù)脑肼曯敯粽Z(yǔ)音識(shí)別算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
5 趙改華;周彬;張雄偉;;基于超高斯混合模型的語(yǔ)音幅度譜增強(qiáng)算法[J];通信技術(shù);2013年06期
6 林琳;陳虹;陳建;;基于魯棒聽覺特征的說(shuō)話人識(shí)別[J];電子學(xué)報(bào);2013年03期
7 吳海洋;楊飛然;周琳;吳鎮(zhèn)揚(yáng);;矢量泰勒級(jí)數(shù)特征補(bǔ)償?shù)恼f(shuō)話人識(shí)別[J];聲學(xué)學(xué)報(bào);2013年01期
8 陳聯(lián)武;郭武;戴禮榮;;聲紋識(shí)別中合成語(yǔ)音的魯棒性[J];模式識(shí)別與人工智能;2011年06期
9 游大濤;韓紀(jì)慶;鄧世文;;基于長(zhǎng)短時(shí)能量均值的活動(dòng)語(yǔ)音檢測(cè)算法[J];智能計(jì)算機(jī)與應(yīng)用;2011年04期
10 陳黎;徐東平;;基于SVM-GMM的開集說(shuō)話人識(shí)別方法[J];計(jì)算機(jī)工程;2011年14期
相關(guān)碩士學(xué)位論文 前1條
1 李克粉;噪聲環(huán)境下的語(yǔ)音識(shí)別方法研究與改進(jìn)[D];江蘇科技大學(xué);2013年
本文編號(hào):2867646
本文鏈接:http://sikaile.net/kejilunwen/wltx/2867646.html