低信噪比環(huán)境下的語(yǔ)音識(shí)別方法研究
本文選題:語(yǔ)音增強(qiáng) + 低信噪比; 參考:《聲學(xué)技術(shù)》2017年01期
【摘要】:單通道語(yǔ)音信號(hào)在信噪比較大的環(huán)境下經(jīng)過(guò)增強(qiáng)后再識(shí)別,能表現(xiàn)出較高的識(shí)別率。但是在低信噪比環(huán)境下,增強(qiáng)后語(yǔ)音信號(hào)的識(shí)別率急劇下降。針對(duì)此種情況,提出了一種用在識(shí)別系統(tǒng)前端的語(yǔ)音增強(qiáng)算法,該增強(qiáng)算法將采集到的帶噪語(yǔ)音信號(hào)先使用對(duì)數(shù)最小均方誤差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改進(jìn)的維納濾波去除噪聲殘留并提升語(yǔ)音可懂度,最后用梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficients,MFCC)和隱馬爾科夫模型(Hidden Markov Model,HMM)對(duì)增強(qiáng)后的語(yǔ)音信號(hào)做特征提取并識(shí)別。實(shí)驗(yàn)分析結(jié)果表明,該方法能有效地抑制背景噪聲并減少噪聲殘留,顯著提升低信噪比環(huán)境下語(yǔ)音識(shí)別的準(zhǔn)確性。
[Abstract]:The single channel speech signal can be recognized with high recognition rate after enhancement in the environment of high signal-to-noise ratio (SNR). But in low SNR environment, the recognition rate of enhanced speech signal decreases sharply. In this paper, a speech enhancement algorithm used in the front end of the recognition system is proposed. The noisy speech signal is first enhanced by logarithmic Minimum Mean Square error MMSE (logarithmic Minimum Mean Square error MMSE), which is used to improve the signal-to-noise ratio (SNR) of the noisy speech signal. Then the improved Wiener filter is used to remove the noise residue and improve the speech intelligibility. Finally, the enhanced speech signal is extracted and recognized by using Mel-Frequency Cepstral coefficients (MFCC) and Hidden Markov Model-HMMM (Hidden Markov Model). The experimental results show that the proposed method can effectively suppress background noise and reduce the residual noise, and improve the accuracy of speech recognition in low SNR environment.
【作者單位】: 桂林電子科技大學(xué)信息與通信學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61461011) 教育部重點(diǎn)實(shí)驗(yàn)室2016年主任基金(CRKL160107)資助項(xiàng)目
【分類號(hào)】:TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期
2 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期
3 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期
4 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期
5 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期
6 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語(yǔ)音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語(yǔ)音識(shí)別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期
相關(guān)會(huì)議論文 前10條
1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
2 杜樹(shù)木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年
3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽(tīng)覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
相關(guān)重要報(bào)紙文章 前10條
1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年
2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤(pán)打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年
4 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年
6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢(qián)躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
9 上海 高博;讓電腦“聽(tīng)懂”人話[N];電腦報(bào);2008年
10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
相關(guān)博士學(xué)位論文 前10條
1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語(yǔ)的語(yǔ)音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號(hào):1952016
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1952016.html