天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語(yǔ)音增強(qiáng)技術(shù)研究及在語(yǔ)音識(shí)別中的應(yīng)用

發(fā)布時(shí)間:2019-04-16 14:43
【摘要】:語(yǔ)音是生活中最重要的信息載體,然而它很容易受到噪聲的污染,從而干擾信息的傳遞。語(yǔ)音增強(qiáng),它能將重要的語(yǔ)音信號(hào)從嘈雜的帶噪語(yǔ)音中分離出來(lái),將噪聲的影響盡可能地減少。語(yǔ)音識(shí)別技術(shù)在現(xiàn)實(shí)生活中應(yīng)用越來(lái)越廣泛,安靜環(huán)境中的語(yǔ)音識(shí)別技術(shù)已經(jīng)日趨成熟,而噪聲環(huán)境下的語(yǔ)音識(shí)別技術(shù)仍然是一個(gè)難題。語(yǔ)音識(shí)別系統(tǒng)要實(shí)現(xiàn)抗噪就必須要盡量減少噪聲的干擾,因此將語(yǔ)音增強(qiáng)技術(shù)結(jié)合到語(yǔ)音識(shí)別中來(lái)實(shí)現(xiàn)識(shí)別系統(tǒng)的抗噪性,具有很大的研究意義。本文的研究工作主要分成三個(gè)部分。第一,深入研究了幾種傳統(tǒng)的語(yǔ)音增強(qiáng)算法,包括譜減法、維納濾波和最小均方誤差估計(jì)算法,并在此研究基礎(chǔ)上對(duì)這些算法進(jìn)行了詳細(xì)的仿真實(shí)驗(yàn);趯(shí)驗(yàn)的基礎(chǔ)上,對(duì)比分析這些算法各自的優(yōu)缺點(diǎn),并從信噪比和語(yǔ)音失真兩方面去評(píng)價(jià)這些語(yǔ)音增強(qiáng)方法。最后,對(duì)各種算法加以總結(jié)得出不同噪聲要求的情況下比較合適的語(yǔ)音增強(qiáng)算法。第二,對(duì)語(yǔ)音識(shí)別技術(shù)進(jìn)行了分析和比較研究,著重分析了預(yù)處理、端點(diǎn)檢測(cè)等幾個(gè)語(yǔ)音識(shí)別實(shí)現(xiàn)需要解決的關(guān)鍵性技術(shù)。在此基礎(chǔ)上,我們實(shí)現(xiàn)了主流的動(dòng)態(tài)時(shí)間規(guī)整和隱馬爾可夫算法。從識(shí)別率上,對(duì)兩種算法進(jìn)行了分析,并實(shí)驗(yàn)比較了這些語(yǔ)音識(shí)別系統(tǒng)抗噪性的差異。第三,提出了一種基于語(yǔ)音增強(qiáng)技術(shù)的語(yǔ)音識(shí)別算法。該算法將語(yǔ)音增強(qiáng)與語(yǔ)音識(shí)別進(jìn)行聯(lián)合處理,即在識(shí)別之前先進(jìn)行語(yǔ)音增強(qiáng)處理。實(shí)驗(yàn)證明,實(shí)現(xiàn)的語(yǔ)音識(shí)別系統(tǒng)具有良好的抗噪性。通過(guò)比較幾種語(yǔ)音增強(qiáng)算法在語(yǔ)音識(shí)別上應(yīng)用結(jié)果及分析,得出了語(yǔ)音識(shí)別應(yīng)用中較好的語(yǔ)音增強(qiáng)算法。設(shè)計(jì)了一個(gè)多引擎的語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)抗噪性和識(shí)別率上,都比傳統(tǒng)的識(shí)別算法效果更出色。
[Abstract]:Speech is the most important information carrier in life. However, it is easy to be polluted by noise, which interferes with the transmission of information. Speech enhancement, which can separate important speech signals from noisy speech, and reduce the influence of noise as much as possible. Speech recognition technology is more and more widely used in real life. Speech recognition technology in quiet environment has become more and more mature, and speech recognition technology in noise environment is still a difficult problem. If speech recognition system is to resist noise, it is necessary to reduce noise interference as far as possible. Therefore, it is of great significance to combine speech enhancement technology with speech recognition to realize the anti-noise property of speech recognition system. The research work of this paper is divided into three parts. Firstly, several traditional speech enhancement algorithms, including spectral subtraction, Wiener filtering and least mean square error estimation (MMSE), are deeply studied, and detailed simulation experiments are carried out on the basis of this study. On the basis of experiments, the advantages and disadvantages of these algorithms are compared and analyzed, and the speech enhancement methods are evaluated from two aspects: signal-to-noise ratio (SNR) and speech distortion. Finally, various algorithms are summarized to get a more suitable speech enhancement algorithm under different noise requirements. Secondly, the speech recognition technology is analyzed and compared, and the key technologies to realize speech recognition, such as preprocessing and endpoint detection, are emphatically analyzed. On this basis, we implement the mainstream dynamic time regularization and hidden Markov algorithm. In terms of recognition rate, the two algorithms are analyzed, and the differences of anti-noise performance of these speech recognition systems are compared experimentally. Thirdly, a speech recognition algorithm based on speech enhancement technology is proposed. The algorithm combines speech enhancement with speech recognition, that is, speech enhancement before recognition. The experimental results show that the proposed speech recognition system has good anti-noise property. By comparing the application results and analysis of several speech enhancement algorithms in speech recognition, a better speech enhancement algorithm in speech recognition application is obtained. A multi-engine speech recognition system is designed. The anti-noise performance and recognition rate of the system are better than the traditional recognition algorithm.
【學(xué)位授予單位】:福州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期

2 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期

3 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期

4 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期

5 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期

6 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;讓語(yǔ)音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊;2004年03期

8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

9 陳孝強(qiáng);語(yǔ)音識(shí)別擬起新潮[J];微電腦世界;2005年07期

10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期

相關(guān)會(huì)議論文 前10條

1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

2 杜樹(shù)木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年

3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽(tīng)覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

相關(guān)重要報(bào)紙文章 前10條

1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年

2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年

3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年

4 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年

5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年

6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年

7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年

8 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年

9 上海 高博;讓電腦“聽(tīng)懂”人話[N];電腦報(bào);2008年

10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年

相關(guān)博士學(xué)位論文 前10條

1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年

2 包希日莫;面向蒙古語(yǔ)的語(yǔ)音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年

3 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

5 孫f,

本文編號(hào):2458860


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2458860.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eb3c2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com