天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于HMM和ANN混合模型的孤立詞語音識(shí)別研究

發(fā)布時(shí)間:2020-05-30 13:20
【摘要】:孤立詞識(shí)別是生活應(yīng)用最廣的應(yīng)用于人們的日常生活之中,如智能家居,汽車導(dǎo)航,手機(jī)軟件,學(xué)習(xí)機(jī)等,孤立詞識(shí)別有著很好的市場前景和研究價(jià)值。在語音識(shí)別領(lǐng)域中,動(dòng)態(tài)時(shí)間規(guī)整(DTW)技術(shù)基于馬爾可夫模型(Hidden Markov Model)技術(shù)是被廣泛應(yīng)用的。隨著近些年的研究深入,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)在語音識(shí)別的應(yīng)用成為了一種新的研究熱門。對(duì)于HMM模型,它有極強(qiáng)的動(dòng)態(tài)建模功能,所以對(duì)于動(dòng)態(tài)性能的語音信號(hào)建模有著很好的優(yōu)勢,但對(duì)于模型的分類功能略顯不足。在ANN模型中,輸入輸出映射能力的優(yōu)勢,讓它處理模式分類和判決的問題能力強(qiáng)大,但在動(dòng)態(tài)信號(hào)處理能力,它的不足也是顯而易見的。本文針對(duì)兩種模型的優(yōu)缺點(diǎn),提出基于HMM-ANN混合模型,來提高信號(hào)的處理能力,從而提高孤立詞語音識(shí)別系統(tǒng)的識(shí)別率,而在ANN模型中,我們采用概率神經(jīng)網(wǎng)絡(luò)(PNN)。本文的主要工作包括以下幾個(gè)部分:(1)分析了孤立詞語音信號(hào)的預(yù)處理與特征提取的過程,重點(diǎn)討論了線性預(yù)測倒譜系數(shù)(LPCC)和Mel頻率倒譜系數(shù)(MFCC)兩種語音特征提取方法。通過對(duì)孤立詞語音信號(hào)的預(yù)處理和特征提取,為了得到了能表示語音信號(hào)本質(zhì)的特征參數(shù),并減少由于環(huán)境噪聲和發(fā)音長短不均和強(qiáng)度不同等因素造成的語音識(shí)別率偏低,提出一種基于自適應(yīng)譜熵的端點(diǎn)檢測,通過實(shí)驗(yàn)對(duì)比傳統(tǒng)雙限門算法與譜熵算法,后者對(duì)于孤立詞是別的抗噪能力有了明顯提高。(2)通過對(duì)傳統(tǒng)HMM模型的算法的深入研究,Viterbi算法對(duì)于孤立詞識(shí)別運(yùn)算復(fù)雜,且系統(tǒng)的計(jì)算量過高。對(duì)于Viterbi算法進(jìn)行改進(jìn)與優(yōu)化,提出了一種基于門限設(shè)置來優(yōu)化算法,對(duì)于計(jì)算模型輸出的最優(yōu)路徑最優(yōu)路徑。優(yōu)化后的模型算法對(duì)于系統(tǒng)的識(shí)別時(shí)間,識(shí)別率都有了一定的提高。(3)研究了語音識(shí)別的現(xiàn)狀和原理,比較ANN和HMM各自的優(yōu)缺點(diǎn)及不足,構(gòu)建了HMM-ANN混合模型,通過MATLAB軟件分別仿真實(shí)現(xiàn)了HMM,ANN,HMM-ANN這種三種模型的孤立詞的語音識(shí)別功能。
【圖文】:

框架圖,語音識(shí)別系統(tǒng),框架圖,原理


著不同的任務(wù)。本節(jié)將用一個(gè)經(jīng)典的語音識(shí)別系統(tǒng)框架模型,用模式識(shí)別的原理,來對(duì)語音識(shí)別系統(tǒng)的構(gòu)成進(jìn)行講解。圖2.2 語音識(shí)別系統(tǒng)的原理框架圖從原理上講,語音識(shí)別是屬于模式識(shí)別[23]的一種,根據(jù)圖2.2所示,模型的覆蓋面非常廣,包括對(duì)于語音信號(hào)的處理,模型匹配等等。首先,計(jì)算機(jī)在接收到語音后,對(duì)其進(jìn)行信號(hào)分析,然后對(duì)無用的信號(hào)進(jìn)行處理,主要是對(duì)它進(jìn)行去躁,并提取可以表示語音信號(hào)的特征參數(shù),通過數(shù)學(xué)型對(duì)其進(jìn)行訓(xùn)練,,建立一個(gè)語音數(shù)據(jù)庫。后面,只需要將需要識(shí)別的語音信號(hào)與數(shù)據(jù)庫中的語音特征進(jìn)行比較匹配

模型圖,語音,模型,氣流


昆明理工大學(xué)碩士論文是通過人類的肺部擠壓收縮,在支氣管氣流經(jīng)過壓迫而出,聲門和聲道接受到氣流引起震蕩而產(chǎn)生。當(dāng)氣流通過聲門時(shí),聲帶處于松弛狀態(tài),具有較低的振蕩頻率,從而構(gòu)成具有周期性的空氣振蕩,從而形成了濁音;在聲道中,如果橫截面積較小,氣流高速流過就會(huì)產(chǎn)生湍流,從而得到類似于噪聲的激勵(lì),從而產(chǎn)生摩擦音;如果聲道的某個(gè)部位是完全閉合狀態(tài),此時(shí)空氣會(huì)受到積壓,從而出現(xiàn)突破臨界值的聲音,也就是我們常說的爆破音。根據(jù)人類聲音的聲音機(jī)制,模擬人的聲音生成系統(tǒng)。如果一個(gè)時(shí)變的線性系統(tǒng)被用來模擬這個(gè)過程,它類似于一個(gè)離散系統(tǒng)模型,如圖 2.3 所示。A
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.34

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳軍霞;劉紫玉;;基于Baum-Welch算法HMM模型的孤詞算法研究[J];河北科技大學(xué)學(xué)報(bào);2015年01期

2 許洋;;前饋型神經(jīng)網(wǎng)絡(luò)算法優(yōu)化分析[J];硅谷;2014年13期

3 晁浩;宋成;劉志中;;語音識(shí)別中基于發(fā)音特征的聲調(diào)集成算法[J];計(jì)算機(jī)工程與應(yīng)用;2014年23期

4 劉琦;尹國祥;;基于Matlab的語音信號(hào)預(yù)處理技術(shù)研究[J];電子技術(shù)與軟件工程;2014年01期

5 曹亮;張?zhí)祢U;高洪興;易琛;;基于聽覺掩蔽效應(yīng)的多頻帶譜減語音增強(qiáng)方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年01期

6 葉佳暉;盧文科;;一種改進(jìn)的非線性刻度轉(zhuǎn)換模型[J];儀表技術(shù);2012年02期

7 聶曉飛;趙禹;詹慶才;;一種基于模板匹配的語音識(shí)別算法[J];電子設(shè)計(jì)工程;2011年19期

8 滕在霞;劉悅;高峻峻;;基于加權(quán)歐式距離的替代率估算方法[J];計(jì)算機(jī)工程;2010年15期

9 呂衛(wèi)強(qiáng);黃荔;;基于短時(shí)能量加過零率的實(shí)時(shí)語音端點(diǎn)檢測方法[J];兵工自動(dòng)化;2009年09期

10 劉華平;李昕;徐柏齡;姜寧;;語音信號(hào)端點(diǎn)檢測方法綜述及展望[J];計(jì)算機(jī)應(yīng)用研究;2008年08期

相關(guān)碩士學(xué)位論文 前7條

1 魯澤茹;連續(xù)語音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江工業(yè)大學(xué);2016年

2 李博利;基于HTK大詞匯量連續(xù)語音識(shí)別研究[D];云南大學(xué);2016年

3 張穩(wěn);基于神經(jīng)網(wǎng)絡(luò)的語音識(shí)別系統(tǒng)的實(shí)現(xiàn)[D];成都理工大學(xué);2013年

4 舒琦;小詞匯量的孤立詞語音識(shí)別方法研究[D];武漢理工大學(xué);2012年

5 張翠改;基于譜熵的語音端點(diǎn)檢測算法的研究[D];河北大學(xué);2010年

6 張長勝;HMM在語音識(shí)別中的應(yīng)用研究[D];吉林大學(xué);2006年

7 王志強(qiáng);孤立詞語音識(shí)別系統(tǒng)關(guān)鍵問題的研究[D];北京郵電大學(xué);2006年



本文編號(hào):2688185

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2688185.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶88899***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com