基于HMM-ANN模型的語音識別技術研究

發(fā)布時間：2017-08-30 14:22

本文關鍵詞：基于HMM-ANN模型的語音識別技術研究

【摘要】：在語音識別(ASR,Automatic Speech Recognition)領域中運用最廣的隱馬爾可夫模型(HMM,Hidden Markov Model)和人工神經(jīng)網(wǎng)絡(ANN,Artificial Neural Network)這兩種模型各自均有優(yōu)缺點。HMM有極強的動態(tài)建模能力,在處理具有動態(tài)性能的語音信號時有著很好的優(yōu)勢,卻在分類功能上不足。ANN強大的輸入輸出映射能力使得它在處理模式分類與判決的問題上得天獨厚,然而它對動態(tài)信號處理能力的不足也是不可忽視的。本文提出使用HMM-ANN混合模型來提高信號的處理能力,從而提高ASR系統(tǒng)的識別率。其中,ANN采用了概率神經(jīng)網(wǎng)絡學習算法。論文主要完成了以下工作:(1)總結ASR的研究現(xiàn)狀和基本原理,比較HMM和ANN兩種模型的優(yōu)點和不足,提出HMM-ANN混合模型,并利用MATLAB軟件分別仿真實現(xiàn)了HMM、ANN以及HMM-ANN這三種模型下的小詞匯量、孤立漢語的語音識別功能。(2)比較了三種模型下語音識別的識別率,實驗結果表明,混合模型的識別率最高。(3)對語音識別的魯棒性進行了研究。一方面,端點檢測時提出了改進后的檢測算法。在用傳統(tǒng)的雙門限檢測算法前,先用小波閾值去噪原理提高語音信號的信噪比,再進行檢測。實驗結果證明,在噪聲環(huán)境下,改進后的算法表現(xiàn)出更好的抗噪性,即語音識別的魯棒性更好,識別率更高。另一方面,特征提取時提出了改進后的提取算法。與傳統(tǒng)的Mel頻率倒譜系數(shù)(MFCC)相比,本文提出的基于近似估計非零項法原理的譜減法的SS-MFCC參數(shù)更能代表純凈語音的特征,且對應的語音識別率更高,即魯棒性更好。
【關鍵詞】：語音識別 HMM-ANN混合模型 端點檢測 特征提取
【學位授予單位】：南昌航空大學
【學位級別】：碩士
【學位授予年份】：2016
【分類號】：TN912.34
【目錄】：

摘要3-4
ABSTRACT4-8
第1章緒論8-15
1.1 引言8-9
1.2 研究背景與意義9-10
1.3 國內(nèi)外研究現(xiàn)狀10-13
1.4 主要研究內(nèi)容13
1.5 論文組織結構13-15
第2章語音識別的概述15-31
2.1 語音識別的基本原理15
2.2 語音信號的預處理15-23
2.2.1 數(shù)字化16-17
2.2.2 預加重17
2.2.3 分幀加窗17-19
2.2.4 端點檢測19-23
2.3 語音信號的特征提取23-29
2.3.1 Mel頻率倒普系數(shù)（MFCC）24-26
2.3.2 基于譜減法估計的改進算法26-29
2.4 模板訓練與模板匹配29-30
2.5 本章小結30-31
第3章 HMM語音識別技術的研究31-39
3.1 HMM模型簡介31
3.2 HMM的數(shù)學模型31-32
3.3 HMM模型的三個基本問題32-38
3.3.1 前向-后向算法33-35
3.3.2 Viterbi算法35-36
3.3.3 Baum-Welch算法36-38
3.4 本章小結38-39
第4章 ANN語音識別技術的研究39-46
4.1 ANN的概述39
4.2 ANN的基本組成要素39-42
4.2.1 神經(jīng)元39-40
4.2.2 網(wǎng)絡拓撲結構40-41
4.2.3 網(wǎng)絡學習算法41-42
4.3 概率神經(jīng)網(wǎng)絡42-45
4.3.1 PNN概述42
4.3.2 PNN的識別過程42-45
4.4 本章小結45-46
第5章 HMM-ANN語音識別技術的研究46-51
5.1 HMM-ANN的結合依據(jù)46
5.2 HMM-ANN的結合方式46-47
5.3 HMM-ANN的語音識別過程47-50
5.4 本章小結50-51
第6章仿真與實驗分析51-73
6.1 準備工作51-53
6.2 預處理53-61
6.3 特征提取61-63
6.4 HMM-ANN混合模型的仿真63-72
6.4.1 HMM訓練模型63-66
6.4.2 PNN訓練模型66-67
6.4.3 實驗結果與分析67-70
6.4.4 討論70-72
6.5 本章小結72-73
第7章總結與展望73-74
7.1 工作總結73
7.2 研究展望73-74
參考文獻74-79
攻讀碩士期間發(fā)表論文情況79-80
致謝80-81

【相似文獻】

中國期刊全文數(shù)據(jù)庫前10條

1 ;飛利浦推出最新語音識別技術[J];現(xiàn)代通信;2000年08期

2 劉朝陽;語音識別技術的未來[J];互聯(lián)網(wǎng)周刊;2000年07期

3 ;語音識別技術的產(chǎn)業(yè)化[J];金卡工程;2002年12期

4 劉云冰;;語音識別技術的回顧與展望[J];軟件導刊;2005年13期

5 賀無名;;語音識別技術及其研究進展[J];中國科技信息;2006年18期

6 黃昆;;嵌入式,語音識別技術新趨向[J];中國計算機用戶;2006年45期

7 高新濤;陳乖麗;;語音識別技術的發(fā)展現(xiàn)狀及應用前景[J];甘肅科技縱橫;2007年04期

8 任杰;;語音識別技術概述[J];大眾科技;2010年08期

9 廖锎;;淺析語音識別技術的發(fā)展及趨勢[J];科技傳播;2010年17期

10 ;谷歌推出手機語音識別技術[J];電腦與電信;2010年08期

中國重要會議論文全文數(shù)據(jù)庫前10條

1 蔡偉建;;人工神經(jīng)網(wǎng)絡理論在語音識別技術中的應用[A];第八屆全國信息獲取與處理學術會議論文集[C];2010年

2 張化云;韓兆兵;徐波;;語音服務器中的語音識別技術[A];開創(chuàng)新世紀的通信技術——第七屆全國青年通信學術會議論文集[C];2001年

3 方棣棠;李樹青;;語音識別技術突破之路——如何使語音識別技術走向?qū)嵱肹A];第八屆全國人機語音通訊學術會議論文集[C];2005年

4 賈磊;;深度神經(jīng)網(wǎng)絡建模的最新工業(yè)進展和結合語義理解的語音識別技術[A];第十二屆全國人機語音通訊學術會議（NCMMSC'2013）論文集[C];2013年

5 趙美澤;王峰;;基于消除混響的語音識別技術研究[A];2008通信理論與技術新發(fā)展——第十三屆全國青年通信學術會議論文集（下）[C];2008年

6 蔡志博;俞鐵城;;語音識別技術的應用[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學術年會文集[C];2000年

7 呂成國;趙冰;;低信噪比下語音識別技術的研究[A];黑龍江省計算機學會2007年學術交流年會論文集[C];2007年

8 魏峰;徐成;曾祺;;基于HMM的語音識別技術研究[A];2006通信理論與技術新進展——第十一屆全國青年通信學術會議論文集[C];2006年

9 黃媛;俞舸;呂士楠;;車載識別庫的設計和制作[A];中國聲學學會2006年全國聲學學術會議論文集[C];2006年

10 張茹;韓紀慶;;基于DTW算法的自動發(fā)音錯誤檢測[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

中國重要報紙全文數(shù)據(jù)庫前10條

1 陳琳;語音識別技術升級，人機對話時代來臨[N];第一財經(jīng)日報;2007年

2 京晨;中科院最新語音識別技術面世[N];福建科技報;2002年

3 IBM中國研究中心沈麗琴博士;語音識別技術離我們有多遠[N];光明日報;2000年

4 ;語音識別技術前景誘人[N];人民郵電;2001年

5 ;用語言“改變”世界[N];計算機世界;2001年

6 英國《經(jīng)濟學人》;有錯請糾正:語音識別技術新進展[N];世界報;2010年

7 ;精彩演繹語音識別技術[N];人民郵電;2001年

8 記者王雙;我市參加第九屆“高交會”收獲成果[N];盤錦日報;2007年

9 記者薛冬;中文語音識別技術取得突破[N];光明日報;2002年

10 王朝選;科大訊飛語音識別技術取得重大進展[N];中國高新技術產(chǎn)業(yè)導報;2008年

中國博士學位論文全文數(shù)據(jù)庫前3條

1 王歡良;基于混淆網(wǎng)絡和輔助信息的語音識別技術研究[D];哈爾濱工業(yè)大學;2007年

2 張軍;抗噪聲語音識別技術的研究[D];華南理工大學;2003年

3 董婧;魯棒語音識別技術的研究[D];吉林大學;2007年

中國碩士學位論文全文數(shù)據(jù)庫前10條

1 張朝陽;語音識別技術在盲用導航系統(tǒng)中的應用[D];北方工業(yè)大學;2011年

2 錢磊;外業(yè)調(diào)繪系統(tǒng)中的語音識別技術研究[D];長安大學;2015年

3 鄭磊;魯棒性連續(xù)語音識別的研究及其在Android平臺的應用[D];電子科技大學;2014年

4 王琳;噪聲環(huán)境下的魯棒語音識別技術研究[D];哈爾濱工業(yè)大學;2016年

5 胡嘉林;基于語音識別技術的溫室自動化控制系統(tǒng)研究[D];昆明理工大學;2015年

6 楊波;基于語音識別技術的白馬語言保護研究[D];蘭州大學;2016年

7 胡寶花;基于HMM-ANN模型的語音識別技術研究[D];南昌航空大學;2016年

8 羅云;語音識別技術在超聲波系統(tǒng)中的應用[D];四川大學;2005年

9 洪祥元;基于語音識別技術的智能地球儀系統(tǒng)設計[D];北京交通大學;2012年

10 陳一寧;英語口語學習中的語音識別技術[D];上海交通大學;2010年

，

本文編號：759802

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/759802.html

上一篇：手機3選2卡連接器翹曲與體積收縮的工藝優(yōu)化及分析
下一篇：數(shù)據(jù)可視化在社交媒體中的應用研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于HMM-ANN模型的語音識別技術研究