基于HMM-ANN模型的語音識別技術(shù)研究
本文關(guān)鍵詞:基于HMM-ANN模型的語音識別技術(shù)研究
更多相關(guān)文章: 語音識別 HMM-ANN混合模型 端點檢測 特征提取
【摘要】:在語音識別(ASR,Automatic Speech Recognition)領(lǐng)域中運用最廣的隱馬爾可夫模型(HMM,Hidden Markov Model)和人工神經(jīng)網(wǎng)絡(luò)(ANN,Artificial Neural Network)這兩種模型各自均有優(yōu)缺點。HMM有極強(qiáng)的動態(tài)建模能力,在處理具有動態(tài)性能的語音信號時有著很好的優(yōu)勢,卻在分類功能上不足。ANN強(qiáng)大的輸入輸出映射能力使得它在處理模式分類與判決的問題上得天獨厚,然而它對動態(tài)信號處理能力的不足也是不可忽視的。本文提出使用HMM-ANN混合模型來提高信號的處理能力,從而提高ASR系統(tǒng)的識別率。其中,ANN采用了概率神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。論文主要完成了以下工作:(1)總結(jié)ASR的研究現(xiàn)狀和基本原理,比較HMM和ANN兩種模型的優(yōu)點和不足,提出HMM-ANN混合模型,并利用MATLAB軟件分別仿真實現(xiàn)了HMM、ANN以及HMM-ANN這三種模型下的小詞匯量、孤立漢語的語音識別功能。(2)比較了三種模型下語音識別的識別率,實驗結(jié)果表明,混合模型的識別率最高。(3)對語音識別的魯棒性進(jìn)行了研究。一方面,端點檢測時提出了改進(jìn)后的檢測算法。在用傳統(tǒng)的雙門限檢測算法前,先用小波閾值去噪原理提高語音信號的信噪比,再進(jìn)行檢測。實驗結(jié)果證明,在噪聲環(huán)境下,改進(jìn)后的算法表現(xiàn)出更好的抗噪性,即語音識別的魯棒性更好,識別率更高。另一方面,特征提取時提出了改進(jìn)后的提取算法。與傳統(tǒng)的Mel頻率倒譜系數(shù)(MFCC)相比,本文提出的基于近似估計非零項法原理的譜減法的SS-MFCC參數(shù)更能代表純凈語音的特征,且對應(yīng)的語音識別率更高,即魯棒性更好。
【關(guān)鍵詞】:語音識別 HMM-ANN混合模型 端點檢測 特征提取
【學(xué)位授予單位】:南昌航空大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要3-4
- ABSTRACT4-8
- 第1章 緒論8-15
- 1.1 引言8-9
- 1.2 研究背景與意義9-10
- 1.3 國內(nèi)外研究現(xiàn)狀10-13
- 1.4 主要研究內(nèi)容13
- 1.5 論文組織結(jié)構(gòu)13-15
- 第2章 語音識別的概述15-31
- 2.1 語音識別的基本原理15
- 2.2 語音信號的預(yù)處理15-23
- 2.2.1 數(shù)字化16-17
- 2.2.2 預(yù)加重17
- 2.2.3 分幀加窗17-19
- 2.2.4 端點檢測19-23
- 2.3 語音信號的特征提取23-29
- 2.3.1 Mel頻率倒普系數(shù)(MFCC)24-26
- 2.3.2 基于譜減法估計的改進(jìn)算法26-29
- 2.4 模板訓(xùn)練與模板匹配29-30
- 2.5 本章小結(jié)30-31
- 第3章 HMM語音識別技術(shù)的研究31-39
- 3.1 HMM模型簡介31
- 3.2 HMM的數(shù)學(xué)模型31-32
- 3.3 HMM模型的三個基本問題32-38
- 3.3.1 前向-后向算法33-35
- 3.3.2 Viterbi算法35-36
- 3.3.3 Baum-Welch算法36-38
- 3.4 本章小結(jié)38-39
- 第4章 ANN語音識別技術(shù)的研究39-46
- 4.1 ANN的概述39
- 4.2 ANN的基本組成要素39-42
- 4.2.1 神經(jīng)元39-40
- 4.2.2 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)40-41
- 4.2.3 網(wǎng)絡(luò)學(xué)習(xí)算法41-42
- 4.3 概率神經(jīng)網(wǎng)絡(luò)42-45
- 4.3.1 PNN概述42
- 4.3.2 PNN的識別過程42-45
- 4.4 本章小結(jié)45-46
- 第5章 HMM-ANN語音識別技術(shù)的研究46-51
- 5.1 HMM-ANN的結(jié)合依據(jù)46
- 5.2 HMM-ANN的結(jié)合方式46-47
- 5.3 HMM-ANN的語音識別過程47-50
- 5.4 本章小結(jié)50-51
- 第6章 仿真與實驗分析51-73
- 6.1 準(zhǔn)備工作51-53
- 6.2 預(yù)處理53-61
- 6.3 特征提取61-63
- 6.4 HMM-ANN混合模型的仿真63-72
- 6.4.1 HMM訓(xùn)練模型63-66
- 6.4.2 PNN訓(xùn)練模型66-67
- 6.4.3 實驗結(jié)果與分析67-70
- 6.4.4 討論70-72
- 6.5 本章小結(jié)72-73
- 第7章 總結(jié)與展望73-74
- 7.1 工作總結(jié)73
- 7.2 研究展望73-74
- 參考文獻(xiàn)74-79
- 攻讀碩士期間發(fā)表論文情況79-80
- 致謝80-81
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;飛利浦推出最新語音識別技術(shù)[J];現(xiàn)代通信;2000年08期
2 劉朝陽;語音識別技術(shù)的未來[J];互聯(lián)網(wǎng)周刊;2000年07期
3 ;語音識別技術(shù)的產(chǎn)業(yè)化[J];金卡工程;2002年12期
4 劉云冰;;語音識別技術(shù)的回顧與展望[J];軟件導(dǎo)刊;2005年13期
5 賀無名;;語音識別技術(shù)及其研究進(jìn)展[J];中國科技信息;2006年18期
6 黃昆;;嵌入式,語音識別技術(shù)新趨向[J];中國計算機(jī)用戶;2006年45期
7 高新濤;陳乖麗;;語音識別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景[J];甘肅科技縱橫;2007年04期
8 任杰;;語音識別技術(shù)概述[J];大眾科技;2010年08期
9 廖锎;;淺析語音識別技術(shù)的發(fā)展及趨勢[J];科技傳播;2010年17期
10 ;谷歌推出手機(jī)語音識別技術(shù)[J];電腦與電信;2010年08期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 蔡偉建;;人工神經(jīng)網(wǎng)絡(luò)理論在語音識別技術(shù)中的應(yīng)用[A];第八屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2010年
2 張化云;韓兆兵;徐波;;語音服務(wù)器中的語音識別技術(shù)[A];開創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國青年通信學(xué)術(shù)會議論文集[C];2001年
3 方棣棠;李樹青;;語音識別技術(shù)突破之路——如何使語音識別技術(shù)走向?qū)嵱肹A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
4 賈磊;;深度神經(jīng)網(wǎng)絡(luò)建模的最新工業(yè)進(jìn)展和結(jié)合語義理解的語音識別技術(shù)[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
5 趙美澤;王峰;;基于消除混響的語音識別技術(shù)研究[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國青年通信學(xué)術(shù)會議論文集(下)[C];2008年
6 蔡志博;俞鐵城;;語音識別技術(shù)的應(yīng)用[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會文集[C];2000年
7 呂成國;趙冰;;低信噪比下語音識別技術(shù)的研究[A];黑龍江省計算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年
8 魏峰;徐成;曾祺;;基于HMM的語音識別技術(shù)研究[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國青年通信學(xué)術(shù)會議論文集[C];2006年
9 黃媛;俞舸;呂士楠;;車載識別庫的設(shè)計和制作[A];中國聲學(xué)學(xué)會2006年全國聲學(xué)學(xué)術(shù)會議論文集[C];2006年
10 張茹;韓紀(jì)慶;;基于DTW算法的自動發(fā)音錯誤檢測[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 陳琳;語音識別技術(shù)升級,人機(jī)對話時代來臨[N];第一財經(jīng)日報;2007年
2 京晨;中科院最新語音識別技術(shù)面世[N];福建科技報;2002年
3 IBM中國研究中心 沈麗琴博士;語音識別技術(shù)離我們有多遠(yuǎn)[N];光明日報;2000年
4 ;語音識別技術(shù)前景誘人[N];人民郵電;2001年
5 ;用語言“改變”世界[N];計算機(jī)世界;2001年
6 英國《經(jīng)濟(jì)學(xué)人》;有錯請糾正:語音識別技術(shù)新進(jìn)展[N];世界報;2010年
7 ;精彩演繹語音識別技術(shù)[N];人民郵電;2001年
8 記者 王雙;我市參加第九屆“高交會”收獲成果[N];盤錦日報;2007年
9 記者 薛冬;中文語音識別技術(shù)取得突破[N];光明日報;2002年
10 王朝選;科大訊飛語音識別技術(shù)取得重大進(jìn)展[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
2 張軍;抗噪聲語音識別技術(shù)的研究[D];華南理工大學(xué);2003年
3 董婧;魯棒語音識別技術(shù)的研究[D];吉林大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張朝陽;語音識別技術(shù)在盲用導(dǎo)航系統(tǒng)中的應(yīng)用[D];北方工業(yè)大學(xué);2011年
2 錢磊;外業(yè)調(diào)繪系統(tǒng)中的語音識別技術(shù)研究[D];長安大學(xué);2015年
3 鄭磊;魯棒性連續(xù)語音識別的研究及其在Android平臺的應(yīng)用[D];電子科技大學(xué);2014年
4 王琳;噪聲環(huán)境下的魯棒語音識別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2016年
5 胡嘉林;基于語音識別技術(shù)的溫室自動化控制系統(tǒng)研究[D];昆明理工大學(xué);2015年
6 楊波;基于語音識別技術(shù)的白馬語言保護(hù)研究[D];蘭州大學(xué);2016年
7 胡寶花;基于HMM-ANN模型的語音識別技術(shù)研究[D];南昌航空大學(xué);2016年
8 羅云;語音識別技術(shù)在超聲波系統(tǒng)中的應(yīng)用[D];四川大學(xué);2005年
9 洪祥元;基于語音識別技術(shù)的智能地球儀系統(tǒng)設(shè)計[D];北京交通大學(xué);2012年
10 陳一寧;英語口語學(xué)習(xí)中的語音識別技術(shù)[D];上海交通大學(xué);2010年
,本文編號:759802
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/759802.html