基于HMM和ANN混合模型的語(yǔ)音識(shí)別技術(shù)的研究
本文關(guān)鍵詞:基于HMM和ANN混合模型的語(yǔ)音識(shí)別技術(shù)的研究
更多相關(guān)文章: 端點(diǎn)檢測(cè) 隱馬爾可夫 人工神經(jīng)網(wǎng)絡(luò) 高斯混合模型
【摘要】:近年來(lái),在非特定人的連續(xù)詞語(yǔ)音識(shí)別技術(shù)方面取得了很大進(jìn)步,人工智能和機(jī)器學(xué)習(xí)已經(jīng)成為一個(gè)非常熱門的研究領(lǐng)域。語(yǔ)音識(shí)別雖然在理論上的研究已經(jīng)取得了比較大的進(jìn)展,但是在實(shí)際應(yīng)用中仍然有很多難點(diǎn)。其中主要包括:第一,在實(shí)際應(yīng)用開(kāi)發(fā)過(guò)程中,語(yǔ)音訓(xùn)練樣本數(shù)量往往比較有限,這將導(dǎo)致模型的參數(shù)訓(xùn)練不夠充分,從而影響語(yǔ)音識(shí)別率。第二,由于環(huán)境中往往存在各種噪聲,而噪聲會(huì)對(duì)識(shí)別結(jié)果造成比較大的影響。本文針對(duì)以上難點(diǎn)提出了相應(yīng)的解決方案。針對(duì)第一個(gè)難點(diǎn)引入了子空間高斯混合模型(SGMM),針對(duì)第二個(gè)難點(diǎn)引入了隱馬爾可夫(HMM)和人工神經(jīng)網(wǎng)絡(luò)(ANN)的混合模型。論文的主要研究?jī)?nèi)容包括如下:(1)論文介紹了語(yǔ)音識(shí)別的基本技術(shù)原理,主要包括預(yù)加重、加窗分幀和端點(diǎn)檢測(cè)。針對(duì)傳統(tǒng)雙門限端點(diǎn)檢測(cè)算法在噪聲環(huán)境下檢測(cè)的不足,本文提出了改進(jìn)的端點(diǎn)檢測(cè)算法,端點(diǎn)檢測(cè)的準(zhǔn)確率得到了約7%的提高。(2)論文介紹了特征提取中的線性預(yù)測(cè)系數(shù)(LPC)、線性預(yù)測(cè)倒譜系數(shù)(LPCC)和梅爾頻率倒譜系數(shù)(MFCC)。對(duì)LPCC和MFCC做了對(duì)比分析,選擇了更符合人耳聽(tīng)覺(jué)特性的MFCC作為語(yǔ)音識(shí)別的特征提取參數(shù)。(3)在語(yǔ)音識(shí)別的實(shí)際應(yīng)用中,針對(duì)語(yǔ)音訓(xùn)練樣本數(shù)據(jù)比較有限導(dǎo)致模型參數(shù)訓(xùn)練不夠充分的情況,本文引入了SGMM模型,并對(duì)HMM+SGMM模型的原理進(jìn)行了詳細(xì)的介紹和分析。(4)論文首先針對(duì)不同數(shù)據(jù)量的訓(xùn)練樣本對(duì)HMM模型和HMM+SGMM模型分別進(jìn)行了測(cè)試,然后對(duì)HMM+SGMM模型在噪聲環(huán)境下進(jìn)行了測(cè)試。實(shí)驗(yàn)結(jié)果表明:在語(yǔ)音訓(xùn)練樣本有限的情況下,引入子空間高斯混合模型是一種有效的模型優(yōu)化手段;在噪聲環(huán)境下HMM+SGMM模型仍然具有較好的識(shí)別效果;改進(jìn)的端點(diǎn)檢測(cè)算法對(duì)HMM+SGMM模型仍然適用。(5)針對(duì)HMM通常只在無(wú)噪聲語(yǔ)音環(huán)境下具有比較好的識(shí)別效果,噪聲環(huán)境下的語(yǔ)音識(shí)別率卻較低。論文引入了HMM+ANN混合模型,并對(duì)HMM和HMM+ANN模型在信噪比為5-35dB的環(huán)境下做了實(shí)驗(yàn)測(cè)試,結(jié)果表明HMM+ANN模型的識(shí)別率明顯高于HMM模型的識(shí)別率。論文也對(duì)改進(jìn)的端點(diǎn)檢測(cè)算法也做了測(cè)試,改進(jìn)算法在噪聲環(huán)境下對(duì)兩種模型的識(shí)別率都有一定改善。
【關(guān)鍵詞】:端點(diǎn)檢測(cè) 隱馬爾可夫 人工神經(jīng)網(wǎng)絡(luò) 高斯混合模型
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-14
- 1.1 語(yǔ)音識(shí)別介紹10
- 1.2 課題研究的背景和意義10
- 1.3 語(yǔ)音識(shí)別研究與應(yīng)用現(xiàn)狀10-12
- 1.4 本文的主要研究?jī)?nèi)容12-13
- 1.5 論文結(jié)構(gòu)安排13-14
- 第二章 語(yǔ)音識(shí)別技術(shù)的基本原理分析14-35
- 2.1 語(yǔ)音信號(hào)的預(yù)處理14-18
- 2.1.1 語(yǔ)音信號(hào)的數(shù)字化14-15
- 2.1.2 語(yǔ)音信號(hào)預(yù)加重15-17
- 2.1.3 語(yǔ)音信號(hào)加窗分幀17-18
- 2.2 傳統(tǒng)的端點(diǎn)檢測(cè)算法及其改進(jìn)18-24
- 2.3 改進(jìn)端點(diǎn)檢測(cè)算法實(shí)驗(yàn)及結(jié)果分析24-29
- 2.4 特征提取分析29-34
- 2.5 本章小結(jié)34-35
- 第三章 子空間高斯混合模型的研究與分析35-46
- 3.1 隱馬爾可夫模型35-38
- 3.1.1 隱馬爾可夫模型的介紹35
- 3.1.2 隱馬爾可夫模型的關(guān)鍵問(wèn)題35-38
- 3.1.2.1 前向算法(評(píng)估問(wèn)題)36
- 3.1.2.2 Viterbi算法(解碼問(wèn)題)36-37
- 3.1.2.3 Baum-welch算法(訓(xùn)練問(wèn)題)37-38
- 3.2 隱馬爾可夫模型的不足38-39
- 3.3 子空間高斯混合模型39-41
- 3.3.1 基本模型39-40
- 3.3.2 模型擴(kuò)展40-41
- 3.3.3 通用背景模型41
- 3.4 訓(xùn)練步驟41-44
- 3.4.1 UBM初始化及訓(xùn)練42-43
- 3.4.2 特征參數(shù)變換43
- 3.4.3 子空間模型初始化43-44
- 3.5 概率計(jì)算44
- 3.5.1 全局優(yōu)先計(jì)算44
- 3.5.2 高斯概率計(jì)算44
- 3.6 模型完整訓(xùn)練44-45
- 3.7 本章小結(jié)45-46
- 第四章 中文子空間高斯混合模型語(yǔ)音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)46-63
- 4.1 Kaldi語(yǔ)音識(shí)別系統(tǒng)46-47
- 4.2 Kaldi數(shù)據(jù)準(zhǔn)備47-51
- 4.3 語(yǔ)言模型51-52
- 4.4 模型訓(xùn)練52-54
- 4.5 實(shí)驗(yàn)及結(jié)果分析54-62
- 4.6 本章小結(jié)62-63
- 第五章 HMM和改進(jìn)的ANN混合模型語(yǔ)音識(shí)別的研究與實(shí)現(xiàn)63-77
- 5.1 人工神經(jīng)網(wǎng)絡(luò)63-69
- 5.1.1 BP神經(jīng)網(wǎng)絡(luò)及其學(xué)習(xí)算法63-66
- 5.1.2 受限玻爾茲曼網(wǎng)絡(luò)RBM及其學(xué)習(xí)算法66-68
- 5.1.3 改進(jìn)的神經(jīng)網(wǎng)絡(luò)模型68-69
- 5.2 基于HMM-ANN混合模型的語(yǔ)音識(shí)別系統(tǒng)69-76
- 5.2.1 實(shí)驗(yàn)及結(jié)果分析69-76
- 5.3 本章小結(jié)76-77
- 第六章 總結(jié)與展望77-79
- 6.1 全文總結(jié)77-78
- 6.2 展望78-79
- 致謝79-80
- 參考文獻(xiàn)80-83
- 攻讀碩士學(xué)位期間取得的成果83-84
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;飛利浦推出最新語(yǔ)音識(shí)別技術(shù)[J];現(xiàn)代通信;2000年08期
2 劉朝陽(yáng);語(yǔ)音識(shí)別技術(shù)的未來(lái)[J];互聯(lián)網(wǎng)周刊;2000年07期
3 ;語(yǔ)音識(shí)別技術(shù)的產(chǎn)業(yè)化[J];金卡工程;2002年12期
4 劉云冰;;語(yǔ)音識(shí)別技術(shù)的回顧與展望[J];軟件導(dǎo)刊;2005年13期
5 賀無(wú)名;;語(yǔ)音識(shí)別技術(shù)及其研究進(jìn)展[J];中國(guó)科技信息;2006年18期
6 黃昆;;嵌入式,語(yǔ)音識(shí)別技術(shù)新趨向[J];中國(guó)計(jì)算機(jī)用戶;2006年45期
7 高新濤;陳乖麗;;語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景[J];甘肅科技縱橫;2007年04期
8 任杰;;語(yǔ)音識(shí)別技術(shù)概述[J];大眾科技;2010年08期
9 廖锎;;淺析語(yǔ)音識(shí)別技術(shù)的發(fā)展及趨勢(shì)[J];科技傳播;2010年17期
10 ;谷歌推出手機(jī)語(yǔ)音識(shí)別技術(shù)[J];電腦與電信;2010年08期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 蔡偉建;;人工神經(jīng)網(wǎng)絡(luò)理論在語(yǔ)音識(shí)別技術(shù)中的應(yīng)用[A];第八屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2010年
2 張化云;韓兆兵;徐波;;語(yǔ)音服務(wù)器中的語(yǔ)音識(shí)別技術(shù)[A];開(kāi)創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2001年
3 方棣棠;李樹(shù)青;;語(yǔ)音識(shí)別技術(shù)突破之路——如何使語(yǔ)音識(shí)別技術(shù)走向?qū)嵱肹A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
4 賈磊;;深度神經(jīng)網(wǎng)絡(luò)建模的最新工業(yè)進(jìn)展和結(jié)合語(yǔ)義理解的語(yǔ)音識(shí)別技術(shù)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
5 趙美澤;王峰;;基于消除混響的語(yǔ)音識(shí)別技術(shù)研究[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(下)[C];2008年
6 蔡志博;俞鐵城;;語(yǔ)音識(shí)別技術(shù)的應(yīng)用[A];西部大開(kāi)發(fā) 科教先行與可持續(xù)發(fā)展——中國(guó)科協(xié)2000年學(xué)術(shù)年會(huì)文集[C];2000年
7 呂成國(guó);趙冰;;低信噪比下語(yǔ)音識(shí)別技術(shù)的研究[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年
8 魏峰;徐成;曾祺;;基于HMM的語(yǔ)音識(shí)別技術(shù)研究[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
9 黃媛;俞舸;呂士楠;;車載識(shí)別庫(kù)的設(shè)計(jì)和制作[A];中國(guó)聲學(xué)學(xué)會(huì)2006年全國(guó)聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年
10 張茹;韓紀(jì)慶;;基于DTW算法的自動(dòng)發(fā)音錯(cuò)誤檢測(cè)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 陳琳;語(yǔ)音識(shí)別技術(shù)升級(jí),人機(jī)對(duì)話時(shí)代來(lái)臨[N];第一財(cái)經(jīng)日?qǐng)?bào);2007年
2 京晨;中科院最新語(yǔ)音識(shí)別技術(shù)面世[N];福建科技報(bào);2002年
3 IBM中國(guó)研究中心 沈麗琴博士;語(yǔ)音識(shí)別技術(shù)離我們有多遠(yuǎn)[N];光明日?qǐng)?bào);2000年
4 ;語(yǔ)音識(shí)別技術(shù)前景誘人[N];人民郵電;2001年
5 ;用語(yǔ)言“改變”世界[N];計(jì)算機(jī)世界;2001年
6 英國(guó)《經(jīng)濟(jì)學(xué)人》;有錯(cuò)請(qǐng)糾正:語(yǔ)音識(shí)別技術(shù)新進(jìn)展[N];世界報(bào);2010年
7 ;精彩演繹語(yǔ)音識(shí)別技術(shù)[N];人民郵電;2001年
8 記者 王雙;我市參加第九屆“高交會(huì)”收獲成果[N];盤錦日?qǐng)?bào);2007年
9 記者 薛冬;中文語(yǔ)音識(shí)別技術(shù)取得突破[N];光明日?qǐng)?bào);2002年
10 王朝選;科大訊飛語(yǔ)音識(shí)別技術(shù)取得重大進(jìn)展[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語(yǔ)音識(shí)別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
2 張軍;抗噪聲語(yǔ)音識(shí)別技術(shù)的研究[D];華南理工大學(xué);2003年
3 董婧;魯棒語(yǔ)音識(shí)別技術(shù)的研究[D];吉林大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張朝陽(yáng);語(yǔ)音識(shí)別技術(shù)在盲用導(dǎo)航系統(tǒng)中的應(yīng)用[D];北方工業(yè)大學(xué);2011年
2 楊波;基于語(yǔ)音識(shí)別技術(shù)的白馬語(yǔ)言保護(hù)研究[D];蘭州大學(xué);2016年
3 胡寶花;基于HMM-ANN模型的語(yǔ)音識(shí)別技術(shù)研究[D];南昌航空大學(xué);2016年
4 蔣玉博;基于HMM和ANN混合模型的語(yǔ)音識(shí)別技術(shù)的研究[D];電子科技大學(xué);2016年
5 羅云;語(yǔ)音識(shí)別技術(shù)在超聲波系統(tǒng)中的應(yīng)用[D];四川大學(xué);2005年
6 洪祥元;基于語(yǔ)音識(shí)別技術(shù)的智能地球儀系統(tǒng)設(shè)計(jì)[D];北京交通大學(xué);2012年
7 陳一寧;英語(yǔ)口語(yǔ)學(xué)習(xí)中的語(yǔ)音識(shí)別技術(shù)[D];上海交通大學(xué);2010年
8 李晨;結(jié)合語(yǔ)音識(shí)別技術(shù)的音樂(lè)哼唱檢索研究[D];西北大學(xué);2008年
9 胡嘉林;基于語(yǔ)音識(shí)別技術(shù)的溫室自動(dòng)化控制系統(tǒng)研究[D];昆明理工大學(xué);2015年
10 燕濤;基于嵌入式語(yǔ)音識(shí)別技術(shù)的研究[D];大慶石油學(xué)院;2009年
,本文編號(hào):646388
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/646388.html