遠(yuǎn)距離混合語(yǔ)音識(shí)別方法的研究
本文關(guān)鍵詞:遠(yuǎn)距離混合語(yǔ)音識(shí)別方法的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:常規(guī)語(yǔ)音識(shí)別方法在無(wú)干擾噪聲的安靜環(huán)境下具有較高的識(shí)別率。然而,在實(shí)際封閉環(huán)境中存在著噪聲和混響等干擾,且麥克風(fēng)和語(yǔ)音源之間存在一定的距離時(shí),傳統(tǒng)識(shí)別方法性能急劇下降。此外,單一的語(yǔ)言已經(jīng)滿足不了現(xiàn)代人通信交流的需求。因此,遠(yuǎn)距離混合語(yǔ)音識(shí)別方法的研究成為機(jī)械學(xué)習(xí)與語(yǔ)音處理領(lǐng)域的研究熱點(diǎn)。論文以麥克風(fēng)陣列作為語(yǔ)音識(shí)別前端,利用陣列的空間選擇性,開(kāi)展了實(shí)際聲學(xué)環(huán)境下遠(yuǎn)距離漢英混合語(yǔ)音識(shí)別方法的研究。論文詳細(xì)分析了傳統(tǒng)波束形成語(yǔ)音識(shí)別方法和優(yōu)化陣列參數(shù)語(yǔ)音識(shí)別方法、論述了高斯混合隱馬爾科夫模型(GMM-HMM,Gaussian Mixture Model-Hidden Markov Model)和深度神經(jīng)網(wǎng)絡(luò)(DNN-HMM,Deep Neural Network-Hidden Markov Model)混合聲學(xué)模型,并對(duì)基于優(yōu)化陣列參數(shù)的遠(yuǎn)距離混合語(yǔ)音識(shí)別方法進(jìn)行了仿真實(shí)驗(yàn)研究?紤]到中英文發(fā)音特征及建模單元的不同,論文提出了一種中英文聲學(xué)模型,構(gòu)建了中英文決策樹(shù)所需的問(wèn)題集,得到了中英文混合語(yǔ)音聲學(xué)模型參數(shù),采用陣列優(yōu)化參數(shù)實(shí)現(xiàn)了遠(yuǎn)距離混合語(yǔ)音識(shí)別,并基于HTK(The Hidden Markov Model Toolkit)工具箱構(gòu)建了該語(yǔ)音識(shí)別系統(tǒng)。此外,論文采用了超幀的美爾倒譜系數(shù)(MFCC,Mel Frequency Cepstral Coefficients)作為特征參數(shù),利用DNN-HMM方法進(jìn)行聲學(xué)建模,并基于Kaldi工具箱構(gòu)建了大詞匯量深度神經(jīng)網(wǎng)絡(luò)的混合語(yǔ)音識(shí)別系統(tǒng)。兩種方法的仿真實(shí)驗(yàn)結(jié)果表明,后者DNN-HMM聲學(xué)模型下的識(shí)別率高于前者GMM-HMM語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率。
【關(guān)鍵詞】:麥克風(fēng)陣列 遠(yuǎn)距離語(yǔ)音識(shí)別 混合語(yǔ)音聲學(xué)模型 優(yōu)化陣列參數(shù) 深度神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:遼寧工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
- 摘要5-6
- Abstract6-9
- 1 緒論9-15
- 1.1 選題背景及意義9
- 1.2 語(yǔ)音識(shí)別技術(shù)發(fā)展的研究9-13
- 1.2.1 單語(yǔ)種的語(yǔ)音識(shí)別的發(fā)展9-13
- 1.2.2 多語(yǔ)種的語(yǔ)音識(shí)別的發(fā)展13
- 1.3 論文的研究?jī)?nèi)容與安排13-15
- 2 語(yǔ)音識(shí)別的基本理論15-27
- 2.1 語(yǔ)音特征參數(shù)的提取15-17
- 2.1.1 LPCC特征參數(shù)15-16
- 2.1.2 MFCC系數(shù)16-17
- 2.2 隱馬爾科夫聲學(xué)模型17-21
- 2.2.1 HMM的基本思想17-18
- 2.2.2 HMM的基本算法18-20
- 2.2.3 HMM在語(yǔ)音識(shí)別中的應(yīng)用20-21
- 2.3 深度神經(jīng)網(wǎng)絡(luò)的基本原理21-25
- 2.3.1 RBM的基本理論22-23
- 2.3.2 RBM的訓(xùn)練過(guò)程23-24
- 2.3.3 RBM構(gòu)成DNN過(guò)程24-25
- 2.4 語(yǔ)言模型25
- 2.5 解碼模型25-26
- 2.6 本章小結(jié)26-27
- 3 基于優(yōu)化陣列參數(shù)的遠(yuǎn)距離語(yǔ)音識(shí)別方法27-36
- 3.1 基于參數(shù)優(yōu)化的陣列語(yǔ)音識(shí)別方法28-31
- 3.1.1 濾波-求和波束形成28-29
- 3.1.2 優(yōu)化陣列參數(shù)的基本理論29-31
- 3.2 優(yōu)化陣列參數(shù)的具體步驟31-34
- 3.2.1 優(yōu)化狀態(tài)序列31
- 3.2.2 優(yōu)化陣列參數(shù)31-34
- 3.3 實(shí)驗(yàn)結(jié)果與分析34-35
- 3.4 本章小結(jié)35-36
- 4 優(yōu)化決策樹(shù)的遠(yuǎn)距離混合語(yǔ)音識(shí)別方法36-47
- 4.1 中英文兩種語(yǔ)言的區(qū)別36
- 4.1.1 發(fā)音方面的區(qū)別36
- 4.1.2 聲學(xué)單元的選取36
- 4.2 中英文聲學(xué)建模的方法36-37
- 4.3 三音子聲學(xué)模型37-38
- 4.4 基于決策樹(shù)狀態(tài)共享策略38-41
- 4.4.1 問(wèn)題集的設(shè)計(jì)38-40
- 4.4.2 決策樹(shù)的構(gòu)造40-41
- 4.5 實(shí)驗(yàn)結(jié)果與分析41-46
- 4.5.1 仿真環(huán)境及配置41-42
- 4.5.2 識(shí)別評(píng)價(jià)標(biāo)準(zhǔn)42
- 4.5.3 實(shí)驗(yàn)結(jié)果與分析42-46
- 4.6 本章小結(jié)46-47
- 5 基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法47-54
- 5.1 DNN-HMM建模的基本思想47
- 5.2 Kaldi語(yǔ)音工具箱的簡(jiǎn)介47-50
- 5.2.1 基于Kaldi具體實(shí)現(xiàn)DNN訓(xùn)練過(guò)程48-50
- 5.3 實(shí)驗(yàn)結(jié)果與分析50-53
- 5.3.1 數(shù)據(jù)集準(zhǔn)備50
- 5.3.2 預(yù)處理及網(wǎng)絡(luò)參數(shù)配置50
- 5.3.3 實(shí)驗(yàn)結(jié)果與分析50-53
- 5.4 本章小結(jié)53-54
- 6 總結(jié)和展望54-55
- 參考文獻(xiàn)55-58
- 攻讀碩士期間發(fā)表學(xué)術(shù)論文情況58-59
- 致謝59
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期
2 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期
3 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期
4 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期
5 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期
6 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語(yǔ)音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語(yǔ)音識(shí)別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
2 杜樹(shù)木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年
3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽(tīng)覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年
2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年
4 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年
6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
9 上海 高博;讓電腦“聽(tīng)懂”人話[N];電腦報(bào);2008年
10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年
2 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
3 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
4 孫f,
本文編號(hào):254881
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/254881.html