基于HTK的麥克風陣列語音識別方法的研究
發(fā)布時間:2018-01-05 11:08
本文關鍵詞:基于HTK的麥克風陣列語音識別方法的研究 出處:《遼寧工業(yè)大學》2015年碩士論文 論文類型:學位論文
更多相關文章: 麥克風陣列 語音識別 HTK 聲學模型 陣列參數(shù)優(yōu)化
【摘要】:自動語音識別系統(tǒng)能夠很好地識別無噪聲干擾環(huán)境下的純凈語音。然而,在實際環(huán)境中通常會存在噪聲和混響等,這些無疑會影響語音識別的效果。特別是當麥克風與用戶間有一定的距離時,麥克風捕獲的語音信號質(zhì)量會迅速降低,,使得語音識別系統(tǒng)的識別效果迅速變差。把麥克風陣列作為語音識別系統(tǒng)的前端,減少噪聲干擾對系統(tǒng)識別率的影響,進而改善噪聲環(huán)境下遠距離語音識別系統(tǒng)的性能。 論文首先描述了語音特征參數(shù)、聲學模型和語言學模型等語音識別的基礎理論。接著,系統(tǒng)地研究了基于陣列參數(shù)優(yōu)化的麥克風陣列語音識別方法。然后,分別說明了改進的實驗平臺設計和實現(xiàn)陣列語音識別的方法。 麥克風陣列語音識別包括麥克風陣列信號的處理和語音識別兩部分,現(xiàn)有絕大多數(shù)的研究方法是先語音增強再語音識別即兩部分進行獨立研究的方法。論文采用聯(lián)合陣列信號處理和語音識別的方法,即基于陣列參數(shù)優(yōu)化的多通道語音識別方法,該方法能夠增強有利于識別的語音信號分量,有效地提高系統(tǒng)識別率。論文以HTK(隱馬爾可夫模型工具集)作為基礎平臺實現(xiàn)了基于陣列參數(shù)優(yōu)化的麥克風陣列語音識別。通過分析漢語語言獨有的發(fā)音特征,結合HTK模塊訓練了相應的聲學隱馬爾可夫模型和語言學模型。同時,設計了決策樹所依賴的問題集,以有利于決策樹的搭建,從而改進了聲學模型,得到了一套以連續(xù)漢語為基礎的特有的聲學模型參數(shù),從而搭建了優(yōu)化后的麥克風陣列連續(xù)漢語語音識別的實驗基礎平臺?紤]到DOS環(huán)境下單獨調(diào)用HTK各個模塊實現(xiàn)語音識別的步驟繁瑣,采用MATLAB編程調(diào)用HTK模塊的方法,代替單獨調(diào)用HTK模塊的方法,精簡了實驗的操作步驟,提高了實驗效率。結合MATLAB和HTK工具,對各類方法在不同信噪比情況下的語音識別性能做了實驗。仿真實驗結果表明,在低信噪比的背景環(huán)境下,基于陣列參數(shù)優(yōu)化的麥克風陣列語音識別系統(tǒng)有較好的魯棒性能。
[Abstract]:However , the quality of speech signal captured by the microphone can decrease rapidly when there is a certain distance between the microphone and the user , so that the recognition effect of the speech recognition system is rapidly degraded . The microphone array is used as the front end of the speech recognition system , the influence of noise interference on the system identification rate is reduced , and the performance of the remote speech recognition system in the noise environment is improved . Firstly , the basic theory of speech recognition , such as speech feature parameters , acoustic model and linguistic model , is described . Then , the method of microphone array speech recognition based on array parameter optimization is systematically studied . Then , the improved experimental platform design and the method of realizing array speech recognition are described . The speech recognition of microphone array includes two parts : processing of microphone array signal and speech recognition .
【學位授予單位】:遼寧工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.34;TN643
【參考文獻】
相關期刊論文 前10條
1 王彪;;基于LPCC參數(shù)的語音識別系統(tǒng)[J];電子設計工程;2012年07期
2 楊立春;錢l勌
本文編號:1382851
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/1382851.html
教材專著