面向民航陸空通話的語音識別技術研究
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.34;V355.1
【圖文】:
L( ) = ( ) 陣為: L( ) = ( ) oid 函數(shù)的參數(shù)向量 w,通常使用的最優(yōu)化算法有:梯度GS 等。由于 L-BFGS 算法不需要選擇梯度步長,而且具的優(yōu)點,本文選用使用 L-BFGS算法進行參數(shù)估計。析是 Kaldi。Kaldi 是一個自由、開源的語音識別工具庫[42],別系統(tǒng)、文檔和用于構(gòu)建整個識別系統(tǒng)的腳本和代碼,其持 GMM、HMM、DNN、Bottleneck、Tandem、RNN、要用于語音識別的研究,此外,它還被用于其他方面的關鍵詞搜索等。Kaldi的框架如圖 3.4所示。
在進行聲學模型訓練之前,先要選擇合適的聲學建模單元,常用的建模單元有:單詞、和音素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小,適詞匯量較大的連續(xù)語音識別系統(tǒng),因此,文本針對民航陸空通話語料庫的特點,選用音素聲學模型的建模單元。在進行單音素模型的訓練之前,首先要定義 HMM 的拓撲結(jié)構(gòu)。經(jīng)過比較常用的拓撲結(jié)文針對民航陸空通話數(shù)據(jù)集的特點,對靜音音素 HMM 和非靜音音素 HMM 如使用了不同構(gòu),如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個發(fā)射狀態(tài)和一個啞狀態(tài),靜音音素 5個狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測矢量,只用于連接到下一個音素圖 4.1 非靜音音素的拓撲結(jié)構(gòu)
南京航空航天大學全日制專業(yè)學位碩士學位論文2 單音素模型訓練進行聲學模型訓練之前,先要選擇合適的聲學建模單元,常用的建模單元有:單素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小量較大的連續(xù)語音識別系統(tǒng),因此,文本針對民航陸空通話語料庫的特點,選用模型的建模單元。進行單音素模型的訓練之前,首先要定義 HMM 的拓撲結(jié)構(gòu)。經(jīng)過比較常用的拓對民航陸空通話數(shù)據(jù)集的特點,對靜音音素 HMM 和非靜音音素 HMM 如使用了如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個發(fā)射狀態(tài)和一個啞狀態(tài),靜音狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測矢量,只用于連接到下一個
【參考文獻】
相關期刊論文 前7條
1 袁偉偉;胡軍;劉萬鳳;;空管模擬訓練中指令的語音識別與合成技術研究[J];電子設計工程;2013年06期
2 王光艷;趙曉群;王霞;;基于MATLAB GUI的語音信號特征提取系統(tǒng)設計[J];河北工業(yè)大學學報;2010年04期
3 王安娜;王勤萬;劉俊芳;袁文靜;;改進的語音特征提取方法及其應用[J];計算機工程;2008年05期
4 劉敬偉;肖熙;;實用環(huán)境語音識別魯棒性技術研究與展望[J];計算機工程與應用;2006年24期
5 彭志勇;王丹霞;;語音識別技術在DRS雷達模擬機系統(tǒng)中的實現(xiàn)[J];中國民航飛行學院學報;2006年02期
6 揭克堅,張建偉,游志勝;DRS航管雷達模擬機自動機長語音技術研究[J];計算機應用;2001年06期
7 吳土星;;飛行安全與空中交通管制指令[J];民航經(jīng)濟與技術;1994年04期
相關碩士學位論文 前5條
1 張志輝;基于民航陸空對話的語音識別關鍵技術研究[D];中國民航大學;2017年
2 劉萬鳳;語音指令識別在陸空通話(英語)中的應用技術研究[D];南京航空航天大學;2012年
3 夏拓;基于HTK的嵌入式語音識別系統(tǒng)設計與優(yōu)化[D];華南理工大學;2012年
4 彭志勇;語音識別功能在DRS2000雷達模擬機系統(tǒng)中的設計與實現(xiàn)[D];四川大學;2006年
5 鄒榮;大詞匯量連續(xù)語音識別系統(tǒng)中統(tǒng)計語言模型的研究[D];北京郵電大學;2006年
本文編號:2781661
本文鏈接:http://sikaile.net/kejilunwen/wltx/2781661.html