面向民航陸空通話的語音識別技術(shù)研究
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.34;V355.1
【圖文】:
L( ) = ( ) 陣為: L( ) = ( ) oid 函數(shù)的參數(shù)向量 w,通常使用的最優(yōu)化算法有:梯度GS 等。由于 L-BFGS 算法不需要選擇梯度步長,而且具的優(yōu)點(diǎn),本文選用使用 L-BFGS算法進(jìn)行參數(shù)估計(jì)。析是 Kaldi。Kaldi 是一個(gè)自由、開源的語音識別工具庫[42],別系統(tǒng)、文檔和用于構(gòu)建整個(gè)識別系統(tǒng)的腳本和代碼,其持 GMM、HMM、DNN、Bottleneck、Tandem、RNN、要用于語音識別的研究,此外,它還被用于其他方面的關(guān)鍵詞搜索等。Kaldi的框架如圖 3.4所示。
在進(jìn)行聲學(xué)模型訓(xùn)練之前,先要選擇合適的聲學(xué)建模單元,常用的建模單元有:單詞、和音素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小,適詞匯量較大的連續(xù)語音識別系統(tǒng),因此,文本針對民航陸空通話語料庫的特點(diǎn),選用音素聲學(xué)模型的建模單元。在進(jìn)行單音素模型的訓(xùn)練之前,首先要定義 HMM 的拓?fù)浣Y(jié)構(gòu)。經(jīng)過比較常用的拓?fù)浣Y(jié)文針對民航陸空通話數(shù)據(jù)集的特點(diǎn),對靜音音素 HMM 和非靜音音素 HMM 如使用了不同構(gòu),如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個(gè)發(fā)射狀態(tài)和一個(gè)啞狀態(tài),靜音音素 5個(gè)狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測矢量,只用于連接到下一個(gè)音素圖 4.1 非靜音音素的拓?fù)浣Y(jié)構(gòu)
南京航空航天大學(xué)全日制專業(yè)學(xué)位碩士學(xué)位論文2 單音素模型訓(xùn)練進(jìn)行聲學(xué)模型訓(xùn)練之前,先要選擇合適的聲學(xué)建模單元,常用的建模單元有:單素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小量較大的連續(xù)語音識別系統(tǒng),因此,文本針對民航陸空通話語料庫的特點(diǎn),選用模型的建模單元。進(jìn)行單音素模型的訓(xùn)練之前,首先要定義 HMM 的拓?fù)浣Y(jié)構(gòu)。經(jīng)過比較常用的拓對民航陸空通話數(shù)據(jù)集的特點(diǎn),對靜音音素 HMM 和非靜音音素 HMM 如使用了如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個(gè)發(fā)射狀態(tài)和一個(gè)啞狀態(tài),靜音狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測矢量,只用于連接到下一個(gè)
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 袁偉偉;胡軍;劉萬鳳;;空管模擬訓(xùn)練中指令的語音識別與合成技術(shù)研究[J];電子設(shè)計(jì)工程;2013年06期
2 王光艷;趙曉群;王霞;;基于MATLAB GUI的語音信號特征提取系統(tǒng)設(shè)計(jì)[J];河北工業(yè)大學(xué)學(xué)報(bào);2010年04期
3 王安娜;王勤萬;劉俊芳;袁文靜;;改進(jìn)的語音特征提取方法及其應(yīng)用[J];計(jì)算機(jī)工程;2008年05期
4 劉敬偉;肖熙;;實(shí)用環(huán)境語音識別魯棒性技術(shù)研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年24期
5 彭志勇;王丹霞;;語音識別技術(shù)在DRS雷達(dá)模擬機(jī)系統(tǒng)中的實(shí)現(xiàn)[J];中國民航飛行學(xué)院學(xué)報(bào);2006年02期
6 揭克堅(jiān),張建偉,游志勝;DRS航管雷達(dá)模擬機(jī)自動(dòng)機(jī)長語音技術(shù)研究[J];計(jì)算機(jī)應(yīng)用;2001年06期
7 吳土星;;飛行安全與空中交通管制指令[J];民航經(jīng)濟(jì)與技術(shù);1994年04期
相關(guān)碩士學(xué)位論文 前5條
1 張志輝;基于民航陸空對話的語音識別關(guān)鍵技術(shù)研究[D];中國民航大學(xué);2017年
2 劉萬鳳;語音指令識別在陸空通話(英語)中的應(yīng)用技術(shù)研究[D];南京航空航天大學(xué);2012年
3 夏拓;基于HTK的嵌入式語音識別系統(tǒng)設(shè)計(jì)與優(yōu)化[D];華南理工大學(xué);2012年
4 彭志勇;語音識別功能在DRS2000雷達(dá)模擬機(jī)系統(tǒng)中的設(shè)計(jì)與實(shí)現(xiàn)[D];四川大學(xué);2006年
5 鄒榮;大詞匯量連續(xù)語音識別系統(tǒng)中統(tǒng)計(jì)語言模型的研究[D];北京郵電大學(xué);2006年
本文編號:2781661
本文鏈接:http://sikaile.net/kejilunwen/wltx/2781661.html