天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向民航陸空通話的語音識別技術研究

發(fā)布時間:2020-08-05 15:11
【摘要】:陸空通話是管制員與飛行員之間的通話,是飛行指導過程的核心部分?罩薪煌ü苤茊T由于工作強度大,通話壞境嘈雜,很容易誤解聽到的語音,從而導致指揮錯誤,威脅飛行安全。語音自動識別技術可以處理管制語音通話,監(jiān)測管制員的行為,對由錯誤指令造成的危險進行早期告警,是保障陸空通話指令的正確理解、減少事故發(fā)生的一個重要手段。然而,由于民航陸空通話在發(fā)音、語調(diào)等方面具有其特殊性,目前通用的語音自動識別技術不能直接使用。另一方面,民航陸空通話的數(shù)據(jù)具有難以采集和難以標注等特點,識別難度很大。為此,本文在語音自動識別技術面向民航領域里的應用以及提高識別準確率兩方面做深入研究。本文首先深入分析民航陸空通話的特點,然后對常用的一些語音識別技術進行改進,使之適用于民航陸空通話的識別,在此基礎上,采用深度神經(jīng)網(wǎng)絡、遷移學習和語種識別等技術來解決民航陸空通話語音識別中的關鍵問題,降低識別的錯誤率。本文工作具體如下:1.中英文民航路空通話的語種識別研究。首先分析了語種識別的必要性,然后介紹語料庫構(gòu)建的方法,接著在分析比較語種識別相關的模型與方法的基礎上,選取適當?shù)哪P秃头椒?提出適用于中英文民航陸空通話的語種識別方法,最后使用中英文民航陸空通話數(shù)據(jù)構(gòu)建了語種識別系統(tǒng)并進行了測試和評估。2.基于GMM-HMM的中英文民航陸空通話語音識別研究。首先對民航陸空通話的數(shù)據(jù)進行分析,然后在卡內(nèi)基梅隆大學CMUDICT字典和CE-DICT字典基礎上,半自動地構(gòu)建了中文、英文民航陸空通話字典,接著采用GMM-HMM模型分別對民航陸空通話數(shù)據(jù)訓練了聲學模型,最后構(gòu)建了中英文民航陸空通話語音識別系統(tǒng),并使用測試數(shù)據(jù)測試了中英文模型的識別率。3.基于深度學習的中英文民航陸空通話的語音識別研究。為了進一步提高語音識別系統(tǒng)的識別率,以深度學習為基礎,研究了DNN-HMM的聲學建模方法,提出了一種適用于中英文民航陸空通話的DNN網(wǎng)絡結(jié)構(gòu)并構(gòu)建了中英文民航陸空通話語音識別系統(tǒng),并進行了實驗和結(jié)果分析。4.基于遷移學習的跨語言深度神經(jīng)網(wǎng)絡聲學模型的構(gòu)建,以及基于深度學習的中英文民航陸空通話語音識別系統(tǒng)的搭建。針對中英文民航陸空通話語料數(shù)據(jù)量小的缺點,分析比較常用的遷移學習方法,提出了一種新的遷移學習方法,將領域外知識遷移至語料資源少的民航陸空通話語音識別系統(tǒng)中,并在中英文民航陸空通話語音識別系統(tǒng)中進行了實驗和識別率的對比分析。
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.34;V355.1
【圖文】:

系統(tǒng)框架,梯度步


L( ) = ( ) 陣為: L( ) = ( ) oid 函數(shù)的參數(shù)向量 w,通常使用的最優(yōu)化算法有:梯度GS 等。由于 L-BFGS 算法不需要選擇梯度步長,而且具的優(yōu)點,本文選用使用 L-BFGS算法進行參數(shù)估計。析是 Kaldi。Kaldi 是一個自由、開源的語音識別工具庫[42],別系統(tǒng)、文檔和用于構(gòu)建整個識別系統(tǒng)的腳本和代碼,其持 GMM、HMM、DNN、Bottleneck、Tandem、RNN、要用于語音識別的研究,此外,它還被用于其他方面的關鍵詞搜索等。Kaldi的框架如圖 3.4所示。

拓撲結(jié)構(gòu)圖,靜音,拓撲結(jié)構(gòu),音素


在進行聲學模型訓練之前,先要選擇合適的聲學建模單元,常用的建模單元有:單詞、和音素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小,適詞匯量較大的連續(xù)語音識別系統(tǒng),因此,文本針對民航陸空通話語料庫的特點,選用音素聲學模型的建模單元。在進行單音素模型的訓練之前,首先要定義 HMM 的拓撲結(jié)構(gòu)。經(jīng)過比較常用的拓撲結(jié)文針對民航陸空通話數(shù)據(jù)集的特點,對靜音音素 HMM 和非靜音音素 HMM 如使用了不同構(gòu),如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個發(fā)射狀態(tài)和一個啞狀態(tài),靜音音素 5個狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測矢量,只用于連接到下一個音素圖 4.1 非靜音音素的拓撲結(jié)構(gòu)

拓撲結(jié)構(gòu)圖,拓撲結(jié)構(gòu),音素,陸空


南京航空航天大學全日制專業(yè)學位碩士學位論文2 單音素模型訓練進行聲學模型訓練之前,先要選擇合適的聲學建模單元,常用的建模單元有:單素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小量較大的連續(xù)語音識別系統(tǒng),因此,文本針對民航陸空通話語料庫的特點,選用模型的建模單元。進行單音素模型的訓練之前,首先要定義 HMM 的拓撲結(jié)構(gòu)。經(jīng)過比較常用的拓對民航陸空通話數(shù)據(jù)集的特點,對靜音音素 HMM 和非靜音音素 HMM 如使用了如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個發(fā)射狀態(tài)和一個啞狀態(tài),靜音狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測矢量,只用于連接到下一個

【參考文獻】

相關期刊論文 前7條

1 袁偉偉;胡軍;劉萬鳳;;空管模擬訓練中指令的語音識別與合成技術研究[J];電子設計工程;2013年06期

2 王光艷;趙曉群;王霞;;基于MATLAB GUI的語音信號特征提取系統(tǒng)設計[J];河北工業(yè)大學學報;2010年04期

3 王安娜;王勤萬;劉俊芳;袁文靜;;改進的語音特征提取方法及其應用[J];計算機工程;2008年05期

4 劉敬偉;肖熙;;實用環(huán)境語音識別魯棒性技術研究與展望[J];計算機工程與應用;2006年24期

5 彭志勇;王丹霞;;語音識別技術在DRS雷達模擬機系統(tǒng)中的實現(xiàn)[J];中國民航飛行學院學報;2006年02期

6 揭克堅,張建偉,游志勝;DRS航管雷達模擬機自動機長語音技術研究[J];計算機應用;2001年06期

7 吳土星;;飛行安全與空中交通管制指令[J];民航經(jīng)濟與技術;1994年04期

相關碩士學位論文 前5條

1 張志輝;基于民航陸空對話的語音識別關鍵技術研究[D];中國民航大學;2017年

2 劉萬鳳;語音指令識別在陸空通話(英語)中的應用技術研究[D];南京航空航天大學;2012年

3 夏拓;基于HTK的嵌入式語音識別系統(tǒng)設計與優(yōu)化[D];華南理工大學;2012年

4 彭志勇;語音識別功能在DRS2000雷達模擬機系統(tǒng)中的設計與實現(xiàn)[D];四川大學;2006年

5 鄒榮;大詞匯量連續(xù)語音識別系統(tǒng)中統(tǒng)計語言模型的研究[D];北京郵電大學;2006年



本文編號:2781661

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2781661.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶f6096***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com