基于CNN的陸空通話語義識別方法
本文關(guān)鍵詞: 陸空通話 卷積神經(jīng)網(wǎng)絡 語義識別 自然語言處理 分類器 出處:《中國民航大學》2017年碩士論文 論文類型:學位論文
【摘要】:在陸空通話過程中,飛行員對管制員的指令進行復誦是保障民航飛行安全的重要措施之一。雖然國際民航組織(International Civil Aviation Organization,ICAO)不斷完善陸空通話標準,但指令復誦失誤依然不可避免。因此,利用計算機輔助判斷復誦過程中是否存在失誤,對提高復誦準確性具有重要價值。近年來,在自然語言處理中,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)取得了突出的效果,所以探索基于CNN模型的陸空通話語義分析與識別方法具有重要的研究意義。主要工作概括如下:(1)建立陸空通話語義分析文本庫。以原始陸空通話錄音為語料,在專業(yè)管制工作人員的指導下,建立陸空通話語義文本數(shù)據(jù)庫。(2)研究了基于傳統(tǒng)CNN的陸空通話語義識別方法。對分詞后的語料庫分別采用one-hot向量和word2vec向量表示每個詞的詞義,然后利用傳統(tǒng)CNN對陸空通話雙方的語句進行處理,得到對應的語義向量。根據(jù)語義向量相似度,利用分類器識別其語義一致性。(3)對傳統(tǒng)CNN模型進行改進,提出了兩種模型。通過改變卷積核的尺寸,提出了第一種改進的CNN模型;將管制員指令語句和飛行員復誦語句轉(zhuǎn)換為一個矩陣作為CNN的輸入,提出了第二種改進的CNN模型。在兩種改進CNN模型上對陸空通話進行語義識別,分別得到語義識別結(jié)果。實驗結(jié)果表明,CNN對陸空通話的語義具有較好的識別效果,并且第二種改進的CNN模型的識別結(jié)果最好,其平均識別精度最高達到84.50%。
[Abstract]:During land-to-air calls. The pilot's repetition of the controller's instructions is one of the most important measures to ensure the safety of civil aviation. Although the International Civil Aviation Organization (ICAO). International Civil Aviation Organization. ICAO) improves the standard of land-to-air communication, but the error of command recitation is still inevitable. Therefore, the use of computer aid to judge whether there are errors in the recitation process. In recent years, in natural language processing, convolution neural networks have been used to improve the volume Neural Network. CNN) has achieved outstanding results. Therefore, it is of great significance to explore the semantic analysis and recognition method of land-to-air communication based on CNN model. The main work is summarized as follows: 1). The semantic analysis database of land-to-air communication is established. The original land-to-air voice recording is used as the corpus. Under the guidance of professional control staff. Establishment of land and air conversation semantic text database. In this paper, the traditional CNN based land-to-air communication semantic recognition method is studied. The one-hot vector and the word2vec vector are used to represent the word meaning of each word in the corpus after word segmentation. Then the traditional CNN is used to deal with the statements of both sides of the land-to-air call, and the corresponding semantic vector is obtained, according to the similarity of the semantic vector. The traditional CNN model is improved by classifier recognition. Two models are proposed. By changing the size of convolution kernel, the first improved CNN model is proposed. The controller command statement and the pilot recitation statement are converted into a matrix as the input of CNN, and a second improved CNN model is proposed. The two improved CNN models are used to identify the land and air conversation semantics. The experimental results show that CNNs have a good recognition effect on the semantics of land-to-air calls, and the second improved CNN model has the best recognition results. The average recognition accuracy is up to 84.50.
【學位授予單位】:中國民航大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:V328.3;TP391.1
【參考文獻】
相關(guān)期刊論文 前7條
1 孫瑞山;汪磊;劉俊杰;;中國民航安全發(fā)展及展望[J];交通信息與安全;2016年04期
2 秦春秀;祝婷;趙捧未;張毅;;自然語言語義分析研究進展[J];圖書情報工作;2014年22期
3 肖婭琳;黃大勇;;民航陸空通話會話分析[J];中國民航飛行學院學報;2013年06期
4 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計算機學報;2011年08期
5 王瑞雷;欒靜;潘曉花;盧修配;;一種改進的中文分詞正向最大匹配算法[J];計算機應用與軟件;2011年03期
6 黃昌寧;趙海;;中文分詞十年回顧[J];中文信息學報;2007年03期
7 王愛國;;陸空通話與飛行安全[J];中國民用航空;2006年01期
相關(guān)碩士學位論文 前9條
1 何鵬程;改進的卷積神經(jīng)網(wǎng)絡模型及其應用研究[D];大連理工大學;2015年
2 郭劍飛;基于LDA多模型中文短文本主題分類體系構(gòu)建與分類[D];哈爾濱工業(yè)大學;2014年
3 李洋;我國民航安全管理系統(tǒng)研究[D];中國海洋大學;2013年
4 蘇勇;基于理解的漢語分詞系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學;2011年
5 林冬盛;中文分詞算法的研究與實現(xiàn)[D];西北大學;2011年
6 劉振鹿;基于LDA的潛在語義空間分析及Web文檔聚類的研究與實現(xiàn)[D];東北大學;2010年
7 暴自強;結(jié)合LSA的文本譜聚類算法研究[D];重慶大學;2010年
8 張旭;一個基于詞典與統(tǒng)計的中文分詞算法[D];電子科技大學;2007年
9 陳治綱;基于向量空間模型的文本分類系統(tǒng)研究與實現(xiàn)[D];天津大學;2005年
,本文編號:1452484
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1452484.html