AIS拼音船名到漢字的智能翻譯技術(shù)
發(fā)布時間:2021-12-11 15:15
針對航海領(lǐng)域中船舶自動識別系統(tǒng)(AIS)無法利用中文給我國使用者帶來的識別障礙問題,研究了AIS拼音信息到漢字的智能翻譯技術(shù).在建立標(biāo)準(zhǔn)化漢字和拼音船名語料庫的基礎(chǔ)上,分別搭建了基于Seq2Seq和Transformer框架的智能船名翻譯的深度學(xué)習(xí)模型.通過在同一數(shù)據(jù)集上的性能對比分析發(fā)現(xiàn),Transformer模型具有更好的效果.為彌補(bǔ)Transformer模型受語料庫規(guī)模限制而帶來的翻譯損失,進(jìn)一步研究了其與隱馬爾科夫鏈(HMM)的聯(lián)合翻譯模型,最終,在測試集上達(dá)到了98.92%的準(zhǔn)確率,實(shí)現(xiàn)了對AIS拼音船名的精準(zhǔn)匹配和合理翻譯.該模型同樣適用于AIS中目的港等拼音信息到漢字的翻譯,對于提升AIS信息使用者的體驗(yàn)具有實(shí)際應(yīng)用價值.
【文章來源】:大連海事大學(xué)學(xué)報. 2020,46(02)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
語料庫構(gòu)建過程
圖2中,每個encoder單元首先對船名拼音在嵌入層進(jìn)行one-hot編碼,然后輸入隱藏層(這里為2個LSTM層)進(jìn)行計算后輸出狀態(tài)向量h(t).非初始encoder單元除接收拼音的輸入,同時,還接收上一個拼音encoder單元輸出的狀態(tài)向量h(t-1),其隱藏層經(jīng)計算后輸出h(t),作為下一個拼音encoder單元的一項(xiàng)輸入.
利用船名語料庫的訓(xùn)練集(16萬余條數(shù)據(jù))和測試集(4萬余條數(shù)據(jù))對Seq2Seq模型進(jìn)行訓(xùn)練和測試,訓(xùn)練的主要參數(shù)設(shè)置如表3所示,訓(xùn)練過程如圖4所示.由圖4可見,訓(xùn)練在50步迭代后準(zhǔn)確率趨于穩(wěn)定,船名100%正確的準(zhǔn)確率大概為28%左右. 表4為從測試集中隨機(jī)抽取的幾條翻譯結(jié)果.
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM的蒙漢機(jī)器翻譯的研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 計算機(jī)工程與科學(xué). 2018(10)
[2]基于統(tǒng)計的漢英機(jī)器翻譯技術(shù)的研究[J]. 趙靜. 電子設(shè)計工程. 2016(21)
[3]船載AIS信息采集與解碼技術(shù)研究[J]. 于光峰. 電子技術(shù)與軟件工程. 2013(21)
[4]一般拓?fù)浣Y(jié)構(gòu)的非齊次隱含馬爾科夫模型及其在中、英文語種辨識中的應(yīng)用[J]. 王作英,孫健. 電子與信息學(xué)報. 2007(04)
[5]機(jī)器學(xué)習(xí)在漢字智能拼音輸入中的應(yīng)用[J]. 巨同升. 山東理工大學(xué)學(xué)報(自然科學(xué)版). 2005(03)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的維漢機(jī)器翻譯研究[D]. 張勝剛.新疆大學(xué) 2018
[2]船舶自動識別系統(tǒng)(AIS)接口數(shù)據(jù)的研究與應(yīng)用[D]. 張穎.大連海事大學(xué) 2009
[3]基于統(tǒng)計的漢英機(jī)器翻譯技術(shù)的研究[D]. 魏瑾.國防科學(xué)技術(shù)大學(xué) 2006
本文編號:3534905
【文章來源】:大連海事大學(xué)學(xué)報. 2020,46(02)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
語料庫構(gòu)建過程
圖2中,每個encoder單元首先對船名拼音在嵌入層進(jìn)行one-hot編碼,然后輸入隱藏層(這里為2個LSTM層)進(jìn)行計算后輸出狀態(tài)向量h(t).非初始encoder單元除接收拼音的輸入,同時,還接收上一個拼音encoder單元輸出的狀態(tài)向量h(t-1),其隱藏層經(jīng)計算后輸出h(t),作為下一個拼音encoder單元的一項(xiàng)輸入.
利用船名語料庫的訓(xùn)練集(16萬余條數(shù)據(jù))和測試集(4萬余條數(shù)據(jù))對Seq2Seq模型進(jìn)行訓(xùn)練和測試,訓(xùn)練的主要參數(shù)設(shè)置如表3所示,訓(xùn)練過程如圖4所示.由圖4可見,訓(xùn)練在50步迭代后準(zhǔn)確率趨于穩(wěn)定,船名100%正確的準(zhǔn)確率大概為28%左右. 表4為從測試集中隨機(jī)抽取的幾條翻譯結(jié)果.
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM的蒙漢機(jī)器翻譯的研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 計算機(jī)工程與科學(xué). 2018(10)
[2]基于統(tǒng)計的漢英機(jī)器翻譯技術(shù)的研究[J]. 趙靜. 電子設(shè)計工程. 2016(21)
[3]船載AIS信息采集與解碼技術(shù)研究[J]. 于光峰. 電子技術(shù)與軟件工程. 2013(21)
[4]一般拓?fù)浣Y(jié)構(gòu)的非齊次隱含馬爾科夫模型及其在中、英文語種辨識中的應(yīng)用[J]. 王作英,孫健. 電子與信息學(xué)報. 2007(04)
[5]機(jī)器學(xué)習(xí)在漢字智能拼音輸入中的應(yīng)用[J]. 巨同升. 山東理工大學(xué)學(xué)報(自然科學(xué)版). 2005(03)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的維漢機(jī)器翻譯研究[D]. 張勝剛.新疆大學(xué) 2018
[2]船舶自動識別系統(tǒng)(AIS)接口數(shù)據(jù)的研究與應(yīng)用[D]. 張穎.大連海事大學(xué) 2009
[3]基于統(tǒng)計的漢英機(jī)器翻譯技術(shù)的研究[D]. 魏瑾.國防科學(xué)技術(shù)大學(xué) 2006
本文編號:3534905
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3534905.html
最近更新
教材專著