AIS拼音船名到漢字的智能翻譯技術(shù)
發(fā)布時(shí)間:2021-12-11 15:15
針對(duì)航海領(lǐng)域中船舶自動(dòng)識(shí)別系統(tǒng)(AIS)無(wú)法利用中文給我國(guó)使用者帶來(lái)的識(shí)別障礙問(wèn)題,研究了AIS拼音信息到漢字的智能翻譯技術(shù).在建立標(biāo)準(zhǔn)化漢字和拼音船名語(yǔ)料庫(kù)的基礎(chǔ)上,分別搭建了基于Seq2Seq和Transformer框架的智能船名翻譯的深度學(xué)習(xí)模型.通過(guò)在同一數(shù)據(jù)集上的性能對(duì)比分析發(fā)現(xiàn),Transformer模型具有更好的效果.為彌補(bǔ)Transformer模型受語(yǔ)料庫(kù)規(guī)模限制而帶來(lái)的翻譯損失,進(jìn)一步研究了其與隱馬爾科夫鏈(HMM)的聯(lián)合翻譯模型,最終,在測(cè)試集上達(dá)到了98.92%的準(zhǔn)確率,實(shí)現(xiàn)了對(duì)AIS拼音船名的精準(zhǔn)匹配和合理翻譯.該模型同樣適用于A(yíng)IS中目的港等拼音信息到漢字的翻譯,對(duì)于提升AIS信息使用者的體驗(yàn)具有實(shí)際應(yīng)用價(jià)值.
【文章來(lái)源】:大連海事大學(xué)學(xué)報(bào). 2020,46(02)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
語(yǔ)料庫(kù)構(gòu)建過(guò)程
圖2中,每個(gè)encoder單元首先對(duì)船名拼音在嵌入層進(jìn)行one-hot編碼,然后輸入隱藏層(這里為2個(gè)LSTM層)進(jìn)行計(jì)算后輸出狀態(tài)向量h(t).非初始encoder單元除接收拼音的輸入,同時(shí),還接收上一個(gè)拼音encoder單元輸出的狀態(tài)向量h(t-1),其隱藏層經(jīng)計(jì)算后輸出h(t),作為下一個(gè)拼音encoder單元的一項(xiàng)輸入.
利用船名語(yǔ)料庫(kù)的訓(xùn)練集(16萬(wàn)余條數(shù)據(jù))和測(cè)試集(4萬(wàn)余條數(shù)據(jù))對(duì)Seq2Seq模型進(jìn)行訓(xùn)練和測(cè)試,訓(xùn)練的主要參數(shù)設(shè)置如表3所示,訓(xùn)練過(guò)程如圖4所示.由圖4可見(jiàn),訓(xùn)練在50步迭代后準(zhǔn)確率趨于穩(wěn)定,船名100%正確的準(zhǔn)確率大概為28%左右. 表4為從測(cè)試集中隨機(jī)抽取的幾條翻譯結(jié)果.
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM的蒙漢機(jī)器翻譯的研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 計(jì)算機(jī)工程與科學(xué). 2018(10)
[2]基于統(tǒng)計(jì)的漢英機(jī)器翻譯技術(shù)的研究[J]. 趙靜. 電子設(shè)計(jì)工程. 2016(21)
[3]船載AIS信息采集與解碼技術(shù)研究[J]. 于光峰. 電子技術(shù)與軟件工程. 2013(21)
[4]一般拓?fù)浣Y(jié)構(gòu)的非齊次隱含馬爾科夫模型及其在中、英文語(yǔ)種辨識(shí)中的應(yīng)用[J]. 王作英,孫健. 電子與信息學(xué)報(bào). 2007(04)
[5]機(jī)器學(xué)習(xí)在漢字智能拼音輸入中的應(yīng)用[J]. 巨同升. 山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(03)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的維漢機(jī)器翻譯研究[D]. 張勝剛.新疆大學(xué) 2018
[2]船舶自動(dòng)識(shí)別系統(tǒng)(AIS)接口數(shù)據(jù)的研究與應(yīng)用[D]. 張穎.大連海事大學(xué) 2009
[3]基于統(tǒng)計(jì)的漢英機(jī)器翻譯技術(shù)的研究[D]. 魏瑾.國(guó)防科學(xué)技術(shù)大學(xué) 2006
本文編號(hào):3534905
【文章來(lái)源】:大連海事大學(xué)學(xué)報(bào). 2020,46(02)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
語(yǔ)料庫(kù)構(gòu)建過(guò)程
圖2中,每個(gè)encoder單元首先對(duì)船名拼音在嵌入層進(jìn)行one-hot編碼,然后輸入隱藏層(這里為2個(gè)LSTM層)進(jìn)行計(jì)算后輸出狀態(tài)向量h(t).非初始encoder單元除接收拼音的輸入,同時(shí),還接收上一個(gè)拼音encoder單元輸出的狀態(tài)向量h(t-1),其隱藏層經(jīng)計(jì)算后輸出h(t),作為下一個(gè)拼音encoder單元的一項(xiàng)輸入.
利用船名語(yǔ)料庫(kù)的訓(xùn)練集(16萬(wàn)余條數(shù)據(jù))和測(cè)試集(4萬(wàn)余條數(shù)據(jù))對(duì)Seq2Seq模型進(jìn)行訓(xùn)練和測(cè)試,訓(xùn)練的主要參數(shù)設(shè)置如表3所示,訓(xùn)練過(guò)程如圖4所示.由圖4可見(jiàn),訓(xùn)練在50步迭代后準(zhǔn)確率趨于穩(wěn)定,船名100%正確的準(zhǔn)確率大概為28%左右. 表4為從測(cè)試集中隨機(jī)抽取的幾條翻譯結(jié)果.
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM的蒙漢機(jī)器翻譯的研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 計(jì)算機(jī)工程與科學(xué). 2018(10)
[2]基于統(tǒng)計(jì)的漢英機(jī)器翻譯技術(shù)的研究[J]. 趙靜. 電子設(shè)計(jì)工程. 2016(21)
[3]船載AIS信息采集與解碼技術(shù)研究[J]. 于光峰. 電子技術(shù)與軟件工程. 2013(21)
[4]一般拓?fù)浣Y(jié)構(gòu)的非齊次隱含馬爾科夫模型及其在中、英文語(yǔ)種辨識(shí)中的應(yīng)用[J]. 王作英,孫健. 電子與信息學(xué)報(bào). 2007(04)
[5]機(jī)器學(xué)習(xí)在漢字智能拼音輸入中的應(yīng)用[J]. 巨同升. 山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(03)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的維漢機(jī)器翻譯研究[D]. 張勝剛.新疆大學(xué) 2018
[2]船舶自動(dòng)識(shí)別系統(tǒng)(AIS)接口數(shù)據(jù)的研究與應(yīng)用[D]. 張穎.大連海事大學(xué) 2009
[3]基于統(tǒng)計(jì)的漢英機(jī)器翻譯技術(shù)的研究[D]. 魏瑾.國(guó)防科學(xué)技術(shù)大學(xué) 2006
本文編號(hào):3534905
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3534905.html
最近更新
教材專(zhuān)著