基于Transformer的蒙漢神經(jīng)機器翻譯研究
發(fā)布時間:2022-02-18 18:36
針對傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的缺點,搭建完全基于多頭自注意力機制的Transformer蒙漢神經(jīng)機器翻譯模型。實驗結(jié)果表明,該模型比基于LSTM的蒙漢翻譯模型提高了9個BLEU值左右。這說明Transformer翻譯模型在句子語義提取和語義表達方面優(yōu)于LSTM翻譯模型。同時在語料預(yù)處理階段,還對中蒙文語料進行了不同粒度的切分。通過實驗對比分析,蒙文進行BPE處理后的翻譯結(jié)果優(yōu)于對中文單獨使用分詞處理的結(jié)果;在較小語料庫中,對中文進行分字處理效果優(yōu)于分詞效果。
【文章來源】:計算機應(yīng)用與軟件. 2020,37(02)北大核心
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 神經(jīng)網(wǎng)絡(luò)機器翻譯
1.1 Transformer
1.1.1 注意力機制
1.1.2 位置編碼
1.1.3 前饋神經(jīng)網(wǎng)絡(luò)
1.2 融合多粒度
2 實 驗
2.1 實驗設(shè)置
2.2 實驗結(jié)果
3 結(jié) 語
【參考文獻】:
期刊論文
[1]子字粒度切分在蒙漢神經(jīng)機器翻譯中的應(yīng)用[J]. 任眾,侯宏旭,吉亞圖,武子玉,白天罡,雷穎. 中文信息學(xué)報. 2019(01)
[2]基于子字單元的神經(jīng)機器翻譯未登錄詞翻譯分析[J]. 韓冬,李軍輝,熊德意,周國棟. 中文信息學(xué)報. 2018(04)
[3]多策略機器翻譯研究綜述[J]. 李業(yè)剛,黃河燕,史樹敏,馮沖,蘇超. 中文信息學(xué)報. 2015(02)
本文編號:3631343
【文章來源】:計算機應(yīng)用與軟件. 2020,37(02)北大核心
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 神經(jīng)網(wǎng)絡(luò)機器翻譯
1.1 Transformer
1.1.1 注意力機制
1.1.2 位置編碼
1.1.3 前饋神經(jīng)網(wǎng)絡(luò)
1.2 融合多粒度
2 實 驗
2.1 實驗設(shè)置
2.2 實驗結(jié)果
3 結(jié) 語
【參考文獻】:
期刊論文
[1]子字粒度切分在蒙漢神經(jīng)機器翻譯中的應(yīng)用[J]. 任眾,侯宏旭,吉亞圖,武子玉,白天罡,雷穎. 中文信息學(xué)報. 2019(01)
[2]基于子字單元的神經(jīng)機器翻譯未登錄詞翻譯分析[J]. 韓冬,李軍輝,熊德意,周國棟. 中文信息學(xué)報. 2018(04)
[3]多策略機器翻譯研究綜述[J]. 李業(yè)剛,黃河燕,史樹敏,馮沖,蘇超. 中文信息學(xué)報. 2015(02)
本文編號:3631343
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3631343.html
最近更新
教材專著