基于Transformer的蒙漢神經(jīng)機(jī)器翻譯研究
發(fā)布時(shí)間:2022-02-18 18:36
針對傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的缺點(diǎn),搭建完全基于多頭自注意力機(jī)制的Transformer蒙漢神經(jīng)機(jī)器翻譯模型。實(shí)驗(yàn)結(jié)果表明,該模型比基于LSTM的蒙漢翻譯模型提高了9個(gè)BLEU值左右。這說明Transformer翻譯模型在句子語義提取和語義表達(dá)方面優(yōu)于LSTM翻譯模型。同時(shí)在語料預(yù)處理階段,還對中蒙文語料進(jìn)行了不同粒度的切分。通過實(shí)驗(yàn)對比分析,蒙文進(jìn)行BPE處理后的翻譯結(jié)果優(yōu)于對中文單獨(dú)使用分詞處理的結(jié)果;在較小語料庫中,對中文進(jìn)行分字處理效果優(yōu)于分詞效果。
【文章來源】:計(jì)算機(jī)應(yīng)用與軟件. 2020,37(02)北大核心
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯
1.1 Transformer
1.1.1 注意力機(jī)制
1.1.2 位置編碼
1.1.3 前饋神經(jīng)網(wǎng)絡(luò)
1.2 融合多粒度
2 實(shí) 驗(yàn)
2.1 實(shí)驗(yàn)設(shè)置
2.2 實(shí)驗(yàn)結(jié)果
3 結(jié) 語
【參考文獻(xiàn)】:
期刊論文
[1]子字粒度切分在蒙漢神經(jīng)機(jī)器翻譯中的應(yīng)用[J]. 任眾,侯宏旭,吉亞圖,武子玉,白天罡,雷穎. 中文信息學(xué)報(bào). 2019(01)
[2]基于子字單元的神經(jīng)機(jī)器翻譯未登錄詞翻譯分析[J]. 韓冬,李軍輝,熊德意,周國棟. 中文信息學(xué)報(bào). 2018(04)
[3]多策略機(jī)器翻譯研究綜述[J]. 李業(yè)剛,黃河燕,史樹敏,馮沖,蘇超. 中文信息學(xué)報(bào). 2015(02)
本文編號:3631343
【文章來源】:計(jì)算機(jī)應(yīng)用與軟件. 2020,37(02)北大核心
【文章頁數(shù)】:7 頁
【文章目錄】:
0 引 言
1 神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯
1.1 Transformer
1.1.1 注意力機(jī)制
1.1.2 位置編碼
1.1.3 前饋神經(jīng)網(wǎng)絡(luò)
1.2 融合多粒度
2 實(shí) 驗(yàn)
2.1 實(shí)驗(yàn)設(shè)置
2.2 實(shí)驗(yàn)結(jié)果
3 結(jié) 語
【參考文獻(xiàn)】:
期刊論文
[1]子字粒度切分在蒙漢神經(jīng)機(jī)器翻譯中的應(yīng)用[J]. 任眾,侯宏旭,吉亞圖,武子玉,白天罡,雷穎. 中文信息學(xué)報(bào). 2019(01)
[2]基于子字單元的神經(jīng)機(jī)器翻譯未登錄詞翻譯分析[J]. 韓冬,李軍輝,熊德意,周國棟. 中文信息學(xué)報(bào). 2018(04)
[3]多策略機(jī)器翻譯研究綜述[J]. 李業(yè)剛,黃河燕,史樹敏,馮沖,蘇超. 中文信息學(xué)報(bào). 2015(02)
本文編號:3631343
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3631343.html
最近更新
教材專著