基于注意力神經(jīng)網(wǎng)絡的蒙漢機器翻譯系統(tǒng)的研究
[Abstract]:In recent years, in-depth learning has become a hot topic in many fields. For machine translation tasks in the field of natural language processing, the emergence of sequence-to-sequence neural network translation system breaks the situation of multi-module coordination and combination of traditional machine translation, and the integrated structure. Satisfactory translation results have attracted the attention of scholars from the beginning. Later, the neural network based on attention (Attention-based) further improved the model, which made the translation effect exceed the traditional statistical machine translation system to a certain extent and become one of the mainstream translation systems. In this paper, based on the research background of attention neural network, combined with the recent scientific research results, The research on Mongolian-Chinese machine translation system based on attention neural network is carried out from the following three aspects: (1) the pre-training of Mongolian word vector: word vector is the representation of words directly involved in model training. The quality of the training is directly related to the quality of the translation model of the final training, so we explore three pre-training methods of Mongolian word vectors to improve the quality of translation. (2) Mongolian word segmentation based on dictionary: the character of Mongolian word formation will cause serious data sparse problem in training corpus. Based on dictionary, we affix Mongolian words. In order to alleviate the problem of sparse data, word segmentation with different granularity, such as the additional components of word stem passing, can be used to alleviate the problem of sparse data. (3) Mongolian feature extraction: for Mongolian, the additional components of stem, affix and case are the language features of word formation. We also extract these language features as features to participate in the systematic training based on dictionaries. In order to improve the translation effect of neural network translation system. Finally, we construct and improve a complete Mongolian-Chinese translation system based on attention neural network. The experimental results show that, based on our method, the BLEU score of the system is up to 2.47 percentage points higher than that of the baseline system, and the optimal model BLEU value is 30.19%.
【學位授予單位】:內(nèi)蒙古大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.2;TP183
【相似文獻】
相關期刊論文 前10條
1 胡景凡,周錫令;受限漢語與漢英機器翻譯系統(tǒng)鍌[J];計算機工程與應用;2000年11期
2 屈剛,孔駿,陸汝占;一個基于范例推理的機器翻譯系統(tǒng)[J];計算機工程;2000年10期
3 ;賽迪集團北京中電報科技發(fā)展有限公司高科技產(chǎn)品介紹之一:新一代英漢機器翻譯系統(tǒng)[J];中國計算機用戶;2004年35期
4 肖明;;機器翻譯系統(tǒng)中間件模型[J];福建電腦;2006年03期
5 馬麗;李平;王秀英;趙麗華;;機器翻譯系統(tǒng)的模糊評價方法[J];微計算機信息;2008年01期
6 李青;黃金柱;;語義塊主輔變換在機器翻譯系統(tǒng)中的應用[J];洛陽師范學院學報;2010年05期
7 路學;我國實用機器翻譯系統(tǒng)的開發(fā)策略[J];現(xiàn)代圖書情報技術;1990年01期
8 徐劍,梁茂成;對幾種英漢機器翻譯系統(tǒng)的測評[J];語言文字應用;1999年02期
9 孫爽;石瑩;;ЭТАП-3機器翻譯系統(tǒng)研究[J];哈爾濱師范大學社會科學學報;2013年05期
10 ;其它計算機與系統(tǒng)[J];電子科技文摘;2000年06期
相關會議論文 前10條
1 宋金平;肖健;孫廣范;;面向北京奧運會的定制化英漢機器翻譯系統(tǒng)[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
2 范莉馨;任福繼;宮永喜一;(木厲)內(nèi)香次;;一個利用句子結(jié)構特征實現(xiàn)的中日機器翻譯系統(tǒng)[A];中國科學技術協(xié)會首屆青年學術年會論文集(工科分冊·上冊)[C];1992年
3 任福繼;范莉馨;;基于家族模型的日中機器翻譯系統(tǒng)[A];中國科學技術協(xié)會首屆青年學術年會論文集(工科分冊·上冊)[C];1992年
4 傅愛平;;英漢機器翻譯系統(tǒng)的語言分析和算法設計[A];輝煌二十年——中國中文信息學會二十周年學術會議論文集[C];2001年
5 田中康仁;;關于機器翻譯系統(tǒng)未來的方向[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術會議論文集[C];2001年
6 陳群秀;;計算機輔助翻譯系統(tǒng)漫談[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年
7 洪忻;任燕;;中軟譯星機器翻譯系統(tǒng)翻譯質(zhì)量改進策略[A];機器翻譯研究進展——第四屆全國機器翻譯研討會論文集[C];2008年
8 吳闖;吳宏林;張俐;劉紹明;;基于文本-模板直接匹配的機器翻譯系統(tǒng)[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
9 周玉;翟飛飛;張家俊;涂眉;陳鈺楓;宗成慶;;多語言文本機器翻譯系統(tǒng)——中科院自動化所CWMT2011評測技術報告[A];機器翻譯研究進展——第七屆全國機器翻譯研討會論文集[C];2011年
10 熊維;王震;于新;劉匯丹;諾明花;馬龍龍;張立強;洪錦玲;吳健;;ISCAS機器翻譯系統(tǒng)與評測技術報告[A];機器翻譯研究進展——第七屆全國機器翻譯研討會論文集[C];2011年
相關重要報紙文章 前3條
1 董振東;到用戶中去[N];中國計算機報;2003年
2 ;我國首個基于搜索引擎的機器翻譯系統(tǒng)問世[N];中國高新技術產(chǎn)業(yè)導報;2008年
3 劉慧敏;多語信息平臺讓你“讀懂”七國語言[N];寧波日報;2007年
相關博士學位論文 前5條
1 關曉薇;基于語義語言的機器翻譯系統(tǒng)中若干關鍵問題研究[D];大連理工大學;2009年
2 胡春玲;人機互動的多策略機器翻譯系統(tǒng)中跟蹤記憶機制的研究[D];中國科學院研究生院(計算技術研究所);2000年
3 王博;機器翻譯系統(tǒng)的自動評價及診斷方法研究[D];哈爾濱工業(yè)大學;2010年
4 郭永輝;英漢機器翻譯系統(tǒng)關鍵技術研究[D];解放軍信息工程大學;2006年
5 烏日力嘎;西里爾蒙古文—漢文機器翻譯系統(tǒng)的實現(xiàn)[D];內(nèi)蒙古大學;2015年
相關碩士學位論文 前10條
1 姚振宇;基于復述的機器翻譯系統(tǒng)融合方法研究[D];哈爾濱工業(yè)大學;2015年
2 葛譯蔓;基于安全領域的維漢機器翻譯系統(tǒng)研究[D];吉林大學;2015年
3 朱長峰;短語機器翻譯系統(tǒng)中翻譯搜索策略的研究[D];南京大學;2015年
4 趙軼凡;基于iOS平臺的實時機器翻譯系統(tǒng)的設計與實現(xiàn)[D];北京交通大學;2016年
5 張帥;基于本體的英蒙機器翻譯系統(tǒng)設計與實現(xiàn)[D];內(nèi)蒙古大學;2016年
6 楊亞敏;在線機器翻譯系統(tǒng)質(zhì)量對比研究[D];揚州大學;2016年
7 洪X綠;機器翻譯系統(tǒng)比較[D];北京外國語大學;2017年
8 王琳;知網(wǎng)機器翻譯系統(tǒng)的分析與知識庫擴展[D];沈陽航空航天大學;2017年
9 王芳;《面向譯員的機器翻譯系統(tǒng)》(第一章)翻譯實踐報告[D];鄭州大學;2017年
10 王峰;融合互聯(lián)網(wǎng)引擎的機器翻譯系統(tǒng)[D];內(nèi)蒙古大學;2017年
,本文編號:2486662
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2486662.html