基于注意力神經(jīng)網(wǎng)絡(luò)的蒙漢機(jī)器翻譯系統(tǒng)的研究
[Abstract]:In recent years, in-depth learning has become a hot topic in many fields. For machine translation tasks in the field of natural language processing, the emergence of sequence-to-sequence neural network translation system breaks the situation of multi-module coordination and combination of traditional machine translation, and the integrated structure. Satisfactory translation results have attracted the attention of scholars from the beginning. Later, the neural network based on attention (Attention-based) further improved the model, which made the translation effect exceed the traditional statistical machine translation system to a certain extent and become one of the mainstream translation systems. In this paper, based on the research background of attention neural network, combined with the recent scientific research results, The research on Mongolian-Chinese machine translation system based on attention neural network is carried out from the following three aspects: (1) the pre-training of Mongolian word vector: word vector is the representation of words directly involved in model training. The quality of the training is directly related to the quality of the translation model of the final training, so we explore three pre-training methods of Mongolian word vectors to improve the quality of translation. (2) Mongolian word segmentation based on dictionary: the character of Mongolian word formation will cause serious data sparse problem in training corpus. Based on dictionary, we affix Mongolian words. In order to alleviate the problem of sparse data, word segmentation with different granularity, such as the additional components of word stem passing, can be used to alleviate the problem of sparse data. (3) Mongolian feature extraction: for Mongolian, the additional components of stem, affix and case are the language features of word formation. We also extract these language features as features to participate in the systematic training based on dictionaries. In order to improve the translation effect of neural network translation system. Finally, we construct and improve a complete Mongolian-Chinese translation system based on attention neural network. The experimental results show that, based on our method, the BLEU score of the system is up to 2.47 percentage points higher than that of the baseline system, and the optimal model BLEU value is 30.19%.
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.2;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 胡景凡,周錫令;受限漢語與漢英機(jī)器翻譯系統(tǒng)鍌[J];計(jì)算機(jī)工程與應(yīng)用;2000年11期
2 屈剛,孔駿,陸汝占;一個(gè)基于范例推理的機(jī)器翻譯系統(tǒng)[J];計(jì)算機(jī)工程;2000年10期
3 ;賽迪集團(tuán)北京中電報(bào)科技發(fā)展有限公司高科技產(chǎn)品介紹之一:新一代英漢機(jī)器翻譯系統(tǒng)[J];中國計(jì)算機(jī)用戶;2004年35期
4 肖明;;機(jī)器翻譯系統(tǒng)中間件模型[J];福建電腦;2006年03期
5 馬麗;李平;王秀英;趙麗華;;機(jī)器翻譯系統(tǒng)的模糊評價(jià)方法[J];微計(jì)算機(jī)信息;2008年01期
6 李青;黃金柱;;語義塊主輔變換在機(jī)器翻譯系統(tǒng)中的應(yīng)用[J];洛陽師范學(xué)院學(xué)報(bào);2010年05期
7 路學(xué);我國實(shí)用機(jī)器翻譯系統(tǒng)的開發(fā)策略[J];現(xiàn)代圖書情報(bào)技術(shù);1990年01期
8 徐劍,梁茂成;對幾種英漢機(jī)器翻譯系統(tǒng)的測評[J];語言文字應(yīng)用;1999年02期
9 孫爽;石瑩;;ЭТАП-3機(jī)器翻譯系統(tǒng)研究[J];哈爾濱師范大學(xué)社會(huì)科學(xué)學(xué)報(bào);2013年05期
10 ;其它計(jì)算機(jī)與系統(tǒng)[J];電子科技文摘;2000年06期
相關(guān)會(huì)議論文 前10條
1 宋金平;肖健;孫廣范;;面向北京奧運(yùn)會(huì)的定制化英漢機(jī)器翻譯系統(tǒng)[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
2 范莉馨;任福繼;宮永喜一;(木厲)內(nèi)香次;;一個(gè)利用句子結(jié)構(gòu)特征實(shí)現(xiàn)的中日機(jī)器翻譯系統(tǒng)[A];中國科學(xué)技術(shù)協(xié)會(huì)首屆青年學(xué)術(shù)年會(huì)論文集(工科分冊·上冊)[C];1992年
3 任福繼;范莉馨;;基于家族模型的日中機(jī)器翻譯系統(tǒng)[A];中國科學(xué)技術(shù)協(xié)會(huì)首屆青年學(xué)術(shù)年會(huì)論文集(工科分冊·上冊)[C];1992年
4 傅愛平;;英漢機(jī)器翻譯系統(tǒng)的語言分析和算法設(shè)計(jì)[A];輝煌二十年——中國中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
5 田中康仁;;關(guān)于機(jī)器翻譯系統(tǒng)未來的方向[A];自然語言理解與機(jī)器翻譯——全國第六屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年
6 陳群秀;;計(jì)算機(jī)輔助翻譯系統(tǒng)漫談[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
7 洪忻;任燕;;中軟譯星機(jī)器翻譯系統(tǒng)翻譯質(zhì)量改進(jìn)策略[A];機(jī)器翻譯研究進(jìn)展——第四屆全國機(jī)器翻譯研討會(huì)論文集[C];2008年
8 吳闖;吳宏林;張俐;劉紹明;;基于文本-模板直接匹配的機(jī)器翻譯系統(tǒng)[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
9 周玉;翟飛飛;張家俊;涂眉;陳鈺楓;宗成慶;;多語言文本機(jī)器翻譯系統(tǒng)——中科院自動(dòng)化所CWMT2011評測技術(shù)報(bào)告[A];機(jī)器翻譯研究進(jìn)展——第七屆全國機(jī)器翻譯研討會(huì)論文集[C];2011年
10 熊維;王震;于新;劉匯丹;諾明花;馬龍龍;張立強(qiáng);洪錦玲;吳健;;ISCAS機(jī)器翻譯系統(tǒng)與評測技術(shù)報(bào)告[A];機(jī)器翻譯研究進(jìn)展——第七屆全國機(jī)器翻譯研討會(huì)論文集[C];2011年
相關(guān)重要報(bào)紙文章 前3條
1 董振東;到用戶中去[N];中國計(jì)算機(jī)報(bào);2003年
2 ;我國首個(gè)基于搜索引擎的機(jī)器翻譯系統(tǒng)問世[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2008年
3 劉慧敏;多語信息平臺讓你“讀懂”七國語言[N];寧波日報(bào);2007年
相關(guān)博士學(xué)位論文 前5條
1 關(guān)曉薇;基于語義語言的機(jī)器翻譯系統(tǒng)中若干關(guān)鍵問題研究[D];大連理工大學(xué);2009年
2 胡春玲;人機(jī)互動(dòng)的多策略機(jī)器翻譯系統(tǒng)中跟蹤記憶機(jī)制的研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2000年
3 王博;機(jī)器翻譯系統(tǒng)的自動(dòng)評價(jià)及診斷方法研究[D];哈爾濱工業(yè)大學(xué);2010年
4 郭永輝;英漢機(jī)器翻譯系統(tǒng)關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2006年
5 烏日力嘎;西里爾蒙古文—漢文機(jī)器翻譯系統(tǒng)的實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 姚振宇;基于復(fù)述的機(jī)器翻譯系統(tǒng)融合方法研究[D];哈爾濱工業(yè)大學(xué);2015年
2 葛譯蔓;基于安全領(lǐng)域的維漢機(jī)器翻譯系統(tǒng)研究[D];吉林大學(xué);2015年
3 朱長峰;短語機(jī)器翻譯系統(tǒng)中翻譯搜索策略的研究[D];南京大學(xué);2015年
4 趙軼凡;基于iOS平臺的實(shí)時(shí)機(jī)器翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2016年
5 張帥;基于本體的英蒙機(jī)器翻譯系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2016年
6 楊亞敏;在線機(jī)器翻譯系統(tǒng)質(zhì)量對比研究[D];揚(yáng)州大學(xué);2016年
7 洪X綠;機(jī)器翻譯系統(tǒng)比較[D];北京外國語大學(xué);2017年
8 王琳;知網(wǎng)機(jī)器翻譯系統(tǒng)的分析與知識庫擴(kuò)展[D];沈陽航空航天大學(xué);2017年
9 王芳;《面向譯員的機(jī)器翻譯系統(tǒng)》(第一章)翻譯實(shí)踐報(bào)告[D];鄭州大學(xué);2017年
10 王峰;融合互聯(lián)網(wǎng)引擎的機(jī)器翻譯系統(tǒng)[D];內(nèi)蒙古大學(xué);2017年
,本文編號:2486662
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2486662.html