天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于注意力神經(jīng)網(wǎng)絡的蒙漢機器翻譯系統(tǒng)的研究

發(fā)布時間:2019-05-28 02:36
【摘要】:近年來,深度學習成為眾多領域研究的熱點。對于自然語言處理領域中的機器翻譯任務,序列到序列的神經(jīng)網(wǎng)絡翻譯系統(tǒng)的出現(xiàn)打破了傳統(tǒng)機器翻譯多模塊協(xié)調(diào)組合的局面,一體化的結(jié)構,令人滿意的翻譯結(jié)果使其一開始就備受學者矚目。后來基于注意力(Attention-based)的神經(jīng)網(wǎng)絡進一步改進了模型,使得翻譯效果一定程度上超過了傳統(tǒng)的統(tǒng)計機器翻譯系統(tǒng),成為主流的翻譯系統(tǒng)之一。本文以注意力神經(jīng)網(wǎng)絡為研究背景,結(jié)合最近的相關科研成果,從以下三方面展開了對基于注意力神經(jīng)網(wǎng)絡的蒙漢機器翻譯系統(tǒng)的研究:(1)蒙古文詞向量的預訓練:詞向量是直接參與模型訓練的詞語的表示形式,其訓練的質(zhì)量直接關系到最后訓練的翻譯模型的質(zhì)量,因此我們探索了三種蒙古文詞向量的預訓練方法來提升翻譯的質(zhì)量;(2)基于字典的蒙古文詞切分:蒙古文的構詞特點會造成訓練語料出現(xiàn)嚴重的數(shù)據(jù)稀疏問題,我們基于字典,對蒙古文單詞進行了詞綴、詞干及格的附加成分等不同粒度的詞切分,以此來緩解數(shù)據(jù)稀疏問題;(3)蒙古文特征提取:對于蒙古文來說,詞干、詞綴和格的附加成分是其構詞的語言特色,我們同樣基于字典將這些語言特色作為特征提取出來參與到系統(tǒng)的訓練中,以此來提高神經(jīng)網(wǎng)絡翻譯系統(tǒng)的翻譯效果。最后,我們構建并改進了一個完整的基于注意力神經(jīng)網(wǎng)絡的蒙漢翻譯系統(tǒng)。實驗表明,基于我們的方法,該系統(tǒng)能比基線系統(tǒng)BLEU得分最多提高了 2.47個百分點,最優(yōu)的模型BLEU值達到了 30.19。
[Abstract]:In recent years, in-depth learning has become a hot topic in many fields. For machine translation tasks in the field of natural language processing, the emergence of sequence-to-sequence neural network translation system breaks the situation of multi-module coordination and combination of traditional machine translation, and the integrated structure. Satisfactory translation results have attracted the attention of scholars from the beginning. Later, the neural network based on attention (Attention-based) further improved the model, which made the translation effect exceed the traditional statistical machine translation system to a certain extent and become one of the mainstream translation systems. In this paper, based on the research background of attention neural network, combined with the recent scientific research results, The research on Mongolian-Chinese machine translation system based on attention neural network is carried out from the following three aspects: (1) the pre-training of Mongolian word vector: word vector is the representation of words directly involved in model training. The quality of the training is directly related to the quality of the translation model of the final training, so we explore three pre-training methods of Mongolian word vectors to improve the quality of translation. (2) Mongolian word segmentation based on dictionary: the character of Mongolian word formation will cause serious data sparse problem in training corpus. Based on dictionary, we affix Mongolian words. In order to alleviate the problem of sparse data, word segmentation with different granularity, such as the additional components of word stem passing, can be used to alleviate the problem of sparse data. (3) Mongolian feature extraction: for Mongolian, the additional components of stem, affix and case are the language features of word formation. We also extract these language features as features to participate in the systematic training based on dictionaries. In order to improve the translation effect of neural network translation system. Finally, we construct and improve a complete Mongolian-Chinese translation system based on attention neural network. The experimental results show that, based on our method, the BLEU score of the system is up to 2.47 percentage points higher than that of the baseline system, and the optimal model BLEU value is 30.19%.
【學位授予單位】:內(nèi)蒙古大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.2;TP183

【相似文獻】

相關期刊論文 前10條

1 胡景凡,周錫令;受限漢語與漢英機器翻譯系統(tǒng)鍌[J];計算機工程與應用;2000年11期

2 屈剛,孔駿,陸汝占;一個基于范例推理的機器翻譯系統(tǒng)[J];計算機工程;2000年10期

3 ;賽迪集團北京中電報科技發(fā)展有限公司高科技產(chǎn)品介紹之一:新一代英漢機器翻譯系統(tǒng)[J];中國計算機用戶;2004年35期

4 肖明;;機器翻譯系統(tǒng)中間件模型[J];福建電腦;2006年03期

5 馬麗;李平;王秀英;趙麗華;;機器翻譯系統(tǒng)的模糊評價方法[J];微計算機信息;2008年01期

6 李青;黃金柱;;語義塊主輔變換在機器翻譯系統(tǒng)中的應用[J];洛陽師范學院學報;2010年05期

7 路學;我國實用機器翻譯系統(tǒng)的開發(fā)策略[J];現(xiàn)代圖書情報技術;1990年01期

8 徐劍,梁茂成;對幾種英漢機器翻譯系統(tǒng)的測評[J];語言文字應用;1999年02期

9 孫爽;石瑩;;ЭТАП-3機器翻譯系統(tǒng)研究[J];哈爾濱師范大學社會科學學報;2013年05期

10 ;其它計算機與系統(tǒng)[J];電子科技文摘;2000年06期

相關會議論文 前10條

1 宋金平;肖健;孫廣范;;面向北京奧運會的定制化英漢機器翻譯系統(tǒng)[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

2 范莉馨;任福繼;宮永喜一;(木厲)內(nèi)香次;;一個利用句子結(jié)構特征實現(xiàn)的中日機器翻譯系統(tǒng)[A];中國科學技術協(xié)會首屆青年學術年會論文集(工科分冊·上冊)[C];1992年

3 任福繼;范莉馨;;基于家族模型的日中機器翻譯系統(tǒng)[A];中國科學技術協(xié)會首屆青年學術年會論文集(工科分冊·上冊)[C];1992年

4 傅愛平;;英漢機器翻譯系統(tǒng)的語言分析和算法設計[A];輝煌二十年——中國中文信息學會二十周年學術會議論文集[C];2001年

5 田中康仁;;關于機器翻譯系統(tǒng)未來的方向[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術會議論文集[C];2001年

6 陳群秀;;計算機輔助翻譯系統(tǒng)漫談[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

7 洪忻;任燕;;中軟譯星機器翻譯系統(tǒng)翻譯質(zhì)量改進策略[A];機器翻譯研究進展——第四屆全國機器翻譯研討會論文集[C];2008年

8 吳闖;吳宏林;張俐;劉紹明;;基于文本-模板直接匹配的機器翻譯系統(tǒng)[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

9 周玉;翟飛飛;張家俊;涂眉;陳鈺楓;宗成慶;;多語言文本機器翻譯系統(tǒng)——中科院自動化所CWMT2011評測技術報告[A];機器翻譯研究進展——第七屆全國機器翻譯研討會論文集[C];2011年

10 熊維;王震;于新;劉匯丹;諾明花;馬龍龍;張立強;洪錦玲;吳健;;ISCAS機器翻譯系統(tǒng)與評測技術報告[A];機器翻譯研究進展——第七屆全國機器翻譯研討會論文集[C];2011年

相關重要報紙文章 前3條

1 董振東;到用戶中去[N];中國計算機報;2003年

2 ;我國首個基于搜索引擎的機器翻譯系統(tǒng)問世[N];中國高新技術產(chǎn)業(yè)導報;2008年

3 劉慧敏;多語信息平臺讓你“讀懂”七國語言[N];寧波日報;2007年

相關博士學位論文 前5條

1 關曉薇;基于語義語言的機器翻譯系統(tǒng)中若干關鍵問題研究[D];大連理工大學;2009年

2 胡春玲;人機互動的多策略機器翻譯系統(tǒng)中跟蹤記憶機制的研究[D];中國科學院研究生院(計算技術研究所);2000年

3 王博;機器翻譯系統(tǒng)的自動評價及診斷方法研究[D];哈爾濱工業(yè)大學;2010年

4 郭永輝;英漢機器翻譯系統(tǒng)關鍵技術研究[D];解放軍信息工程大學;2006年

5 烏日力嘎;西里爾蒙古文—漢文機器翻譯系統(tǒng)的實現(xiàn)[D];內(nèi)蒙古大學;2015年

相關碩士學位論文 前10條

1 姚振宇;基于復述的機器翻譯系統(tǒng)融合方法研究[D];哈爾濱工業(yè)大學;2015年

2 葛譯蔓;基于安全領域的維漢機器翻譯系統(tǒng)研究[D];吉林大學;2015年

3 朱長峰;短語機器翻譯系統(tǒng)中翻譯搜索策略的研究[D];南京大學;2015年

4 趙軼凡;基于iOS平臺的實時機器翻譯系統(tǒng)的設計與實現(xiàn)[D];北京交通大學;2016年

5 張帥;基于本體的英蒙機器翻譯系統(tǒng)設計與實現(xiàn)[D];內(nèi)蒙古大學;2016年

6 楊亞敏;在線機器翻譯系統(tǒng)質(zhì)量對比研究[D];揚州大學;2016年

7 洪X綠;機器翻譯系統(tǒng)比較[D];北京外國語大學;2017年

8 王琳;知網(wǎng)機器翻譯系統(tǒng)的分析與知識庫擴展[D];沈陽航空航天大學;2017年

9 王芳;《面向譯員的機器翻譯系統(tǒng)》(第一章)翻譯實踐報告[D];鄭州大學;2017年

10 王峰;融合互聯(lián)網(wǎng)引擎的機器翻譯系統(tǒng)[D];內(nèi)蒙古大學;2017年

,

本文編號:2486662

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2486662.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c4031***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com