基于端到端神經(jīng)網(wǎng)絡(luò)的蒙漢機(jī)器翻譯的研究
發(fā)布時(shí)間:2021-01-10 03:23
隨著自然語言處理和機(jī)器翻譯技術(shù)的發(fā)展,利用人工智能技術(shù)來提高不同語言間的翻譯效率和準(zhǔn)確率逐漸成為了研究熱點(diǎn)。其中,端到端(End to End,E2E)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)的神經(jīng)機(jī)器翻譯方法由于翻譯準(zhǔn)確率高、譯文語義性強(qiáng)等優(yōu)點(diǎn)逐漸成為研究的重點(diǎn),但依然存在詞匯受限、譯文忠實(shí)度低等問題。為了解決端到端神經(jīng)機(jī)器翻譯中存在的上述問題,本文圍繞機(jī)器翻譯預(yù)處理過程中的分詞和語料標(biāo)注問題進(jìn)行研究,緩解語料詞匯受限問題。同時(shí)為提高譯文質(zhì)量,對(duì)端到端模型的構(gòu)建過程展開研究。本文在端到端機(jī)器翻譯模型的預(yù)處理階段對(duì)于語料的分詞算法進(jìn)行研究,給出一種基于隱馬爾可夫模型(Hidden Markov Model,HMM)的分詞模型進(jìn)行序列的分詞標(biāo)注。同時(shí)使用判別式方式和條件隨機(jī)場(chǎng)(Conditional Random Field,CRF)模型來對(duì)蒙古語進(jìn)行詞干詞綴的切分和標(biāo)注。在語料的表示上,以低維的分布式表示方法來處理蒙漢雙語語料中的詞語向量化問題,以此來適應(yīng)端到端模型的輸入和輸出。針對(duì)蒙漢機(jī)器翻譯中譯文忠實(shí)度問題,結(jié)合主流的神經(jīng)機(jī)器翻譯端到端框架構(gòu)建一種基于卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural N...
【文章來源】:內(nèi)蒙古工業(yè)大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
蒙古語詞表
基于單詞的蒙漢對(duì)齊矩陣Figure4-5Mongolian-ChineseAlignmentMatrixBasedonWord
配置腳本Figure5-1ConfigurationScript
【參考文獻(xiàn)】:
期刊論文
[1]多通道卷積的圖像超分辨率方法[J]. 李云飛,符冉迪,金煒,紀(jì)念. 中國圖象圖形學(xué)報(bào). 2017(12)
[2]基于在線神經(jīng)網(wǎng)絡(luò)算法的混合試驗(yàn)方法[J]. 王濤,翟緒恒,孟麗巖,王貞. 振動(dòng)與沖擊. 2017(14)
[3]基于基本圖像特征的中朝文種辨識(shí)方法[J]. 張鵬,崔榮一. 延邊大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(02)
[4]初始化卷積神經(jīng)網(wǎng)絡(luò)的主成分洗牌方法[J]. 李玉鑑,沈成愷,楊紅麗,胡海鶴. 北京工業(yè)大學(xué)學(xué)報(bào). 2017(01)
[5]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計(jì)算機(jī)科學(xué). 2016(06)
[6]蒙古文詞性標(biāo)注及融合詞性因子的蒙漢統(tǒng)計(jì)機(jī)器翻譯[J]. 玉霞,王斯日古楞. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版). 2015(03)
[7]基于HMM算法體系的逆維特比算法理論研究[J]. 劉功生,張春良,岳夏,朱厚耀. 機(jī)電工程技術(shù). 2014(11)
[8]少數(shù)民族語言文字使用情況調(diào)查述要[J]. 黃行. 民族翻譯. 2013(03)
[9]基于篇章上下文的統(tǒng)計(jì)機(jī)器翻譯方法[J]. 于惠,謝軍,熊皓,呂雅娟,劉群,林守勛. 中文信息學(xué)報(bào). 2013(02)
[10]機(jī)器翻譯中的術(shù)語錯(cuò)譯分析[J]. 羅季美. 中國科技術(shù)語. 2013(01)
博士論文
[1]深度學(xué)習(xí)模型的高效訓(xùn)練算法研究[D]. 陳凱.中國科學(xué)技術(shù)大學(xué) 2016
碩士論文
[1]基于注意力神經(jīng)網(wǎng)絡(luò)的蒙漢機(jī)器翻譯系統(tǒng)的研究[D]. 申志鵬.內(nèi)蒙古大學(xué) 2017
[2]基于串到樹模型的蒙漢機(jī)器翻譯研究[D]. 員華瑞.內(nèi)蒙古大學(xué) 2015
本文編號(hào):2967961
【文章來源】:內(nèi)蒙古工業(yè)大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
蒙古語詞表
基于單詞的蒙漢對(duì)齊矩陣Figure4-5Mongolian-ChineseAlignmentMatrixBasedonWord
配置腳本Figure5-1ConfigurationScript
【參考文獻(xiàn)】:
期刊論文
[1]多通道卷積的圖像超分辨率方法[J]. 李云飛,符冉迪,金煒,紀(jì)念. 中國圖象圖形學(xué)報(bào). 2017(12)
[2]基于在線神經(jīng)網(wǎng)絡(luò)算法的混合試驗(yàn)方法[J]. 王濤,翟緒恒,孟麗巖,王貞. 振動(dòng)與沖擊. 2017(14)
[3]基于基本圖像特征的中朝文種辨識(shí)方法[J]. 張鵬,崔榮一. 延邊大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(02)
[4]初始化卷積神經(jīng)網(wǎng)絡(luò)的主成分洗牌方法[J]. 李玉鑑,沈成愷,楊紅麗,胡海鶴. 北京工業(yè)大學(xué)學(xué)報(bào). 2017(01)
[5]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計(jì)算機(jī)科學(xué). 2016(06)
[6]蒙古文詞性標(biāo)注及融合詞性因子的蒙漢統(tǒng)計(jì)機(jī)器翻譯[J]. 玉霞,王斯日古楞. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版). 2015(03)
[7]基于HMM算法體系的逆維特比算法理論研究[J]. 劉功生,張春良,岳夏,朱厚耀. 機(jī)電工程技術(shù). 2014(11)
[8]少數(shù)民族語言文字使用情況調(diào)查述要[J]. 黃行. 民族翻譯. 2013(03)
[9]基于篇章上下文的統(tǒng)計(jì)機(jī)器翻譯方法[J]. 于惠,謝軍,熊皓,呂雅娟,劉群,林守勛. 中文信息學(xué)報(bào). 2013(02)
[10]機(jī)器翻譯中的術(shù)語錯(cuò)譯分析[J]. 羅季美. 中國科技術(shù)語. 2013(01)
博士論文
[1]深度學(xué)習(xí)模型的高效訓(xùn)練算法研究[D]. 陳凱.中國科學(xué)技術(shù)大學(xué) 2016
碩士論文
[1]基于注意力神經(jīng)網(wǎng)絡(luò)的蒙漢機(jī)器翻譯系統(tǒng)的研究[D]. 申志鵬.內(nèi)蒙古大學(xué) 2017
[2]基于串到樹模型的蒙漢機(jī)器翻譯研究[D]. 員華瑞.內(nèi)蒙古大學(xué) 2015
本文編號(hào):2967961
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/2967961.html
最近更新
教材專著
熱點(diǎn)文章