融合多語編碼信息的神經(jīng)機(jī)器翻譯研究
本文選題:神經(jīng)機(jī)器翻譯 + 上下文向量 ; 參考:《哈爾濱工業(yè)大學(xué)》2017年碩士論文
【摘要】:近幾年,深度學(xué)習(xí)的迅速發(fā)展和普及,對機(jī)器翻譯產(chǎn)生了極大的影響,使得基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)應(yīng)用超越了統(tǒng)計(jì)機(jī)器翻譯(SMT)。神經(jīng)機(jī)器翻譯中,解碼器是根據(jù)編碼器對源語言的抽象表示預(yù)測目標(biāo)詞序列的,正是這種抽象表示為多語機(jī)器翻譯提供了可能。由于平行的語料表達(dá)的語義相同,因此編碼之后的向量信息是存在著某種聯(lián)系的。如果能夠通過融合編碼信息的方法強(qiáng)化完善語義向量,就可以提升翻譯性能。本課題在三語平行語料上展開了融合編碼信息神經(jīng)機(jī)器翻譯的研究,課題的研究內(nèi)容包括以下幾部分:(1)對比分析實(shí)驗(yàn)平臺Groundhog和Nematus在不同規(guī)模的數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,確定課題研究的實(shí)驗(yàn)平臺。通過實(shí)驗(yàn)為基線系統(tǒng)選取合適的詞嵌入的維度。使用中英日三語語料在Nematus上訓(xùn)練英文日文翻譯系統(tǒng)和中文日文翻譯系統(tǒng)作為課題研究的基線系統(tǒng)。(2)多語編碼信息融合的神經(jīng)機(jī)器翻譯模型以及融合方法探究。課題介紹使用簡單的向量拼接的方法把兩種輸入語言的編碼信息融合,生成一個新的包含兩種輸入語言信息的中間向量,用它解碼得到目標(biāo)語言句子。然后又提出一種新的融合多語編碼信息的翻譯模型,在得到兩種輸入語言的編碼信息之后,分別計(jì)算各自含注意力信息的上下文向量,把得到的新向量作為單層神經(jīng)網(wǎng)的輸入,信息融合得到語義豐富而全面的上下文向量,作為解碼器的輸入生成目標(biāo)語言。最后一部分工作是探究其他信息融合的方法。融合后的向量包含了兩種輸入語言的語義信息。因此尋找適合的融合方法,使不同輸入語言的編碼信息完美的結(jié)合在一起進(jìn)行解碼,對提升模型效果是至關(guān)重要的。(3)主要研究使用中間語做過渡的神經(jīng)機(jī)器翻譯模型。課題研究的中間語言也稱中軸語,對本課題而言,中軸語是中文,引入中軸語有兩個原因,一是為避免融合模型中的多語輸入問題;其次能夠充分利用現(xiàn)有的英文中文語料和性能較好的中文譯日文模型。驗(yàn)證了該方法的有效性之后,本課題嘗試將中軸語模型和編碼信息融合模型結(jié)合在一起,得到中軸語框架下的編碼信息融合模型。因?yàn)榉g模型自身的誤差,該模型的性能雖然比中軸語翻譯模型好卻比不上編碼信息融合模型。
[Abstract]:This paper proposes a new method of fusion coding information neural machine translation .
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.2
【相似文獻(xiàn)】
相關(guān)期刊論文 前4條
1 王志軍;;讓KMPlayer顯示更完備的編碼信息[J];電腦迷;2009年01期
2 馬德康;;利用廣播電臺發(fā)播時間編碼信息[J];陜西天文臺臺刊;1984年02期
3 朱營琢;鄭聯(lián)語;董洪飛;孫香云;;基于元數(shù)據(jù)的制造資源編碼信息集成研究[J];成組技術(shù)與生產(chǎn)現(xiàn)代化;2010年01期
4 劉毅敏;史作鋒;;編碼信息紅外發(fā)射與接收器[J];微計(jì)算機(jī)信息;2007年14期
相關(guān)碩士學(xué)位論文 前6條
1 劉笛;融合多語編碼信息的神經(jīng)機(jī)器翻譯研究[D];哈爾濱工業(yè)大學(xué);2017年
2 劉芳芳;外事文本機(jī)器翻譯譯文差異的量化研究[D];北京第二外國語學(xué)院;2017年
3 方菲;商務(wù)英語機(jī)器翻譯漢譯錯誤分析[D];廣東外語外貿(mào)大學(xué);2017年
4 李榮蓉;漢英在線機(jī)器翻譯研究[D];南昌大學(xué);2017年
5 付思寒;機(jī)器翻譯的譯后編輯—一項(xiàng)以Trados為工具的《翻譯與網(wǎng)站本地化》(節(jié)選)翻譯報(bào)告[D];廣東外語外貿(mào)大學(xué);2017年
6 謝婧;翻譯單位研究:機(jī)器翻譯路徑[D];江南大學(xué);2017年
,本文編號:1809540
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1809540.html