融合翻譯知識的漢越神經(jīng)機(jī)器翻譯研究與實現(xiàn)
發(fā)布時間:2020-05-24 23:02
【摘要】:越南位于中南半島、毗鄰我國廣西、云南兩省,在政治、經(jīng)濟(jì)等方面都是我國的重要合作伙伴。在“一帶一路”戰(zhàn)略下,我國與越南的合作空間巨大,兩國當(dāng)前越來越緊密的經(jīng)濟(jì)、文化交流對于兩國語言的機(jī)器翻譯技術(shù)提出了越來越迫切的需求。然而,已有的機(jī)器翻譯技術(shù)對于平行語料的需求與語料的稀缺性成為了阻礙這一技術(shù)發(fā)展的主要矛盾。近年來神經(jīng)機(jī)器翻譯技術(shù)已經(jīng)在多種語言對上取得了超越統(tǒng)計機(jī)器翻譯的性能,并且在譯文流暢度等方面取得了空前的成功,但這一技術(shù)同樣需要大量的平行語料作為訓(xùn)練數(shù)據(jù)。同時,在過去的統(tǒng)計機(jī)器翻譯研究過程中的成果也不可忽視。因此,研究如何將統(tǒng)計機(jī)器翻譯中的翻譯知識融合到神經(jīng)機(jī)器翻譯框架中成為了當(dāng)前的研究熱點;诖,本文將上下文約束和語言特性應(yīng)用于詞對齊建模,研究基于雙向LSTM的詞對齊模型,并進(jìn)一步研究如何將翻譯知識融合到神經(jīng)機(jī)器翻譯模型中,主要完成了以下研究工作:(1)基于雙向LSTM和語言特性融合的漢越詞對齊方法詞對齊是多種機(jī)器翻譯模型(如短語翻譯模型、句法翻譯模型)的基礎(chǔ),是短語對齊、句法樹對齊的依據(jù),是統(tǒng)計機(jī)器翻譯方法中的重要組成部分。本文使用雙向LSTM對詞對齊進(jìn)行建模,引入對齊位置的上下文信息;在此基礎(chǔ)上融合漢語-越南語語言差異,基于語言特性約束詞對齊關(guān)系,通過監(jiān)督學(xué)習(xí)調(diào)整模型參數(shù),從而獲得性能更優(yōu)的漢越自動詞對齊方法。(2)融合詞匯翻譯概率的漢越神經(jīng)機(jī)器翻譯方法神經(jīng)機(jī)器翻譯方法的參數(shù)解釋性差,很難融合詞對齊、詞典等外部翻譯知識;同時,雖然其內(nèi)部的注意力機(jī)制在某種程度上可以反映源語言詞語和目標(biāo)語言詞語的對應(yīng)關(guān)系,但這種關(guān)系并不具有顯式約束。本文提出了一種在神經(jīng)機(jī)器翻譯中融合詞匯翻譯概率的方法。首先使用一個記憶神經(jīng)網(wǎng)絡(luò)保存詞對齊信息,完成離散特征到連續(xù)特征的轉(zhuǎn)換。然后在神經(jīng)機(jī)器翻譯的解碼階段,根據(jù)目標(biāo)語言詞語及其上下文信息計算目標(biāo)語言詞語與每個源語言詞語的對齊概率。最后將這個對齊概率與注意力機(jī)制進(jìn)行融合,從而完成解碼階段目標(biāo)語言詞語的選擇。(3)融合翻譯知識的漢越神經(jīng)機(jī)器翻譯系統(tǒng)該系統(tǒng)包括機(jī)器翻譯模塊、web后端服務(wù)模塊、web前端服務(wù)模塊。其中翻譯模型的實現(xiàn)基于Google的代碼并做了大量改進(jìn),主要包括對傳統(tǒng)注意力機(jī)制的修改,將詞匯翻譯概率融合到神經(jīng)機(jī)器翻譯框架中。該系統(tǒng)對于將翻譯知識與神經(jīng)機(jī)器翻譯融合的研究具有重要的支撐作用。
【圖文】:
人提出了一種使用循環(huán)神經(jīng)網(wǎng)絡(luò)對詞對齊進(jìn)行建模所示的公式對于平行句對中的雙語詞語對齊進(jìn)行計 11 1 1 11jJJ J I jNN RNN j j ajS a f ,e t a a , f ,e jae是待對齊的兩個詞語,,RNNt 是用于計算兩個詞語對絡(luò)進(jìn)行擬合。并且 對于第j個對齊ja 的分?jǐn)?shù)的計系11ja 。這里使用的對齊分?jǐn)?shù)是非概率化的分?jǐn)?shù)。人提出的基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型如圖 3.1 所示,Layer)(將雙語詞語轉(zhuǎn)化為詞向量),隱藏層(HOutput Layer)組成,其中隱藏層由循環(huán)神經(jīng)網(wǎng)絡(luò)實單的全連接神經(jīng)網(wǎng)絡(luò)。模型的參數(shù)分別有權(quán)重矩陣在 Tamura 等人的模型中,對于前一個詞對齊和后的跨度發(fā)生改變,即j 1 j 2 j j1a a a a ,那么模型參數(shù)中的d 就是一個標(biāo)簽,指出了不同組的參數(shù)。
第三章 基于雙向 LSTM 和語言特性融合的漢越詞中: 表示漢越雙語平行句對中詞語為非修飾語時的詞對齊,即 1 1jg : e i f N;i ,...,n; j ,...,m a。似地,漢越雙語修飾語偏移模型可以由如下公式進(jìn)行定義:( ) ( )( , ) ( )r f e fl j el ilP A A f A A 融合雙向 LSTM 和語言特征的詞對齊模型 雙向 LSTM 詞對齊模型定義
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:H085
本文編號:2679133
【圖文】:
人提出了一種使用循環(huán)神經(jīng)網(wǎng)絡(luò)對詞對齊進(jìn)行建模所示的公式對于平行句對中的雙語詞語對齊進(jìn)行計 11 1 1 11jJJ J I jNN RNN j j ajS a f ,e t a a , f ,e jae是待對齊的兩個詞語,,RNNt 是用于計算兩個詞語對絡(luò)進(jìn)行擬合。并且 對于第j個對齊ja 的分?jǐn)?shù)的計系11ja 。這里使用的對齊分?jǐn)?shù)是非概率化的分?jǐn)?shù)。人提出的基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型如圖 3.1 所示,Layer)(將雙語詞語轉(zhuǎn)化為詞向量),隱藏層(HOutput Layer)組成,其中隱藏層由循環(huán)神經(jīng)網(wǎng)絡(luò)實單的全連接神經(jīng)網(wǎng)絡(luò)。模型的參數(shù)分別有權(quán)重矩陣在 Tamura 等人的模型中,對于前一個詞對齊和后的跨度發(fā)生改變,即j 1 j 2 j j1a a a a ,那么模型參數(shù)中的d 就是一個標(biāo)簽,指出了不同組的參數(shù)。
第三章 基于雙向 LSTM 和語言特性融合的漢越詞中: 表示漢越雙語平行句對中詞語為非修飾語時的詞對齊,即 1 1jg : e i f N;i ,...,n; j ,...,m a。似地,漢越雙語修飾語偏移模型可以由如下公式進(jìn)行定義:( ) ( )( , ) ( )r f e fl j el ilP A A f A A 融合雙向 LSTM 和語言特征的詞對齊模型 雙向 LSTM 詞對齊模型定義
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:H085
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 劉群;統(tǒng)計機(jī)器翻譯綜述[J];中文信息學(xué)報;2003年04期
相關(guān)博士學(xué)位論文 前1條
1 高盛祥;冶金領(lǐng)域漢越機(jī)器翻譯方法研究[D];昆明理工大學(xué);2016年
相關(guān)碩士學(xué)位論文 前1條
1 莫媛媛;漢越雙語詞語對齊方法研究[D];昆明理工大學(xué);2015年
本文編號:2679133
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/2679133.html
最近更新
教材專著