天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言學(xué)論文 >

基于注意力機(jī)制編解碼框架的神經(jīng)機(jī)器翻譯方法研究

發(fā)布時間:2021-12-23 07:09
  近年來,神經(jīng)機(jī)器翻譯發(fā)展迅速,無論是從性能還是復(fù)雜性上相對傳統(tǒng)的統(tǒng)計機(jī)器翻譯都展現(xiàn)了極大的優(yōu)勢。本文針對傳統(tǒng)基于注意力機(jī)制RNN-RNN編解碼框架的神經(jīng)機(jī)器翻譯模型進(jìn)行方法研究。對傳統(tǒng)神經(jīng)機(jī)器翻譯所存在的特征提取能力不足、實詞的原始詞向量信息缺失、過譯、漏譯以及數(shù)據(jù)稀缺等問題,本文從基于注意力機(jī)制編解碼框架下可分離的編碼器、注意力機(jī)制以及解碼器三個子模塊著手進(jìn)行改進(jìn)以緩解特定問題。編碼器作為基于注意力機(jī)制編解碼框架神經(jīng)機(jī)器翻譯系統(tǒng)的特征提取器,相當(dāng)于整個框架的基石,其特征提取能力直接決定了翻譯系統(tǒng)所能取得的性能上限。針對傳統(tǒng)雙向RNN(BiRNN)編碼器所存在的特征提取能力不足的問題,本文提出了融合的多編碼器方法。針對編碼器對虛實詞不加區(qū)分使得原始信息流失而造成的實詞翻譯問題,本文引入了文本分類中的RCNN結(jié)構(gòu)以設(shè)計增強(qiáng)的編碼器。實驗結(jié)果表明本文提出的融合多編碼器方法和增強(qiáng)的編碼器設(shè)計都有效地提升了編碼器的特征提取能力,提升了系統(tǒng)的性能表現(xiàn)。過去幾年中我們看到了基于注意力機(jī)制的神經(jīng)機(jī)器翻譯的成功,并且很多變種方法被提出來提升系統(tǒng)的性能。大部分基于注意力機(jī)制的神經(jīng)機(jī)器翻譯模型均采用將源端... 

【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校

【文章頁數(shù)】:68 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于注意力機(jī)制編解碼框架的神經(jīng)機(jī)器翻譯方法研究


圖1.1基于注意力機(jī)制RNN-_編解碼框架的神經(jīng)機(jī)器翻譯框圖??由圖1.1可以看到傳統(tǒng)的基于注意力機(jī)制編解碼框架的神經(jīng)機(jī)器翻譯整體上??

示意圖,注意力機(jī)制,數(shù)學(xué)公式,解碼器


件語言模型。在解碼時,為了緩解采用貪心算法而陷入局部最優(yōu)解的問題,考慮??到整個搜索空間大小隨解碼長度成指數(shù)增長,通常采用集束搜索(beam-search)??算法近似搜尋全局最優(yōu)解,集束搜索算法示意圖如圖1.3:??從圖1.3可以看出,集束搜索解碼由句子開始符號開始,通過給定的beamjize??(圖中為5)大小生成前5個最大概率的輸出,再由這5個輸出解碼生成共5*vo-??cab_size?(表示系統(tǒng)輸出層的大小)個點的概率輸出中選出前5個最大概率的輸??出,遇到結(jié)束符號則當(dāng)前路徑結(jié)束,一直到有5個結(jié)束符號出現(xiàn),取最大概率路??徑節(jié)點作為最終輸出。其中貪心算法相當(dāng)于是bean^size大小設(shè)為1時的特殊情??況,beam_size取大一些可以相對緩解局部最優(yōu)解問題,實驗表明,隨著beam_size??的增大測試集性能逐漸上升到趨于穩(wěn)定。??8??

注意力機(jī)制,翻譯模型,集束,對數(shù)似然函數(shù)


r〇??目標(biāo)語??圖1.2注意力機(jī)制示意圖??訓(xùn)練過程中的解碼器可以數(shù)學(xué)公式化表示如下:??p?{yk\y<^?x)?=?s〇fJ?max?{E\yk.^?ck))?0.8)??h?=?f?(,*-l,^'[yt_i],cit)?(1-9)??其中,g(.)是一個分線性函數(shù),表示3^4所對應(yīng)的詞向量表示,公式表??示為Wk-小其中W表示目標(biāo)端詞向量矩陣,M表示序列^丨,乃,…,外一丨},??表示第個解碼端隱層狀態(tài),Cfc是通過注意力機(jī)制得到的包含用于生成下一個??目標(biāo)詞的源端上下文向量,整個解碼器相當(dāng)于一個以源端句子信息作為條件的條??件語言模型。在解碼時,為了緩解采用貪心算法而陷入局部最優(yōu)解的問題,考慮??到整個搜索空間大小隨解碼長度成指數(shù)增長,通常采用集束搜索(beam-search)??算法近似搜尋全局最優(yōu)解


本文編號:3548032

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3548032.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3b349***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com