天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于谷歌神經(jīng)機(jī)器翻譯的英漢翻譯研究

發(fā)布時(shí)間:2022-02-12 14:08
  近年來(lái),隨著深度學(xué)習(xí)的再度興起,神經(jīng)機(jī)器翻譯NMT逐漸取代了傳統(tǒng)的基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯方法,特別是基于Seq2Seq的神經(jīng)機(jī)器翻譯模型比較契合端對(duì)端的語(yǔ)言翻譯模式,獲得了業(yè)界研究人員的重點(diǎn)關(guān)注。然而與傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯相比,神經(jīng)機(jī)器翻譯,特別是基于大規(guī)模數(shù)據(jù)集的神經(jīng)機(jī)器翻譯模型仍然存在缺陷,其訓(xùn)練和推理速度緩慢、存在翻譯不完全的問(wèn)題被暴露出來(lái)。同時(shí)受詞匯表規(guī)模的限制,神經(jīng)機(jī)器翻譯在未登錄詞和罕見(jiàn)詞上同樣出現(xiàn)了OOV(out-of-vocabulary)問(wèn)題。針對(duì)以上提到的模型翻譯不完全和詞匯表OOV問(wèn)題,本文分別提出了以下解決方案:(1)為了解決神經(jīng)機(jī)器翻譯在未登錄詞和罕見(jiàn)詞上的OOV問(wèn)題,我們將英文文本預(yù)處理中常見(jiàn)的詞干提取技術(shù)和數(shù)據(jù)壓縮算法bpe(Byte pair encoding)相結(jié)合,提出了一種不同的基于subword(子詞)的詞序列分割方法。利用該方法我們將英文文本分割為由子詞單元組成的詞序列,同時(shí)利用unigram將中文文本分割為由漢字組成的字符序列。(2)為了防止解碼器出現(xiàn)翻譯不完全的現(xiàn)象,本文采用了一種可以提高解碼器獲取上下文信息能力的改進(jìn)Attention機(jī)制—... 

【文章來(lái)源】:武漢大學(xué)湖北省211工程院校985工程院校教育部直屬院校

【文章頁(yè)數(shù)】:66 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于谷歌神經(jīng)機(jī)器翻譯的英漢翻譯研究


MP神經(jīng)元結(jié)構(gòu)

基于谷歌神經(jīng)機(jī)器翻譯的英漢翻譯研究


損失函數(shù)曲面圖

基于谷歌神經(jīng)機(jī)器翻譯的英漢翻譯研究


一種簡(jiǎn)單的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器翻譯方法研究與發(fā)展綜述[J]. 侯強(qiáng),侯瑞麗.  計(jì)算機(jī)工程與應(yīng)用. 2019(10)
[2]知識(shí)圖譜技術(shù)研究綜述[J]. 歐艷鵬.  電子世界. 2018(13)
[3]中國(guó)翻譯服務(wù)業(yè)研究現(xiàn)狀分析[J]. 司顯柱,郭小潔.  北京第二外國(guó)語(yǔ)學(xué)院學(xué)報(bào). 2018(03)
[4]結(jié)合LSTM和CNN混合架構(gòu)的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型[J]. 王毅,謝娟,成穎.  情報(bào)學(xué)報(bào). 2018(02)
[5]機(jī)器翻譯的歷史和現(xiàn)狀[J]. 馮志偉.  國(guó)外自動(dòng)化. 1984(04)

碩士論文
[1]基于實(shí)例的蒙漢機(jī)器翻譯的研究[D]. 李慧旻.內(nèi)蒙古工業(yè)大學(xué) 2016



本文編號(hào):3621861

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3621861.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5334d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com