天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于單語(yǔ)語(yǔ)料庫(kù)訓(xùn)練的蒙漢機(jī)器翻譯的研究

發(fā)布時(shí)間:2023-11-08 18:24
  機(jī)器翻譯是人工智能領(lǐng)域的重要研究課題之一,主要目標(biāo)是研究如何使用計(jì)算機(jī)實(shí)現(xiàn)一種自然語(yǔ)言到另一種自然語(yǔ)言的自動(dòng)轉(zhuǎn)換。隨著互聯(lián)網(wǎng)的不斷發(fā)展和研究方法的不斷改進(jìn),機(jī)器翻譯性能也隨之不斷提高。雖然從目前的研究現(xiàn)狀來(lái)看,神經(jīng)機(jī)器翻譯在資源豐富且有大規(guī)模高質(zhì)量廣覆蓋面的平行語(yǔ)料的語(yǔ)種上取得了很好的翻譯效果,但是在平行語(yǔ)料稀少的語(yǔ)種上卻表現(xiàn)不佳。然而作為一種數(shù)據(jù)驅(qū)動(dòng)的方法,只有當(dāng)訓(xùn)練語(yǔ)料庫(kù)達(dá)到一定的要求,其才會(huì)體現(xiàn)出較好的翻譯效果,而少數(shù)民族地區(qū)經(jīng)濟(jì)文化發(fā)展普遍相對(duì)緩慢,可以收集到的平行語(yǔ)料資源相對(duì)較少。在這種情況下,神經(jīng)機(jī)器翻譯很難取得理想的效果。因此,為了充分利用現(xiàn)有單語(yǔ)數(shù)據(jù)提高蒙漢機(jī)器翻譯系統(tǒng)的性能,本文進(jìn)行了基于單語(yǔ)語(yǔ)料庫(kù)訓(xùn)練的蒙漢機(jī)器翻譯的研究。首先,針對(duì)蒙漢機(jī)器翻譯中平行語(yǔ)料資源稀缺的問(wèn)題,總結(jié)出實(shí)現(xiàn)基于單語(yǔ)語(yǔ)料庫(kù)訓(xùn)練的三大原則:預(yù)訓(xùn)練語(yǔ)言模型、初始化翻譯模型和迭代回譯優(yōu)化初始翻譯模型。并就三大原則中的第一條進(jìn)行了深入的研究,發(fā)現(xiàn)基于多頭自注意力機(jī)制融合蒙漢單語(yǔ)和雙語(yǔ)語(yǔ)料預(yù)訓(xùn)練跨蒙漢語(yǔ)言模型能夠在很大程度上提升翻譯模型的性能。其次,另外一個(gè)工作是對(duì)語(yǔ)料進(jìn)行融合不同粒度的切分比較。蒙古文詞...

【文章頁(yè)數(shù)】:69 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景
    1.2 研究目的及意義
    1.3 國(guó)內(nèi)外研究現(xiàn)狀
    1.4 研究?jī)?nèi)容
    1.5 組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)與理論概述
    2.1 神經(jīng)機(jī)器翻譯
    2.2 基于單語(yǔ)語(yǔ)料庫(kù)訓(xùn)練的神經(jīng)機(jī)器翻譯
        2.2.1 半監(jiān)督神經(jīng)機(jī)器翻譯
        2.2.2 無(wú)監(jiān)督神經(jīng)機(jī)器翻譯
    2.3 評(píng)測(cè)方法
    2.4 本章小節(jié)
第三章 融合不同粒度的語(yǔ)料切分的研究
    3.1 詞級(jí)粒度
        3.1.1 基于條件隨機(jī)場(chǎng)分詞
        3.1.2 實(shí)驗(yàn)設(shè)置和結(jié)果分析
        3.1.3 融合雙向LSTM和 CRF(Bi-LSTM-CRF)模型分詞
        3.1.4 實(shí)驗(yàn)設(shè)置和結(jié)果分析
    3.2 子詞級(jí)粒度
        3.2.1 字節(jié)對(duì)編碼
        3.2.2 實(shí)驗(yàn)設(shè)置和結(jié)果分析
    3.3 融合不同粒度
        3.3.1 融合詞級(jí)粒度和子詞級(jí)粒度
        3.3.2 實(shí)驗(yàn)設(shè)置和結(jié)果分析
    3.4 本章小結(jié)
第四章 基于單語(yǔ)語(yǔ)料庫(kù)訓(xùn)練的研究
    4.1 跨語(yǔ)言詞嵌入表示
    4.2 構(gòu)造蒙漢雙語(yǔ)字典
        4.2.1 最近鄰搜索
        4.2.2 生成式對(duì)抗訓(xùn)練
    4.3 蒙漢機(jī)器翻譯
        4.3.1 訓(xùn)練蒙漢語(yǔ)言模型
        4.3.2 初始化蒙漢機(jī)器翻譯模型
        4.3.3 迭代回譯
    4.4 實(shí)驗(yàn)設(shè)置
    4.5 實(shí)驗(yàn)結(jié)果
        4.5.1 跨語(yǔ)言詞嵌入
        4.5.2 蒙漢翻譯模型
    4.6 基于LSTM神經(jīng)網(wǎng)絡(luò)的蒙漢機(jī)器翻譯模型
        4.6.1 基于LSTM的神經(jīng)網(wǎng)絡(luò)模型
        4.6.2 實(shí)驗(yàn)過(guò)程
    4.7 實(shí)驗(yàn)分析
    4.8 本章小結(jié)
第五章 預(yù)訓(xùn)練跨蒙漢語(yǔ)言模型的研究
    5.1 語(yǔ)言模型及預(yù)訓(xùn)練
    5.2 基于多頭自注意力機(jī)制的研究
        5.2.1 基于多頭自注意力機(jī)制框架的構(gòu)建
        5.2.2 實(shí)驗(yàn)設(shè)置
        5.2.3 實(shí)驗(yàn)結(jié)果
    5.3 基于預(yù)訓(xùn)練語(yǔ)言模型的蒙漢機(jī)器翻譯
        5.3.1 實(shí)驗(yàn)設(shè)置
        5.3.2 實(shí)驗(yàn)結(jié)果
    5.4 平行語(yǔ)料改進(jìn)預(yù)訓(xùn)練語(yǔ)言模型
    5.5 實(shí)驗(yàn)結(jié)論與分析
    5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文及研究成果



本文編號(hào):3861502

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3861502.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶20e0a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com