天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的雙語長(zhǎng)句分割方法研究

發(fā)布時(shí)間:2023-05-20 12:46
  機(jī)器翻譯是自然語言處理重要的研究領(lǐng)域。目前神經(jīng)機(jī)器翻譯的性能依賴于高質(zhì)量大規(guī)模的平行語料庫。受計(jì)算資源、訓(xùn)練時(shí)間以及模型框架限制,模型訓(xùn)練只能利用長(zhǎng)度適中的平行句對(duì),過長(zhǎng)的句對(duì)會(huì)被丟棄,造成資源浪費(fèi)。因此,研究如何把雙語長(zhǎng)句分割成為有效的句對(duì),具有重要的理論意義和實(shí)用價(jià)值。傳統(tǒng)的雙語句對(duì)分割方法包括基于規(guī)則、基于統(tǒng)計(jì)、規(guī)則和統(tǒng)計(jì)結(jié)合的方法等。但是此類方法存在對(duì)語種具有依存性、分割精度不高等缺點(diǎn)。為了解決此問題,本文重點(diǎn)研究基于深度學(xué)習(xí)的雙語平行語料庫的長(zhǎng)句對(duì)的分割方法,從而提高語料的利用率,提高翻譯系統(tǒng)的翻譯精度和翻譯質(zhì)量。本文的主要工作和創(chuàng)新點(diǎn)包括:(1)提出了一種基于深度學(xué)習(xí)的雙語長(zhǎng)句分割方法,通過結(jié)合單語分割模型和句子對(duì)齊模型召回長(zhǎng)句對(duì)中高質(zhì)量的短句對(duì)。實(shí)驗(yàn)結(jié)果證明,該雙語分割方法的分割精度得到了有效提升,并可提升機(jī)器翻譯的性能。(2)提出了融合依存句法結(jié)構(gòu)的單語長(zhǎng)句分割模型,通過結(jié)合基于神經(jīng)網(wǎng)絡(luò)的序列標(biāo)注方法和依存句法結(jié)構(gòu)提高單語分割的精度。實(shí)驗(yàn)結(jié)果證明,相較于傳統(tǒng)方法,本文提出方法在中文單語長(zhǎng)句分割任務(wù)上F1值提升了 2.06個(gè)百分點(diǎn),在英文長(zhǎng)句分割任務(wù)上F1值提升了 0.9...

【文章頁數(shù)】:74 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀
    1.3 論文研究?jī)?nèi)容
2 相關(guān)理論與技術(shù)
    2.1 基于詞對(duì)齊模型的雙語分割
        2.1.1 IBM模型
        2.1.2 詞對(duì)齊分割方法
    2.2 漢語長(zhǎng)句分割方法
        2.2.1 基于統(tǒng)計(jì)的分割方法
        2.2.2 基于分類器的分割方法
    2.3 英語長(zhǎng)句分割方法
        2.3.1 基于規(guī)則的分割方法
        2.3.2 基于翻譯的分割方法
        2.3.3 基于多策略的分割方法
    2.4 雙語對(duì)齊方法
        2.4.1 基于長(zhǎng)度的對(duì)齊方法
        2.4.2 基于雙語詞典的對(duì)齊方法
        3.4.3 基于深度學(xué)習(xí)的對(duì)齊方法
    2.5 評(píng)價(jià)方法
    2.6 本章小結(jié)
3 結(jié)合分割模型和對(duì)齊模型的雙語分割方法
    3.1 雙語長(zhǎng)句分割方法
        3.1.1 問題分析及解決思路
        3.1.2 模型框架
    3.2 融合依存句法結(jié)構(gòu)信息的長(zhǎng)句分割模型
        3.2.1 問題分析及解決思路
        3.2.2 BI-LSTM+CRF架構(gòu)
        3.2.3 依存句法介紹
        3.2.4 模型框架
    3.3 基于預(yù)訓(xùn)練語言模型的雙語對(duì)齊模型
        3.3.1 問題分析及解決思路
        3.3.2 預(yù)訓(xùn)練語言模型
        3.3.3 模型框架
    3.4 本章小結(jié)
4 實(shí)驗(yàn)及分析
    4.1 中文長(zhǎng)句分割實(shí)驗(yàn)
        4.1.1 數(shù)據(jù)獲得
        4.1.2 實(shí)驗(yàn)設(shè)置
        4.1.3 實(shí)驗(yàn)結(jié)果
        4.1.4 結(jié)果分析
    4.2 英文長(zhǎng)句分割實(shí)驗(yàn)
        4.2.1 數(shù)據(jù)獲得
        4.2.2 數(shù)據(jù)處理
        4.2.3 實(shí)驗(yàn)結(jié)果
        4.2.4 結(jié)果分析
    4.3 中英雙語對(duì)齊實(shí)驗(yàn)
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)
        4.3.2 實(shí)驗(yàn)結(jié)果
        4.3.3 結(jié)果分析
    4.4 雙語分割方法在中英機(jī)器翻譯上的實(shí)驗(yàn)
        4.4.1 實(shí)驗(yàn)數(shù)據(jù)
        4.4.2 實(shí)驗(yàn)設(shè)置
        4.4.3 實(shí)驗(yàn)評(píng)價(jià)方法
        4.4.4 實(shí)驗(yàn)結(jié)果及分析
    4.5 本章小結(jié)
5 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)歷及攻讀碩士/博士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集



本文編號(hào):3821141

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3821141.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶91389***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日本中文在线不卡视频| 日本精品免费在线观看| 久久香蕉综合网精品视频| 久久三级国外久久久三级| 嫩草国产福利视频一区二区| 欧美不卡高清一区二区三区| 日韩精品中文在线观看| 黄色片一区二区三区高清| 国产欧美韩日一区二区三区| 欧美美女视频在线免费看| 国产精品久久熟女吞精| 日韩不卡一区二区在线| 欧美日韩久久精品一区二区| 国产又粗又爽又猛又黄的| 99久久国产精品成人观看| 91老熟妇嗷嗷叫太91| 成人午夜激情在线免费观看| 欧美日韩精品久久亚洲区熟妇人| 亚洲欧美精品伊人久久| 国内胖女人做爰视频有没有| 中文字幕久热精品视频在线| 久久精品国产第一区二区三区| 亚洲国产精品一区二区| 亚洲中文字幕综合网在线| 日韩人妻免费视频一专区| 亚洲欧美天堂精品在线| 激情图日韩精品中文字幕| 精品一区二区三区中文字幕| 加勒比系列一区二区在线观看| 国产一区欧美一区二区| 国产精品丝袜一二三区| 亚洲精品一区三区三区| 欧美日韩精品综合一区| 不卡中文字幕在线免费看| 亚洲午夜福利视频在线| 福利一区二区视频在线| 老司机亚洲精品一区二区| 国产一区二区三区成人精品| 国产精品九九九一区二区| 国产精品免费自拍视频| 国产又黄又猛又粗又爽的片|