基于深度學(xué)習(xí)的漢英時(shí)態(tài)翻譯研究
發(fā)布時(shí)間:2022-02-16 21:48
在日益全球化的今天,機(jī)器翻譯成為了日常生活中不可或缺的工具。中美兩國作為兩個(gè)世界大國,文化交流甚是頻繁,漢英機(jī)器翻譯的需求因此變得越來越大。隨著近幾年深度學(xué)習(xí)的急速發(fā)展,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯相比于傳統(tǒng)的機(jī)器翻譯而言取得了巨大的突破。然而,機(jī)器翻譯的效果盡管有了極大的提升,能夠滿足人的基本需求,但對于高要求的翻譯任務(wù)來說,就目前的機(jī)器翻譯來說還是遠(yuǎn)遠(yuǎn)不夠的。其中,機(jī)器翻譯的時(shí)態(tài)問題正是目前還未得到完全解決的問題。本文旨在解決漢英機(jī)器翻譯過程中的時(shí)態(tài)處理問題。通過結(jié)合前人所做的工作,本文提出基于深度學(xué)習(xí)的樹形時(shí)態(tài)標(biāo)注算法。時(shí)態(tài)標(biāo)注算法建立在馬爾科夫樹標(biāo)注模型上。馬爾科夫樹標(biāo)注模型是一種可以解決層次性問題的通用機(jī)器學(xué)習(xí)方法。語言具有層次性,從層次角度探索語言本身的含義可以獲得更多的信息。本文使用深度信念網(wǎng)絡(luò)做特征提取器,利用事先構(gòu)造好的自動(dòng)標(biāo)注算法從平行語料庫中獲得標(biāo)注數(shù)據(jù)。標(biāo)注數(shù)據(jù)為樹形結(jié)構(gòu),為了得到可供網(wǎng)絡(luò)使用的數(shù)據(jù),本文采用人工規(guī)則對標(biāo)注數(shù)據(jù)進(jìn)行編碼。網(wǎng)絡(luò)訓(xùn)練完成后,通過馬爾科夫樹標(biāo)注模型對中文句子轉(zhuǎn)換而成的不完全時(shí)態(tài)樹進(jìn)行時(shí)態(tài)標(biāo)注。實(shí)驗(yàn)表明,基于深度信念網(wǎng)絡(luò)的樹形時(shí)態(tài)標(biāo)注算法較前人的研究...
【文章來源】:廈門大學(xué)福建省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 機(jī)器翻譯國內(nèi)外研究現(xiàn)狀及發(fā)展歷程
1.2.1 基于規(guī)則的機(jī)器翻譯
1.2.2 基于實(shí)例的機(jī)器翻譯
1.2.3 統(tǒng)計(jì)機(jī)器翻譯
1.2.4 神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯
1.3 漢英時(shí)態(tài)機(jī)器翻譯研究現(xiàn)狀
1.3.1 時(shí)態(tài)標(biāo)注
1.3.2 時(shí)態(tài)機(jī)器翻譯
1.4 研究內(nèi)容
1.5 組織結(jié)構(gòu)
第二章 相關(guān)研究內(nèi)容
2.1 詞向量
2.2 深度信念網(wǎng)絡(luò)
2.3 Transformer模型
2.3.1 多頭注意力機(jī)制
2.3.2 位置編碼
2.4 本章小結(jié)
第三章 基于馬爾科夫樹標(biāo)注模型的漢英時(shí)態(tài)標(biāo)注算法
3.1 馬爾科夫樹標(biāo)注模型
3.1.1 待標(biāo)注樹的預(yù)處理
3.1.2 樹標(biāo)注模型
3.1.3 分解完全標(biāo)注樹
3.1.4 求解最佳標(biāo)注
3.2 時(shí)態(tài)樹的定義與構(gòu)造
3.2.1 時(shí)態(tài)樹的定義
3.2.2 時(shí)態(tài)樹的構(gòu)造
3.3 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
3.3.1 自動(dòng)標(biāo)注算法
3.3.2 時(shí)態(tài)樹編碼
3.4 實(shí)驗(yàn)與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)描述
3.4.3 實(shí)驗(yàn)評估指標(biāo)
3.4.4 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的漢英時(shí)態(tài)翻譯系統(tǒng)
4.1 整體思路
4.2 時(shí)態(tài)的刪除與恢復(fù)
4.2.1 Stanford依存關(guān)系
4.2.2 去時(shí)態(tài)算法
4.2.3 時(shí)態(tài)恢復(fù)算法
4.3 中英文對齊關(guān)系
4.4 數(shù)據(jù)預(yù)處理
4.5 實(shí)驗(yàn)與分析
4.5.1 實(shí)驗(yàn)描述
4.5.2 實(shí)驗(yàn)結(jié)果分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來改進(jìn)方向
5.2.1 特征自動(dòng)提取
5.2.2 語篇信息
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于樹形條件隨機(jī)場的跨語言時(shí)態(tài)標(biāo)注[J]. 陳怡疆,徐海波,史曉東,蘇暢. 軟件學(xué)報(bào). 2015(12)
[2]論漢語、英語、法語中時(shí)態(tài)表達(dá)手法的異同[J]. 許興星. 法制與社會(huì). 2007(01)
[3]一種基于實(shí)例的漢英機(jī)器翻譯策略[J]. 胡國全,陳家駿,戴新宇,尹存燕. 計(jì)算機(jī)工程與設(shè)計(jì). 2005(04)
[4]漢語的時(shí)態(tài)和時(shí)態(tài)成分[J]. 陳立民. 語言研究. 2002(03)
[5]基于實(shí)例的漢英機(jī)器翻譯系統(tǒng)研究與實(shí)現(xiàn)[J]. 王長勝,劉群. 計(jì)算機(jī)工程與應(yīng)用. 2002(08)
本文編號:3628720
【文章來源】:廈門大學(xué)福建省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 機(jī)器翻譯國內(nèi)外研究現(xiàn)狀及發(fā)展歷程
1.2.1 基于規(guī)則的機(jī)器翻譯
1.2.2 基于實(shí)例的機(jī)器翻譯
1.2.3 統(tǒng)計(jì)機(jī)器翻譯
1.2.4 神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯
1.3 漢英時(shí)態(tài)機(jī)器翻譯研究現(xiàn)狀
1.3.1 時(shí)態(tài)標(biāo)注
1.3.2 時(shí)態(tài)機(jī)器翻譯
1.4 研究內(nèi)容
1.5 組織結(jié)構(gòu)
第二章 相關(guān)研究內(nèi)容
2.1 詞向量
2.2 深度信念網(wǎng)絡(luò)
2.3 Transformer模型
2.3.1 多頭注意力機(jī)制
2.3.2 位置編碼
2.4 本章小結(jié)
第三章 基于馬爾科夫樹標(biāo)注模型的漢英時(shí)態(tài)標(biāo)注算法
3.1 馬爾科夫樹標(biāo)注模型
3.1.1 待標(biāo)注樹的預(yù)處理
3.1.2 樹標(biāo)注模型
3.1.3 分解完全標(biāo)注樹
3.1.4 求解最佳標(biāo)注
3.2 時(shí)態(tài)樹的定義與構(gòu)造
3.2.1 時(shí)態(tài)樹的定義
3.2.2 時(shí)態(tài)樹的構(gòu)造
3.3 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
3.3.1 自動(dòng)標(biāo)注算法
3.3.2 時(shí)態(tài)樹編碼
3.4 實(shí)驗(yàn)與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)
3.4.2 實(shí)驗(yàn)描述
3.4.3 實(shí)驗(yàn)評估指標(biāo)
3.4.4 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的漢英時(shí)態(tài)翻譯系統(tǒng)
4.1 整體思路
4.2 時(shí)態(tài)的刪除與恢復(fù)
4.2.1 Stanford依存關(guān)系
4.2.2 去時(shí)態(tài)算法
4.2.3 時(shí)態(tài)恢復(fù)算法
4.3 中英文對齊關(guān)系
4.4 數(shù)據(jù)預(yù)處理
4.5 實(shí)驗(yàn)與分析
4.5.1 實(shí)驗(yàn)描述
4.5.2 實(shí)驗(yàn)結(jié)果分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來改進(jìn)方向
5.2.1 特征自動(dòng)提取
5.2.2 語篇信息
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于樹形條件隨機(jī)場的跨語言時(shí)態(tài)標(biāo)注[J]. 陳怡疆,徐海波,史曉東,蘇暢. 軟件學(xué)報(bào). 2015(12)
[2]論漢語、英語、法語中時(shí)態(tài)表達(dá)手法的異同[J]. 許興星. 法制與社會(huì). 2007(01)
[3]一種基于實(shí)例的漢英機(jī)器翻譯策略[J]. 胡國全,陳家駿,戴新宇,尹存燕. 計(jì)算機(jī)工程與設(shè)計(jì). 2005(04)
[4]漢語的時(shí)態(tài)和時(shí)態(tài)成分[J]. 陳立民. 語言研究. 2002(03)
[5]基于實(shí)例的漢英機(jī)器翻譯系統(tǒng)研究與實(shí)現(xiàn)[J]. 王長勝,劉群. 計(jì)算機(jī)工程與應(yīng)用. 2002(08)
本文編號:3628720
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3628720.html
最近更新
教材專著