基于詞對(duì)和詞典的句子對(duì)齊研究
發(fā)布時(shí)間:2022-10-10 16:39
句子對(duì)齊是將源語(yǔ)言文本中的句子映射到目標(biāo)語(yǔ)言文本中對(duì)應(yīng)翻譯的過(guò)程,作為構(gòu)建和擴(kuò)充平行語(yǔ)料庫(kù)的核心技術(shù),其性能的優(yōu)劣影響著平行語(yǔ)料庫(kù)的質(zhì)量。本文集中于通過(guò)神經(jīng)網(wǎng)絡(luò)建模句對(duì)間的詞對(duì)關(guān)系、詞對(duì)重要性以及融入詞典知識(shí)來(lái)改進(jìn)句子對(duì)齊性能的研究,主要內(nèi)容如下:(1)基于詞對(duì)建模的句子對(duì)齊?紤]到相互對(duì)齊的兩個(gè)句子中通常含有大量相互對(duì)齊的詞對(duì)這一事實(shí),本文探索源語(yǔ)言句子和目標(biāo)語(yǔ)言句子之間的詞對(duì)關(guān)系,并提出了基于詞對(duì)建模的句子對(duì)齊方法。該方法首先利用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)編碼輸入的句對(duì),然后使用門關(guān)聯(lián)網(wǎng)絡(luò)來(lái)計(jì)算句對(duì)中詞對(duì)的語(yǔ)義關(guān)系,并通過(guò)多層感知器進(jìn)一步融合語(yǔ)義關(guān)系來(lái)判斷該句對(duì)是否對(duì)齊。(2)帶多視角注意力的基于詞對(duì)驅(qū)動(dòng)句子對(duì)齊。考慮到對(duì)齊的句對(duì)中包含多個(gè)對(duì)齊的詞對(duì),而這些詞對(duì)在句對(duì)語(yǔ)義關(guān)系中又扮演著不同重要程度的角色,本文探討了建模詞對(duì)重要性及其關(guān)系的句子對(duì)齊方法。首先通過(guò)融合三種相似性度量方法的詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)從三種角度獲取詞對(duì)間語(yǔ)義關(guān)系,然后利用多視角注意力網(wǎng)絡(luò)同樣地從三種角度對(duì)詞對(duì)重要性進(jìn)行建模,最后通過(guò)二者結(jié)合來(lái)確定句對(duì)是否對(duì)齊。(3)融入詞典知識(shí)的基于詞對(duì)驅(qū)動(dòng)句子對(duì)齊。受大部分借助外部詞典的句子對(duì)...
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)知識(shí)
2.1 句子對(duì)齊任務(wù)簡(jiǎn)介
2.2 句子對(duì)齊算法
2.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 門控循環(huán)單元
2.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 語(yǔ)料資源和性能評(píng)測(cè)指標(biāo)
2.4.1 語(yǔ)料資源
2.4.2 性能評(píng)測(cè)指標(biāo)
2.5 本章小結(jié)
第3章 基于詞對(duì)建模的句子對(duì)齊
3.1 引言
3.2 問(wèn)題描述
3.3 基于詞對(duì)建模的神經(jīng)網(wǎng)絡(luò)模型
3.3.1 詞向量層
3.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)層
3.3.3 門關(guān)聯(lián)網(wǎng)絡(luò)層
3.3.4 最大池化層
3.3.5 多層感知器層
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果
3.4.3 實(shí)驗(yàn)分析
3.5 本章小結(jié)
第4章 帶多視角注意力的基于詞對(duì)驅(qū)動(dòng)句子對(duì)齊
4.1 引言
4.2 多視角注意力的詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)模型
4.2.1 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
4.2.2 詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)
4.2.3 多視角注意力網(wǎng)絡(luò)
4.2.4 最大池化和多層感知器
4.2.5 模型訓(xùn)練
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果
4.3.3 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第5章 融入詞典知識(shí)的基于詞對(duì)驅(qū)動(dòng)句子對(duì)齊
5.1 引言
5.2 融入詞典知識(shí)的詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)模型
5.2.1 基于詞典建模的神經(jīng)網(wǎng)絡(luò)模型
5.2.2 混合編碼器
5.2.3 特征編碼器
5.2.4 門控編碼器
5.3 構(gòu)建雙語(yǔ)詞典
5.4 實(shí)驗(yàn)結(jié)果與分析
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 實(shí)驗(yàn)結(jié)果
5.4.3 實(shí)驗(yàn)分析
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的科研成果
攻讀學(xué)位期間參與的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)的句子對(duì)齊研究[J]. 丁穎,李軍輝,周國(guó)棟. 中文信息學(xué)報(bào). 2019(07)
[2]漢英句子對(duì)齊長(zhǎng)度計(jì)算方法的研究[J]. 張霞,昝紅英,張恩展. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(18)
[3]基于長(zhǎng)度和位置信息的雙語(yǔ)句子對(duì)齊方法[J]. 李維剛,劉挺,張宇,李生. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2006(05)
[4]漢英雙語(yǔ)庫(kù)自動(dòng)分段對(duì)齊研究[J]. 王斌,劉群,張祥. 軟件學(xué)報(bào). 2000(11)
本文編號(hào):3689986
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)知識(shí)
2.1 句子對(duì)齊任務(wù)簡(jiǎn)介
2.2 句子對(duì)齊算法
2.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 門控循環(huán)單元
2.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 語(yǔ)料資源和性能評(píng)測(cè)指標(biāo)
2.4.1 語(yǔ)料資源
2.4.2 性能評(píng)測(cè)指標(biāo)
2.5 本章小結(jié)
第3章 基于詞對(duì)建模的句子對(duì)齊
3.1 引言
3.2 問(wèn)題描述
3.3 基于詞對(duì)建模的神經(jīng)網(wǎng)絡(luò)模型
3.3.1 詞向量層
3.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)層
3.3.3 門關(guān)聯(lián)網(wǎng)絡(luò)層
3.3.4 最大池化層
3.3.5 多層感知器層
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果
3.4.3 實(shí)驗(yàn)分析
3.5 本章小結(jié)
第4章 帶多視角注意力的基于詞對(duì)驅(qū)動(dòng)句子對(duì)齊
4.1 引言
4.2 多視角注意力的詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)模型
4.2.1 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
4.2.2 詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)
4.2.3 多視角注意力網(wǎng)絡(luò)
4.2.4 最大池化和多層感知器
4.2.5 模型訓(xùn)練
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果
4.3.3 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第5章 融入詞典知識(shí)的基于詞對(duì)驅(qū)動(dòng)句子對(duì)齊
5.1 引言
5.2 融入詞典知識(shí)的詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)模型
5.2.1 基于詞典建模的神經(jīng)網(wǎng)絡(luò)模型
5.2.2 混合編碼器
5.2.3 特征編碼器
5.2.4 門控編碼器
5.3 構(gòu)建雙語(yǔ)詞典
5.4 實(shí)驗(yàn)結(jié)果與分析
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 實(shí)驗(yàn)結(jié)果
5.4.3 實(shí)驗(yàn)分析
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的科研成果
攻讀學(xué)位期間參與的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于詞對(duì)關(guān)聯(lián)網(wǎng)絡(luò)的句子對(duì)齊研究[J]. 丁穎,李軍輝,周國(guó)棟. 中文信息學(xué)報(bào). 2019(07)
[2]漢英句子對(duì)齊長(zhǎng)度計(jì)算方法的研究[J]. 張霞,昝紅英,張恩展. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(18)
[3]基于長(zhǎng)度和位置信息的雙語(yǔ)句子對(duì)齊方法[J]. 李維剛,劉挺,張宇,李生. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2006(05)
[4]漢英雙語(yǔ)庫(kù)自動(dòng)分段對(duì)齊研究[J]. 王斌,劉群,張祥. 軟件學(xué)報(bào). 2000(11)
本文編號(hào):3689986
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3689986.html
最近更新
教材專著