融入頭—修飾詞調(diào)序模型的短語(yǔ)統(tǒng)計(jì)機(jī)器翻譯方法研究
發(fā)布時(shí)間:2021-06-26 02:42
機(jī)器翻譯是自然語(yǔ)言處理領(lǐng)域一個(gè)古老而經(jīng)典的課題。機(jī)器翻譯經(jīng)歷了從詞到短語(yǔ),從規(guī)則到統(tǒng)計(jì)的演變過(guò)程。目前機(jī)器翻譯的研究正日趨成熟,融入句法信息的統(tǒng)計(jì)機(jī)器方法成為目前機(jī)器翻譯領(lǐng)域的一個(gè)熱點(diǎn)。我們提出了一個(gè)將完全句法分析信息融入短語(yǔ)統(tǒng)計(jì)機(jī)器翻譯的方法,并根據(jù)該方法實(shí)現(xiàn)了一個(gè)基于源語(yǔ)言端完全句法分析的機(jī)器翻譯系統(tǒng)。該系統(tǒng)前端以一個(gè)完全句法分析器作為輸入,翻譯系統(tǒng)的框架采用基于短語(yǔ)的機(jī)器翻譯解碼算法;在翻譯過(guò)程中,解碼器首先將源語(yǔ)言的完全句法結(jié)構(gòu)轉(zhuǎn)化成頭-修飾結(jié)構(gòu),在解碼過(guò)程中融入基于頭-修飾的調(diào)序模型改善翻譯系統(tǒng)的調(diào)序,進(jìn)而明顯的提升了短語(yǔ)系統(tǒng)的翻譯性能。具體的,本文工作主要包含以下幾個(gè)部分內(nèi)容:(1)在前端的完全句法分析算法中,我們采用了基于詞匯化頭-修飾上下文的頭驅(qū)動(dòng)句法分析模型。數(shù)據(jù)稀疏是詞匯化模型的重要問題,平滑方法是似然模型中解決數(shù)據(jù)稀疏的主要方法。本文在頭驅(qū)動(dòng)句法分析模型下,基于經(jīng)典插值平滑算法,提出了以統(tǒng)計(jì)空間中平均事件數(shù)為基礎(chǔ)的直接插值平滑算法,并應(yīng)用經(jīng)典的誤差理論分析了該算法的合理性;谠撍惴,并借鑒了語(yǔ)言模型中其他插值平滑算法對(duì)模型的零點(diǎn)進(jìn)行假設(shè)的方法,在頭驅(qū)動(dòng)句法分析模...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:132 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景和意義
1.2 研究現(xiàn)狀
1.2.1 基于串的機(jī)器翻譯模型
1.2.2 基于顯式句法的機(jī)器翻譯模型
1.2.3 在基于串的模型中融入語(yǔ)言學(xué)分析的機(jī)器翻譯模型
1.3 本文研究?jī)?nèi)容
第2章 基于頭-修飾結(jié)構(gòu)的頭驅(qū)動(dòng)完全句法分析
2.1 引言
2.2 完全句法分析與基于頭-修飾結(jié)構(gòu)的頭驅(qū)動(dòng)文法
2.2.1 基于n 元文法的完全句法分析
2.2.2 基于數(shù)據(jù)驅(qū)動(dòng)的完全句法分析
2.2.3 基于頭-修飾結(jié)構(gòu)的頭驅(qū)動(dòng)句法分析
2.2.4 完全句法分析與機(jī)器翻譯的相關(guān)性
2.3 數(shù)據(jù)稀疏與直接插值平滑算法研究
2.3.1 頭驅(qū)動(dòng)句法分析的概率模型
2.3.2 頭驅(qū)動(dòng)句法分析中的平滑算法
2.3.3 條件極大似然估計(jì)(MCLE)空間下的插值平滑算法
2.3.4 頭驅(qū)動(dòng)句法分析模型下的直接插值平滑算法
2.3.5 基于統(tǒng)計(jì)誤差分析的直接插值權(quán)值建模與分析
2.4 實(shí)驗(yàn)及討論
2.5 本章小結(jié)
第3章 基于頭-修飾的詞調(diào)序模型
3.1 引言
3.2 基于翻譯概率的對(duì)齊處理算法
3.2.1 面向詞級(jí)別調(diào)序模型的對(duì)齊約束
3.2.2 基于對(duì)齊約束和翻譯概率的對(duì)齊處理算法
3.3 詞級(jí)別的調(diào)序模型
3.3.1 基于翻譯參照詞的序
3.3.2 基于調(diào)序參照詞的兩種詞級(jí)別調(diào)序
3.3.3 基于翻譯參照詞的高維調(diào)序
3.3.4 詞級(jí)別的翻譯的調(diào)序模型的參數(shù)估計(jì)
3.4 融入頭-修飾結(jié)構(gòu)的詞級(jí)別調(diào)序模型
3.4.1 基于頭-修飾依存結(jié)構(gòu)的調(diào)序
3.4.2 基于頭-修飾結(jié)構(gòu)調(diào)序模型中的上下文
3.5 實(shí)驗(yàn)及討論
3.6 本章小結(jié)
第4章 基于翻譯狀態(tài)剪枝的短語(yǔ)機(jī)器翻譯解碼算法
4.1 引言
4.2 基于短語(yǔ)的機(jī)器翻譯模型及其調(diào)序問題
4.2.1 基于短語(yǔ)模型的翻譯模型
4.2.2 基于短語(yǔ)模型中的調(diào)序問題
4.3 基于短語(yǔ)機(jī)器翻譯中的剪枝策略
4.3.1 風(fēng)險(xiǎn)剪枝策略
4.3.2 無(wú)風(fēng)險(xiǎn)剪枝策略
4.3.3 基于無(wú)風(fēng)險(xiǎn)剪枝的翻譯路徑的組織方法
4.4 基于短語(yǔ)的機(jī)器翻譯模型的解碼算法
4.4.1 基于翻譯狀態(tài)的1-best 解碼方法
4.4.2 基于翻譯狀態(tài)的n-best 解碼方法
4.5 實(shí)驗(yàn)及討論
4.5.1 實(shí)驗(yàn)語(yǔ)料
4.5.2 解碼器設(shè)置和翻譯模型
4.5.3 實(shí)驗(yàn)結(jié)果討論
4.6 本章小結(jié)
第5章 融入頭-修飾結(jié)構(gòu)的基于短語(yǔ)的機(jī)器翻譯
5.1 引言
5.2 基于頭-修飾成分的機(jī)器翻譯模型的訓(xùn)練方法
5.2.1 頭-修飾成分的抽取方法
5.2.2 調(diào)序模型的抽取方法
5.3 融入詞級(jí)別調(diào)序模型的機(jī)器翻譯的解碼算法
5.4 實(shí)驗(yàn)及討論
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 實(shí)驗(yàn)結(jié)果及討論
5.5 相關(guān)方法的比較
5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的學(xué)術(shù)論文及其它成果
致謝
個(gè)人簡(jiǎn)歷
【參考文獻(xiàn)】:
博士論文
[1]基于詞匯化統(tǒng)計(jì)模型的漢語(yǔ)句法分析研究[D]. 曹海龍.哈爾濱工業(yè)大學(xué) 2006
本文編號(hào):3250466
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:132 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景和意義
1.2 研究現(xiàn)狀
1.2.1 基于串的機(jī)器翻譯模型
1.2.2 基于顯式句法的機(jī)器翻譯模型
1.2.3 在基于串的模型中融入語(yǔ)言學(xué)分析的機(jī)器翻譯模型
1.3 本文研究?jī)?nèi)容
第2章 基于頭-修飾結(jié)構(gòu)的頭驅(qū)動(dòng)完全句法分析
2.1 引言
2.2 完全句法分析與基于頭-修飾結(jié)構(gòu)的頭驅(qū)動(dòng)文法
2.2.1 基于n 元文法的完全句法分析
2.2.2 基于數(shù)據(jù)驅(qū)動(dòng)的完全句法分析
2.2.3 基于頭-修飾結(jié)構(gòu)的頭驅(qū)動(dòng)句法分析
2.2.4 完全句法分析與機(jī)器翻譯的相關(guān)性
2.3 數(shù)據(jù)稀疏與直接插值平滑算法研究
2.3.1 頭驅(qū)動(dòng)句法分析的概率模型
2.3.2 頭驅(qū)動(dòng)句法分析中的平滑算法
2.3.3 條件極大似然估計(jì)(MCLE)空間下的插值平滑算法
2.3.4 頭驅(qū)動(dòng)句法分析模型下的直接插值平滑算法
2.3.5 基于統(tǒng)計(jì)誤差分析的直接插值權(quán)值建模與分析
2.4 實(shí)驗(yàn)及討論
2.5 本章小結(jié)
第3章 基于頭-修飾的詞調(diào)序模型
3.1 引言
3.2 基于翻譯概率的對(duì)齊處理算法
3.2.1 面向詞級(jí)別調(diào)序模型的對(duì)齊約束
3.2.2 基于對(duì)齊約束和翻譯概率的對(duì)齊處理算法
3.3 詞級(jí)別的調(diào)序模型
3.3.1 基于翻譯參照詞的序
3.3.2 基于調(diào)序參照詞的兩種詞級(jí)別調(diào)序
3.3.3 基于翻譯參照詞的高維調(diào)序
3.3.4 詞級(jí)別的翻譯的調(diào)序模型的參數(shù)估計(jì)
3.4 融入頭-修飾結(jié)構(gòu)的詞級(jí)別調(diào)序模型
3.4.1 基于頭-修飾依存結(jié)構(gòu)的調(diào)序
3.4.2 基于頭-修飾結(jié)構(gòu)調(diào)序模型中的上下文
3.5 實(shí)驗(yàn)及討論
3.6 本章小結(jié)
第4章 基于翻譯狀態(tài)剪枝的短語(yǔ)機(jī)器翻譯解碼算法
4.1 引言
4.2 基于短語(yǔ)的機(jī)器翻譯模型及其調(diào)序問題
4.2.1 基于短語(yǔ)模型的翻譯模型
4.2.2 基于短語(yǔ)模型中的調(diào)序問題
4.3 基于短語(yǔ)機(jī)器翻譯中的剪枝策略
4.3.1 風(fēng)險(xiǎn)剪枝策略
4.3.2 無(wú)風(fēng)險(xiǎn)剪枝策略
4.3.3 基于無(wú)風(fēng)險(xiǎn)剪枝的翻譯路徑的組織方法
4.4 基于短語(yǔ)的機(jī)器翻譯模型的解碼算法
4.4.1 基于翻譯狀態(tài)的1-best 解碼方法
4.4.2 基于翻譯狀態(tài)的n-best 解碼方法
4.5 實(shí)驗(yàn)及討論
4.5.1 實(shí)驗(yàn)語(yǔ)料
4.5.2 解碼器設(shè)置和翻譯模型
4.5.3 實(shí)驗(yàn)結(jié)果討論
4.6 本章小結(jié)
第5章 融入頭-修飾結(jié)構(gòu)的基于短語(yǔ)的機(jī)器翻譯
5.1 引言
5.2 基于頭-修飾成分的機(jī)器翻譯模型的訓(xùn)練方法
5.2.1 頭-修飾成分的抽取方法
5.2.2 調(diào)序模型的抽取方法
5.3 融入詞級(jí)別調(diào)序模型的機(jī)器翻譯的解碼算法
5.4 實(shí)驗(yàn)及討論
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 實(shí)驗(yàn)結(jié)果及討論
5.5 相關(guān)方法的比較
5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的學(xué)術(shù)論文及其它成果
致謝
個(gè)人簡(jiǎn)歷
【參考文獻(xiàn)】:
博士論文
[1]基于詞匯化統(tǒng)計(jì)模型的漢語(yǔ)句法分析研究[D]. 曹海龍.哈爾濱工業(yè)大學(xué) 2006
本文編號(hào):3250466
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/3250466.html
最近更新
教材專著