基于混合策略的藏漢人名音譯模型研究
發(fā)布時(shí)間:2022-12-05 08:18
音譯作為一種按照文字讀音進(jìn)行近似翻譯的方法,在人名翻譯中有著廣泛的應(yīng)用。人名音譯接受一個(gè)源語(yǔ)言的人名作為輸入,在保證發(fā)音基本不變的原則下,輸出與該人名以目標(biāo)語(yǔ)言表示的翻譯。在許多應(yīng)用中,例如實(shí)體翻譯,語(yǔ)料庫(kù)對(duì)齊,跨語(yǔ)言信息檢索,信息提取和自動(dòng)詞典獲取等任務(wù)中,命名實(shí)體的音譯是必不可少的子任務(wù),而人名音譯是命名實(shí)體音譯的重要組成部分。本文通過(guò)基于字素的藏漢人名音譯模型研究,總結(jié)出資源較少語(yǔ)言在音譯時(shí)的不足,提出了“先確定發(fā)音,再確定字型”的音譯策略,并通過(guò)線性組合和利用發(fā)音信息重排序的策略對(duì)候選音譯對(duì)進(jìn)行重排序。本文的主要工作和貢獻(xiàn)點(diǎn)如下:1.本文首先介紹了基于形素的藏漢人名音譯框架,并在該框架下分析比較了兩種音譯模型:聯(lián)合信源信道模型和條件隨機(jī)場(chǎng)模型。在聯(lián)合信源信道模型中,我們介紹了藏漢人名音譯模型在基于形素的前提下如何進(jìn)行切分對(duì)齊,并介紹了生成多個(gè)候選音譯對(duì)所使用的Beam Search算法,然后通過(guò)分析輸出的中間參數(shù),根據(jù)二元音譯對(duì),一元音譯對(duì),源語(yǔ)言音節(jié)和目標(biāo)語(yǔ)言音節(jié)之間的關(guān)系,找到了對(duì)應(yīng)關(guān)系矩陣稀疏的原因部分是因?yàn)闈h字中的多音字現(xiàn)象,為后面的工作做了鋪墊。在條件隨機(jī)場(chǎng)模型中,我...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 音譯的方法
1.2.2 音譯的模型方法
1.2.3 評(píng)價(jià)指標(biāo)
1.2.4 候選音譯對(duì)重排序的方法
1.2.5 藏漢人名音譯現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
第二章 基于形素的藏漢人名音譯模型
2.1 切分對(duì)齊
2.1.1 藏漢人名音譯對(duì)的切分
2.1.2 藏漢人名音譯對(duì)的對(duì)齊
2.2 基于聯(lián)合信源信道模型的藏漢人名音譯
2.2.1 聯(lián)合信源信道模型原理
2.2.2 模型的生成
2.2.3 音譯
2.3 基于條件隨機(jī)場(chǎng)的藏漢人名音譯
2.4 實(shí)驗(yàn)
2.4.1 實(shí)驗(yàn)語(yǔ)料
2.4.2 評(píng)價(jià)指標(biāo)
2.4.3 實(shí)驗(yàn)結(jié)果
2.4.4 結(jié)果分析
2.5 本章小結(jié)
第三章 基于音素的藏漢人名音譯模型
3.1 藏文到拉丁轉(zhuǎn)寫(xiě)
3.2 拉丁轉(zhuǎn)寫(xiě)到拼音
3.2.1 切分對(duì)齊
3.2.2 模型方法
3.2.3 實(shí)驗(yàn)
3.3 拼音到漢字模型
3.3.1 使用的模型方法
3.3.2 候選音譯對(duì)的生成
3.3.3 實(shí)驗(yàn)
3.4 本章小結(jié)
第四章 候選音譯對(duì)的重排序
4.1 重排序的原理
4.1.1 基于不同切分粒度的候選音譯對(duì)重排序
4.1.2 基于不同音譯模型的候選音譯對(duì)的重排序
4.2 重排序的方法
4.2.1 線性組合
4.2.2 利用發(fā)音信息重排序
4.3 實(shí)驗(yàn)
4.3.1 實(shí)驗(yàn)語(yǔ)料
4.3.2 評(píng)價(jià)指標(biāo)
4.3.3 結(jié)果
4.3.4 結(jié)果分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號(hào):3710031
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 音譯的方法
1.2.2 音譯的模型方法
1.2.3 評(píng)價(jià)指標(biāo)
1.2.4 候選音譯對(duì)重排序的方法
1.2.5 藏漢人名音譯現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
第二章 基于形素的藏漢人名音譯模型
2.1 切分對(duì)齊
2.1.1 藏漢人名音譯對(duì)的切分
2.1.2 藏漢人名音譯對(duì)的對(duì)齊
2.2 基于聯(lián)合信源信道模型的藏漢人名音譯
2.2.1 聯(lián)合信源信道模型原理
2.2.2 模型的生成
2.2.3 音譯
2.3 基于條件隨機(jī)場(chǎng)的藏漢人名音譯
2.4 實(shí)驗(yàn)
2.4.1 實(shí)驗(yàn)語(yǔ)料
2.4.2 評(píng)價(jià)指標(biāo)
2.4.3 實(shí)驗(yàn)結(jié)果
2.4.4 結(jié)果分析
2.5 本章小結(jié)
第三章 基于音素的藏漢人名音譯模型
3.1 藏文到拉丁轉(zhuǎn)寫(xiě)
3.2 拉丁轉(zhuǎn)寫(xiě)到拼音
3.2.1 切分對(duì)齊
3.2.2 模型方法
3.2.3 實(shí)驗(yàn)
3.3 拼音到漢字模型
3.3.1 使用的模型方法
3.3.2 候選音譯對(duì)的生成
3.3.3 實(shí)驗(yàn)
3.4 本章小結(jié)
第四章 候選音譯對(duì)的重排序
4.1 重排序的原理
4.1.1 基于不同切分粒度的候選音譯對(duì)重排序
4.1.2 基于不同音譯模型的候選音譯對(duì)的重排序
4.2 重排序的方法
4.2.1 線性組合
4.2.2 利用發(fā)音信息重排序
4.3 實(shí)驗(yàn)
4.3.1 實(shí)驗(yàn)語(yǔ)料
4.3.2 評(píng)價(jià)指標(biāo)
4.3.3 結(jié)果
4.3.4 結(jié)果分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號(hào):3710031
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3710031.html
最近更新
教材專(zhuān)著