基于統(tǒng)計和詞典方法相結合的韓漢雙語語料庫名詞短語對齊
發(fā)布時間:2021-11-14 13:35
韓漢雙語語料庫短語對齊對于基于實例的韓漢機器翻譯系統(tǒng)具有重要意義,該文從韓國語名詞短語結構特點出發(fā),在基于統(tǒng)計和基于詞典的詞對齊方法進行試驗分析的基礎上,提出了基于詞對齊位置信息的韓漢雙語語料庫名詞短語對齊方法。該方法通過基于統(tǒng)計的方法獲得詞對齊位置信息,在此基礎上利用基于詞典方法的相似度計算進行詞對齊校正;根據(jù)以上結果,該文通過韓國語名詞短語左右邊界規(guī)則抽取名詞短語及其漢語譯文,利用關聯(lián)度度量方法進行過濾,實現(xiàn)名詞短語對齊。實驗結果表明,在較大規(guī)模語料庫情況下,該方法取得了較好的短語對齊結果。
【文章來源】:中文信息學報. 2018,32(08)北大核心CSCD
【文章頁數(shù)】:5 頁
【文章目錄】:
0 引言
1 韓國語名詞短語結構特點
2 詞對齊方法
2.1 詞典模糊匹配詞對齊方法
2.2 基于語義相似度的詞對齊方法
2.3 基于統(tǒng)計的詞對齊方法
2.4 統(tǒng)計與詞典相融合的詞對齊方法
3 名詞短語對齊方法
4 實驗結果及分析
5 結論
【參考文獻】:
期刊論文
[1]韓國語名詞短語結構特征分析及自動提取[J]. 安帥飛,畢玉德. 中文信息學報. 2013(05)
[2]朝鮮語自然語言處理研究管窺[J]. 畢玉德. 中文信息學報. 2011(06)
[3]基于同義詞詞林的詞語相似度計算方法[J]. 田久樂,趙蔚. 吉林大學學報(信息科學版). 2010(06)
[4]EBMT系統(tǒng)中的多詞單元翻譯詞典獲取研究[J]. 程潔,杜利民. 中文信息學報. 2004(01)
[5]基于有效句型的英漢雙語短語對齊[J]. 屈剛,陳笑蓉,陸汝占. 計算機研究與發(fā)展. 2003(02)
[6]基于漢英雙語語料庫的翻譯等價單位自動獲取研究[J]. 常寶寶. 術語標準化與信息技術. 2002(02)
博士論文
[1]漢英雙語語料庫自動對齊研究[D]. 王斌.中國科學院研究生院(計算技術研究所) 1999
本文編號:3494731
【文章來源】:中文信息學報. 2018,32(08)北大核心CSCD
【文章頁數(shù)】:5 頁
【文章目錄】:
0 引言
1 韓國語名詞短語結構特點
2 詞對齊方法
2.1 詞典模糊匹配詞對齊方法
2.2 基于語義相似度的詞對齊方法
2.3 基于統(tǒng)計的詞對齊方法
2.4 統(tǒng)計與詞典相融合的詞對齊方法
3 名詞短語對齊方法
4 實驗結果及分析
5 結論
【參考文獻】:
期刊論文
[1]韓國語名詞短語結構特征分析及自動提取[J]. 安帥飛,畢玉德. 中文信息學報. 2013(05)
[2]朝鮮語自然語言處理研究管窺[J]. 畢玉德. 中文信息學報. 2011(06)
[3]基于同義詞詞林的詞語相似度計算方法[J]. 田久樂,趙蔚. 吉林大學學報(信息科學版). 2010(06)
[4]EBMT系統(tǒng)中的多詞單元翻譯詞典獲取研究[J]. 程潔,杜利民. 中文信息學報. 2004(01)
[5]基于有效句型的英漢雙語短語對齊[J]. 屈剛,陳笑蓉,陸汝占. 計算機研究與發(fā)展. 2003(02)
[6]基于漢英雙語語料庫的翻譯等價單位自動獲取研究[J]. 常寶寶. 術語標準化與信息技術. 2002(02)
博士論文
[1]漢英雙語語料庫自動對齊研究[D]. 王斌.中國科學院研究生院(計算技術研究所) 1999
本文編號:3494731
本文鏈接:http://sikaile.net/waiyulunwen/zhichangyingyu/3494731.html