一種融合句法短語的漢英統(tǒng)計機器翻譯方法
發(fā)布時間:2018-03-07 12:09
本文選題:統(tǒng)計機器翻譯 切入點:雙語句法短語 出處:《小型微型計算機系統(tǒng)》2017年10期 論文類型:期刊論文
【摘要】:基于短語的統(tǒng)計機器翻譯所使用的短語并不限制句法邊界,因而得到的翻譯結果存在大量不符合句法結構的表達.為此,分析短語模型與句法模型各自的優(yōu)勢與不足,提出將句法分析結果中獲得的雙語句法短語對融入在短語模型中,以改善機器翻譯質量.首先對平行語料分別進行句法分析并從中獲取中英文單語句法短語,而后利用短語表與一致性短語原則獲取雙語句法短語對,最后將其與短語翻譯模型的原有短語表相結合.實驗結果表明:雙語句法短語能夠提高基于短語的統(tǒng)計機器翻譯質量,在十萬句對與百萬句對規(guī)模雙語平行訓練語料中BLEU值分別提高0.56%與0.62%.
[Abstract]:The phrase used in phrasal statistical machine translation does not restrict the syntactic boundary, so there are a large number of expressions which do not conform to the syntactic structure. Therefore, the advantages and disadvantages of phrase model and syntactic model are analyzed. In order to improve the quality of machine translation, the bilingual syntactic and phrasal pairs obtained from the results of syntactic analysis are integrated into the phrase model to improve the quality of machine translation. Firstly, the parallel corpus is analyzed separately and the single-sentence phrases in both Chinese and English are obtained from them. Then we use the principle of phrase table and consistent phrase to obtain the bilingual syntactic phrase pair and combine it with the original phrase table of the phrase translation model. The experimental results show that the bilingual syntactic phrase can improve the quality of statistical machine translation based on phrase. In the bilingual parallel training corpus of 100,000 pairs and 1 million pairs, the BLEU value increased by 0.56% and 0.62 respectively.
【作者單位】: 大連理工大學計算機學院;
【基金】:國家自然科學基金項目(61672127,61173100)資助 福建省中青年教師教育科研項目(JA14217)資助
【分類號】:H085.3
【相似文獻】
相關期刊論文 前1條
1 馮志偉;;《統(tǒng)計機器翻譯》述評[J];外語教學與研究;2013年04期
相關會議論文 前2條
1 付雷;呂雅娟;劉群;;基于句型模板和統(tǒng)計機器翻譯技術的翻譯方法[A];內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
2 柴春光;宗成慶;;影響統(tǒng)計翻譯系統(tǒng)性能的因素分析[A];第三屆學生計算語言學研討會論文集[C];2006年
相關碩士學位論文 前1條
1 修馳;統(tǒng)計機器翻譯語料預處理中的問題研究[D];北京語言大學;2009年
,本文編號:1579239
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/1579239.html