面向維漢機(jī)器翻譯的語(yǔ)料篩選技術(shù)研究
發(fā)布時(shí)間:2017-12-26 00:12
本文關(guān)鍵詞:面向維漢機(jī)器翻譯的語(yǔ)料篩選技術(shù)研究 出處:《計(jì)算機(jī)應(yīng)用研究》2016年12期 論文類型:期刊論文
更多相關(guān)文章: 維漢機(jī)器翻譯 語(yǔ)料篩選 語(yǔ)言模型
【摘要】:統(tǒng)計(jì)機(jī)器翻譯是目前主流的機(jī)器翻譯技術(shù),其在維漢翻譯中良好的性能已經(jīng)得到了廣泛的認(rèn)可。維漢統(tǒng)計(jì)機(jī)器翻譯的最終結(jié)果同樣是受這幾方面的影響:翻譯模型、語(yǔ)言模型、語(yǔ)料質(zhì)量和規(guī)模等。旨在通過(guò)對(duì)維漢雙語(yǔ)訓(xùn)練語(yǔ)料的篩選來(lái)提高最終的機(jī)器翻譯性能。在相關(guān)學(xué)者的研究基礎(chǔ)上,提出了改進(jìn)的IBM1模型評(píng)價(jià)句對(duì)齊質(zhì)量、雙語(yǔ)語(yǔ)言模型困惑度進(jìn)行語(yǔ)料篩選和多種篩選指標(biāo)綜合求交集的方法。這些方法沒(méi)有語(yǔ)言特性的依賴,支持維漢雙語(yǔ)語(yǔ)料的篩選。通過(guò)實(shí)驗(yàn)可證明,使用筆者提出的方法可以得到更優(yōu)的維漢機(jī)器翻譯結(jié)果。
【作者單位】: 中國(guó)科學(xué)院新疆理化技術(shù)研究所;新疆民族語(yǔ)音語(yǔ)言信息處理重點(diǎn)實(shí)驗(yàn)室;中國(guó)科學(xué)院大學(xué);烏魯木齊市公安局電子數(shù)據(jù)鑒定實(shí)驗(yàn)中心;中國(guó)科學(xué)院聲學(xué)研究所;
【基金】:中國(guó)科學(xué)院西部之光項(xiàng)目(XBBS201216,LHXZ201301);中國(guó)科學(xué)院先導(dǎo)科技專項(xiàng)項(xiàng)目(XDA06030400) 新疆維吾爾自治區(qū)青年自然科學(xué)基金資助項(xiàng)目(2015211B034) 新疆維吾爾自治區(qū)重點(diǎn)實(shí)驗(yàn)室開(kāi)放課題項(xiàng)目(2015KL031)
【分類號(hào)】:TP391.2
【正文快照】: 0引言維吾爾語(yǔ)是維吾爾族的母語(yǔ),在我國(guó)的使用人數(shù)已經(jīng)超過(guò)了一千萬(wàn)。隨著國(guó)家一帶一路政策的深入,維吾爾語(yǔ)和漢語(yǔ)之間的機(jī)器翻譯近年來(lái)也逐漸成為了一個(gè)熱點(diǎn)問(wèn)題。在眾多研究者們的共同努力下,維漢統(tǒng)計(jì)機(jī)器翻譯的準(zhǔn)確率一直在不斷攀升。值得注意的是,作為目前主流的機(jī)器翻譯,
本文編號(hào):1335023
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1335023.html
最近更新
教材專著