融合主題的漢越冶金領(lǐng)域統(tǒng)計(jì)機(jī)器翻譯方法
【圖文】:
)×p(z=k|D')(5)在翻譯一個(gè)術(shù)語時(shí),本文通過計(jì)算在文檔D'下術(shù)語f^到e^的條件概率,來幫助解碼器選擇符合領(lǐng)域的術(shù)語翻譯。3翻譯模型的融合為充分利用特定領(lǐng)域翻譯知識(shí),本文在將融入主題信息的翻譯模型融合到機(jī)器翻譯系統(tǒng)的同時(shí),也將冶金領(lǐng)域語料訓(xùn)練的翻譯模型線性融合到翻譯系統(tǒng)中,進(jìn)一步提升基準(zhǔn)翻譯模型的冶金領(lǐng)域適應(yīng)能力。本文利用對(duì)數(shù)線性模型[11]將這2個(gè)模型作為2個(gè)特征融合到漢越基于短語的翻譯模型中[12],這樣不會(huì)影響集成本身其他特征的計(jì)算。對(duì)于解碼過程,本文設(shè)計(jì)思路框架如圖1所示,圖中顯示了融合了冶金領(lǐng)域語料訓(xùn)練的翻譯模型和融合主題信息的翻譯模型的統(tǒng)計(jì)機(jī)器翻譯的整個(gè)過程。圖1融合翻譯模型的漢越機(jī)器翻譯系統(tǒng)流程基于短語的翻譯模型對(duì)數(shù)線性表示可以用式(6)表示。P(e|f)=exp[λ鐖lb鐖(f|e)+λdlbd(a,b)+λLMlbplm(e)](6)其中:lb鐖(f|e)是翻譯模型;lbd(a,b)是調(diào)序模型;lbplm(e)是語言模型。這些特征函數(shù)不同的權(quán)重,影響著翻譯的質(zhì)量。將上文提到的2個(gè)模型作為特征函數(shù)融合到這個(gè)短語翻譯系統(tǒng)中,融合后的對(duì)數(shù)線性表示為式(7)。P(e|f)=exp[λ鐖lb鐖(e|f)+λdlbd(a,b)+λLMlbplm(e)+λmetallurgylb(metallurgy)+λtermlb(term)]λ鐖+λmetallurgy=1(7)其中:λmetallurgy和λterm分別是冶金領(lǐng)域語料訓(xùn)練的翻譯模型和融合主題信息的術(shù)語翻譯模型的權(quán)重[13];λ鐖為通用領(lǐng)域翻譯模型的權(quán)重,本文令通用領(lǐng)域翻譯模型與冶金領(lǐng)域翻譯模型的權(quán)重之和為1,然后通過最小錯(cuò)誤率訓(xùn)練方法來調(diào)優(yōu)[14]這些參數(shù),使得翻譯結(jié)果取得最優(yōu)(根據(jù)翻譯評(píng)測目標(biāo)評(píng)價(jià)該結(jié)果譯文)。在解碼階段,搜索選擇概率最
第43卷第12期周珂,余正濤,高盛祥:融合主題的漢越冶金領(lǐng)域統(tǒng)計(jì)機(jī)器翻譯方法外,分析發(fā)現(xiàn),加大冶金領(lǐng)域翻譯模型權(quán)重未必會(huì)提升測試集的翻譯質(zhì)量,這是因?yàn)樘囟I(lǐng)域翻譯模型往往缺乏充足的訓(xùn)練語料,翻譯模型訓(xùn)練過程會(huì)遇到數(shù)據(jù)稀疏問題,由此導(dǎo)致冶金領(lǐng)域翻譯知識(shí)不準(zhǔn)確,最終降低系統(tǒng)翻譯性能。圖2不同權(quán)重下的系統(tǒng)翻譯性能5結(jié)束語本文提出融合主題的漢越統(tǒng)計(jì)機(jī)器翻譯方法,構(gòu)建術(shù)語翻譯模型和聯(lián)合翻譯模型。術(shù)語翻譯模型是利用術(shù)語與主題的分布關(guān)系來約束術(shù)語的選擇,而聯(lián)合模型可以有效地調(diào)整基準(zhǔn)翻譯模型知識(shí)分布,進(jìn)而在翻譯過程中最大程度利用領(lǐng)域翻譯知識(shí)。本文將這2個(gè)模型融合到基準(zhǔn)翻譯系統(tǒng)中,實(shí)驗(yàn)結(jié)果表明,相比改進(jìn)前的翻譯模型,利用該模型進(jìn)行冶金領(lǐng)域文本翻譯時(shí)在BLEU-4和準(zhǔn)確度方面都有較大提升。下一步將擴(kuò)大語料庫規(guī)模,并對(duì)冶金領(lǐng)域的特征做深入分析。參考文獻(xiàn)[1]張軍.我國西南地區(qū)在“一帶一路”開放戰(zhàn)略中的優(yōu)勢及定位[J].經(jīng)濟(jì)縱橫,2014(11):93-96.[2]劉群.統(tǒng)計(jì)機(jī)器翻譯綜述[J].中文信息學(xué)報(bào),2003,17(4):1-12.[3]KOEHNP,OCHFJ,MARCUD.StatisticalPhrase-basedTranslation[C]//ProceedingsofConferenceoftheNorthAmericanChapteroftheAssociationforComputationalLinguisticsonHumanLanguageTechnology.Michigan,USA:AssociationforComputationalLinguistics,2003:127-133.[4]YAMADAK.ASyntax-basedTranslationModel[C]//ProceedingsofMeetingoftheAssociationforComputationalLinguistics.Michigan,USA:AssociationforComputationalLinguistics,2002:1-5.[5]張冬梅,劉小蝶,晉耀紅.基于模板的漢英專利機(jī)器翻譯研究[J].計(jì)算機(jī)應(yīng)用研究,,2013,30(7):204
【作者單位】: 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院;
【基金】:國家自然科學(xué)基金(61672271,61761026,61732005) 昆明理工大學(xué)校人才培養(yǎng)項(xiàng)目(省級(jí))(KKSY201703005)
【分類號(hào)】:TP391.2
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐波;史曉東;劉群;宗成慶;龐薇;陳振標(biāo);楊振東;魏瑋;杜金華;陳毅東;劉洋;熊德意;侯宏旭;何中軍;;2005統(tǒng)計(jì)機(jī)器翻譯研討班研究報(bào)告[J];中文信息學(xué)報(bào);2006年05期
2 王正;孫東云;;統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)在網(wǎng)絡(luò)翻譯教學(xué)中的應(yīng)用[J];英語研究;2008年01期
3 張濤;;機(jī)器翻譯的發(fā)展與基于短語的統(tǒng)計(jì)機(jī)器翻譯[J];山西廣播電視大學(xué)學(xué)報(bào);2009年04期
4 肖桐;李天寧;陳如山;朱靖波;王會(huì)珍;;面向統(tǒng)計(jì)機(jī)器翻譯的重對(duì)齊方法研究[J];中文信息學(xué)報(bào);2010年01期
5 劉群;統(tǒng)計(jì)機(jī)器翻譯綜述[J];中文信息學(xué)報(bào);2003年04期
6 何中軍;劉群;林守勛;;統(tǒng)計(jì)機(jī)器翻譯中短語切分的新方法[J];中文信息學(xué)報(bào);2007年01期
7 苗洪霞;蔡?hào)|風(fēng);宋彥;;基于短語的統(tǒng)計(jì)機(jī)器翻譯方法[J];沈陽航空工業(yè)學(xué)院學(xué)報(bào);2007年02期
8 羅毅;李淼;張建;;一種基于短語統(tǒng)計(jì)機(jī)器翻譯的高效柱搜索解碼器[J];計(jì)算機(jī)應(yīng)用;2007年08期
9 羅毅;李淼;朱鑒;胡冠龍;;基于短語統(tǒng)計(jì)機(jī)器翻譯解碼算法的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年30期
10 李楓;;基于短語的統(tǒng)計(jì)機(jī)器翻譯[J];山西財(cái)經(jīng)大學(xué)學(xué)報(bào);2008年S1期
相關(guān)會(huì)議論文 前10條
1 肖桐;李天寧;陳如山;朱靖波;王會(huì)珍;;面向統(tǒng)計(jì)機(jī)器翻譯的重對(duì)齊方法研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
2 張春越;蔣宏飛;趙鐵軍;;基于詞語對(duì)齊融合提高統(tǒng)計(jì)機(jī)器翻譯質(zhì)量[A];機(jī)器翻譯研究進(jìn)展——第四屆全國機(jī)器翻譯研討會(huì)論文集[C];2008年
3 萬升華;楊沐昀;李生;趙鐵軍;;基于字詞混合翻譯短語的統(tǒng)計(jì)機(jī)器翻譯[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
4 馬永亮;趙鐵軍;;統(tǒng)計(jì)機(jī)器翻譯中多分詞結(jié)果的融合[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
5 張步峰;何丕廉;張冬冬;李沐;周明;;短語切分概率在統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中的應(yīng)用[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
6 付雷;呂雅娟;劉群;;基于句型模板和統(tǒng)計(jì)機(jī)器翻譯技術(shù)的翻譯方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
7 杜金華;王莎;;西安理工大學(xué)統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)技術(shù)報(bào)告(英文)[A];機(jī)器翻譯研究進(jìn)展——第七屆全國機(jī)器翻譯研討會(huì)論文集[C];2011年
8 于惠;謝軍;熊皓;呂雅娟;劉群;林守勛;;基于篇章上下文的統(tǒng)計(jì)機(jī)器翻譯方法[A];機(jī)器翻譯研究進(jìn)展——第七屆全國機(jī)器翻譯研討會(huì)論文集[C];2011年
9 曹杰;任志祥;呂雅娟;劉群;;統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中傳統(tǒng)詞典的應(yīng)用研究[A];機(jī)器翻譯研究進(jìn)展——第四屆全國機(jī)器翻譯研討會(huì)論文集[C];2008年
10 梁芳麗;李淼;李文;陳雷;烏達(dá)巴拉;;統(tǒng)計(jì)機(jī)器翻譯中的源語言重排序方法研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
相關(guān)重要報(bào)紙文章 前3條
1 何中軍邋米海濤 劉群;統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)中的開源軟件[N];計(jì)算機(jī)世界;2007年
2 中科院計(jì)算技術(shù)研究所 呂雅娟邋付雷 黃瑾 何中軍 劉群;化繁為簡的統(tǒng)計(jì)機(jī)器翻譯技術(shù)[N];中國計(jì)算機(jī)報(bào);2007年
3 呂雅娟邋付雷 黃瑾 何中軍 劉群;能自動(dòng)翻譯專利文獻(xiàn)的翻譯系統(tǒng)[N];計(jì)算機(jī)世界;2007年
相關(guān)博士學(xué)位論文 前10條
1 崔磊;統(tǒng)計(jì)機(jī)器翻譯領(lǐng)域自適應(yīng)的研究[D];哈爾濱工業(yè)大學(xué);2014年
2 楊振新;面向受限領(lǐng)域的漢蒙統(tǒng)計(jì)機(jī)器翻譯方法研究[D];中國科學(xué)技術(shù)大學(xué);2017年
3 蔣宏飛;基于同步樹替換文法的統(tǒng)計(jì)機(jī)器翻譯方法研究[D];哈爾濱工業(yè)大學(xué);2010年
4 黃書劍;統(tǒng)計(jì)機(jī)器翻譯中的詞對(duì)齊研究[D];南京大學(xué);2012年
5 劉樂茂;統(tǒng)計(jì)機(jī)器翻譯判別式訓(xùn)練方法研究[D];哈爾濱工業(yè)大學(xué);2013年
6 貢正仙;文檔級(jí)統(tǒng)計(jì)機(jī)器翻譯的研究[D];蘇州大學(xué);2014年
7 薛永增;統(tǒng)計(jì)機(jī)器翻譯若干關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
8 梁華參;基于短語的統(tǒng)計(jì)機(jī)器翻譯模型訓(xùn)練中若干關(guān)鍵問題的研究[D];哈爾濱工業(yè)大學(xué);2013年
9 肖桐;樹到樹統(tǒng)計(jì)機(jī)器翻譯優(yōu)化學(xué)習(xí)及解碼方法研究[D];東北大學(xué);2012年
10 段楠;統(tǒng)計(jì)機(jī)器翻譯的一致性解碼方法研究[D];天津大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 程立;融合主題的漢語—納西的統(tǒng)計(jì)機(jī)器翻譯方法研究[D];昆明理工大學(xué);2015年
2 劉樂;統(tǒng)計(jì)機(jī)器翻譯領(lǐng)域適應(yīng)性研究[D];蘇州大學(xué);2015年
3 玉霞;蒙古文詞法分析及其在蒙漢統(tǒng)計(jì)機(jī)器翻譯中的應(yīng)用[D];內(nèi)蒙古師范大學(xué);2015年
4 孫輝豐;層次短語翻譯模型中翻譯規(guī)則約束問題的研究[D];南京大學(xué);2015年
5 李強(qiáng);短語統(tǒng)計(jì)機(jī)器翻譯關(guān)鍵技術(shù)研究[D];東北大學(xué);2013年
6 王超超;基于分布式合成語義的統(tǒng)計(jì)翻譯模型研究[D];蘇州大學(xué);2016年
7 劉昊;統(tǒng)計(jì)機(jī)器翻譯領(lǐng)域自適應(yīng)方法研究[D];蘇州大學(xué);2016年
8 李婧萱;基于深度神經(jīng)網(wǎng)絡(luò)的統(tǒng)計(jì)機(jī)器翻譯模型研究[D];哈爾濱工業(yè)大學(xué);2016年
9 應(yīng)志野;基于最大熵的機(jī)器翻譯研究與實(shí)現(xiàn)[D];電子科技大學(xué);2016年
10 文佳勝;基于機(jī)器學(xué)習(xí)的少數(shù)民族語言翻譯關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2016年
本文編號(hào):2529296
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2529296.html