漢—維時間數(shù)字和量詞的識別與翻譯研究
本文選題:時間數(shù)字 切入點:無歧義量詞 出處:《新疆大學(xué)》2017年碩士論文
【摘要】:隨著機器翻譯技術(shù)的迅速發(fā)展,命名實體識別與翻譯研究取得了突破性的進展,它是在自然語言處理中的關(guān)鍵性研究分支。如今,漢語-維吾爾語機器翻譯領(lǐng)域中開展了大量的研究工作。本文提出了基于規(guī)則與模板的時間、數(shù)字、無歧義量詞、有歧義量詞的翻譯方法及基于神經(jīng)網(wǎng)絡(luò)的有歧義量詞翻譯方法。本文主要研究以下三個方面的工作:(1)根據(jù)漢語-維吾爾語的翻譯需求和維吾爾語的語法結(jié)構(gòu),首先收集與挖掘大量的漢語時間表達式、數(shù)字的分類(基數(shù)、約數(shù)、集合數(shù)、分數(shù)、倍數(shù)),然后分別構(gòu)建雙語規(guī)則庫和翻譯模板,識別漢語時間表達式或數(shù)字并找出它相應(yīng)的規(guī)則模板,輸出時間表達式或數(shù)字對應(yīng)的維吾爾語翻譯結(jié)果。(2)對于量詞進行分析與歸類,將量詞分為有歧義量詞與無歧義量詞,無歧義量詞分為四種情況(數(shù)字一一對應(yīng),量詞丟失;數(shù)字一一對應(yīng),量詞一一對應(yīng);數(shù)字丟失,量詞一一對應(yīng);數(shù)字量詞均丟失;),對有歧義量詞根據(jù)上下文名詞的不同,量詞對應(yīng)的翻譯結(jié)果也有所不同,通過上述的分類方法收集量詞短語并分別增加規(guī)則庫。(3)基于Seq2Seq模型實現(xiàn)有歧義量詞短語的神經(jīng)機器翻譯并有效提高了漢語-維吾爾語量詞的翻譯準確率。為了提高漢維機器翻譯系統(tǒng)對時間、數(shù)字和量詞短語的翻譯性能,本文利用雙語語料庫提取漢語時間、數(shù)字和量詞短語,實現(xiàn)了基于規(guī)則與模板、神經(jīng)網(wǎng)絡(luò)的的翻譯方法。
[Abstract]:With the rapid development of machine translation technology, the research of named entity recognition and translation has made a breakthrough. It is a key research branch in natural language processing. A great deal of research has been done in the field of Chinese-Uygur machine translation. In this paper, time, numbers, unambiguous quantifiers based on rules and templates are proposed. The translation method of ambiguous quantifier and the translation method of ambiguous quantifier based on neural network. This paper mainly studies the following three aspects of work: 1) according to the translation needs of Chinese-Uygur language and the grammatical structure of Uygur language, Firstly, a large number of Chinese temporal expressions are collected and mined, and the classification of numbers (cardinality, approximation, number of sets, scores, multiples) is collected and excavated, and then the bilingual rule base and translation template are constructed, respectively. Recognize Chinese time expression or number and find out its corresponding regular template, output the result of Uygur translation of time expression or number, analyze and classify classifier, divide the quantifier into ambiguous quantifier and unambiguous quantifier. Unambiguous quantifiers are divided into four situations (numeral one-to-one correspondence, quantifier loss, number-one-to-one correspondence, quantifier one-to-one correspondence, numeral loss, quantifier one-to-one correspondence, numeral quantifiers lost, and ambiguous quantifiers according to different contextual nouns. The translation results of quantifiers are also different. The classifier phrases are collected by the above classification method and the rule base is added separately.) based on the Seq2Seq model, the neural machine translation of ambiguous quantifier phrases is realized and the accuracy of Chinese-Uygur quantifier translation is improved effectively. Gao Hanwei machine translation system to the time, In this paper, we use bilingual corpus to extract Chinese time, number and quantifier phrases to realize the translation method based on rules, templates and neural networks.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.2
【參考文獻】
相關(guān)期刊論文 前10條
1 阿依古麗·哈力克;艾山·吾買爾;吐爾根·伊布拉音;卡哈爾江·阿比的熱西提;買合木提·買買提;;漢維時間數(shù)字和量詞的識別與翻譯研究[J];中文信息學(xué)報;2016年06期
2 楊萍;侯宏旭;蔣玉鵬;申志鵬;杜健;;基于雙語對齊的漢語 新蒙古文命名實體翻譯[J];北京大學(xué)學(xué)報(自然科學(xué)版);2016年01期
3 張磊;楊雅婷;米成剛;李曉;;維吾爾語數(shù)詞類命名實體的識別與翻譯[J];計算機應(yīng)用與軟件;2015年08期
4 尹存燕;黃書劍;戴新宇;陳家駿;;中英命名實體識別及對齊中的中文分詞優(yōu)化[J];電子學(xué)報;2015年08期
5 李風(fēng)環(huán);鄭德權(quán);趙鐵軍;;基于淺層語義分析的主題事件的時間識別[J];山東大學(xué)學(xué)報(理學(xué)版);2015年11期
6 鄒岳琳;吐爾根·依布拉音;麥熱哈巴·艾力;艾山·吾買爾;帕力旦·吐爾遜;;基于詞干提取的維吾爾語事件類時間短語識別[J];計算機工程與設(shè)計;2014年02期
7 趙紫玉;徐金安;張玉潔;劉江鳴;;規(guī)則與統(tǒng)計相結(jié)合的日語時間表達式識別[J];中文信息學(xué)報;2013年06期
8 王偉;趙東巖;蘇婷婷;;C-TERN:一種基于CFSA的軍事新聞文本時間信息處理算法[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
9 趙紫玉;徐金安;張玉潔;劉江鳴;;日語時間表達式識別與日漢翻譯研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
10 李君嬋;譚紅葉;王風(fēng)娥;;中文時間表達式及類型識別[J];計算機科學(xué);2012年S3期
相關(guān)碩士學(xué)位論文 前1條
1 鄭宏;漢英雙向時間數(shù)字和數(shù)量詞的識別與翻譯技術(shù)[D];哈爾濱工業(yè)大學(xué);2011年
,本文編號:1692737
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1692737.html