維吾爾語(yǔ)-烏茲別克語(yǔ)機(jī)器翻譯研究
本文選題:機(jī)器翻譯 + 烏茲別克語(yǔ) ; 參考:《新疆大學(xué)》2017年碩士論文
【摘要】:自從計(jì)算機(jī)發(fā)明以來(lái),人們對(duì)機(jī)器翻譯的興趣越來(lái)越大。機(jī)器翻譯是指計(jì)算機(jī)把一種自然語(yǔ)言(源語(yǔ)言)轉(zhuǎn)換成另一種自然語(yǔ)言(目標(biāo)語(yǔ)言)的過(guò)程。維吾爾語(yǔ)和烏茲別克語(yǔ)在單詞結(jié)構(gòu)、構(gòu)形、詞性、句法等方面有很多相同點(diǎn)或相似之處。因此,實(shí)現(xiàn)維吾爾語(yǔ)和烏茲別克語(yǔ)的機(jī)器翻譯比較容易。本文中提出了基于詞典和規(guī)則相結(jié)合的維吾爾語(yǔ)和烏茲別克語(yǔ)機(jī)器翻譯方法。首先分別研究維吾爾語(yǔ)和烏茲別克語(yǔ)的字母及其對(duì)應(yīng)關(guān)系、音節(jié)劃分規(guī)則和音節(jié)關(guān)系、單詞結(jié)構(gòu)和詞類(lèi)關(guān)系、句子結(jié)構(gòu)和成分關(guān)系等。在此基礎(chǔ)上,構(gòu)建兩種語(yǔ)言對(duì)齊詞典和字母對(duì)應(yīng)規(guī)則庫(kù)并實(shí)現(xiàn)基于詞典的維吾爾語(yǔ)和烏茲別克語(yǔ)翻譯方法和基于字母轉(zhuǎn)換規(guī)則的維吾爾語(yǔ)和烏茲別克語(yǔ)翻譯方法;隨后結(jié)合兩種翻譯方法實(shí)現(xiàn)基于詞典和規(guī)則相結(jié)合的維吾爾語(yǔ)和烏茲別克語(yǔ)機(jī)器翻譯系統(tǒng)。烏茲別克語(yǔ)到維吾爾語(yǔ)方向的翻譯中發(fā)現(xiàn),烏茲別克語(yǔ)字母和維吾爾語(yǔ)字母之間存在歧義現(xiàn)象,一個(gè)烏茲別克語(yǔ)字母對(duì)應(yīng)兩個(gè)及以上維吾爾語(yǔ)字母。對(duì)這種歧義現(xiàn)象用最大熵特征選擇方法來(lái)判斷歧義字母對(duì)應(yīng)的維吾爾語(yǔ)字母并生成目標(biāo)語(yǔ)言。初步優(yōu)化了基于詞典和規(guī)則相結(jié)合的烏茲別克語(yǔ)-維吾爾語(yǔ)機(jī)器翻譯系統(tǒng)。小規(guī)模的實(shí)驗(yàn)結(jié)果表明該系統(tǒng)在維吾爾語(yǔ)和烏茲別克語(yǔ)機(jī)器翻譯準(zhǔn)確率較高,其中烏茲別克語(yǔ)到維吾爾語(yǔ)方向的翻譯質(zhì)量比維吾爾語(yǔ)到烏茲別克語(yǔ)方向的翻譯質(zhì)量高。在以后的工作中,該系統(tǒng)還可通過(guò)雙語(yǔ)詞干庫(kù)和詞綴庫(kù)規(guī)模的不斷擴(kuò)大、雙語(yǔ)翻譯規(guī)則的不斷完善,以及可以用現(xiàn)有的詞典和規(guī)則相結(jié)合的翻譯基礎(chǔ)上分析詞性變化等方法有效提高翻譯質(zhì)量。
[Abstract]:Since the invention of computer, people have become more and more interested in machine translation. Machine translation is the process by which a computer converts one natural language (source language) into another (target language). Uygur and Uzbek have many similarities or similarities in word structure, configuration, part of speech, syntax and so on. Therefore, the implementation of Uighur and Uzbek machine translation is easier. In this paper, a method of Uygur and Uzbek machine translation based on dictionary and rule is proposed. This paper first studies the letters and their corresponding relations between Uyghur and Uzbek, the syllable division rule and syllable relation, the word structure and part of speech relationship, the sentence structure and the component relation and so on. On the basis of this, we construct the dictionary and alphabetic correspondence rule library and realize the translation methods of Uygur and Uzbek languages based on dictionaries and the translation methods of Uyghur and Uzbek languages based on alphabetic conversion rules. Then the Uygur and Uzbek machine translation systems based on dictionaries and rules are implemented in combination with two translation methods. In the translation from Uzbek to Uygur, there is ambiguity between the Uzbek and Uygur letters, and one Uzbek letter corresponds to two or more Uygur letters. The maximum entropy feature selection method is used to determine the Uygur letters corresponding to the ambiguous letters and to generate the target language. The Uzbek-Uygur machine translation system based on dictionaries and rules is preliminarily optimized. The results of small-scale experiments show that the accuracy of the system in Uygur and Uzbek machine translation is higher, and the translation quality from Uzbek to Uygur is higher than that from Uygur to Uzbek. In the future work, the system can also expand the scale of bilingual stem database and affix database, and improve the rules of bilingual translation. The translation quality can be improved by analyzing the change of part of speech on the basis of the combination of existing dictionaries and rules.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.2
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄭明秋;;基于C#語(yǔ)言的面向?qū)ο缶幊烫卣餮芯颗c實(shí)現(xiàn)[J];通訊世界;2015年21期
2 李景賢;;烏茲別克斯坦:古絲綢之路直穿而過(guò)的國(guó)度[J];時(shí)事報(bào)告;2015年09期
3 王鑫;;大數(shù)據(jù)時(shí)代下新的翻譯機(jī)器[J];現(xiàn)代交際;2014年10期
4 云耘;桂亮;;從社會(huì)歷史進(jìn)程角度看烏茲別克語(yǔ)拉丁化[J];語(yǔ)文學(xué)刊(外語(yǔ)教育教學(xué));2014年06期
5 麥迪乃·熱合木江;艾尼宛兒·托乎提;吾守爾·斯拉木;阿依佳肯·阿曼太;;多語(yǔ)種(漢、維、哈、柯文)輔助辦案系統(tǒng)的開(kāi)發(fā)[J];計(jì)算機(jī)應(yīng)用與軟件;2013年08期
6 艾尼瓦爾·艾合買(mǎi)提江;;初談維吾爾語(yǔ)與烏茲別克語(yǔ)元音區(qū)別[J];科技信息;2013年11期
7 袁小于;;基于規(guī)則的機(jī)器翻譯技術(shù)綜述[J];重慶文理學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年03期
8 阿布都外力·克熱木;;突厥語(yǔ)族民族文化專(zhuān)題研究點(diǎn)評(píng)[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2011年02期
9 秦洪武;;英譯漢翻譯語(yǔ)言的結(jié)構(gòu)容量:基于多譯本語(yǔ)料庫(kù)的研究[J];外國(guó)語(yǔ)(上海外國(guó)語(yǔ)大學(xué)學(xué)報(bào));2010年04期
10 艾山·吾買(mǎi)爾;吐?tīng)柛ひ啦嚼?;基于最大熵的維吾爾語(yǔ)句子邊界識(shí)別模型[J];計(jì)算機(jī)工程;2010年06期
相關(guān)會(huì)議論文 前1條
1 譚詠梅;王樅;王小捷;鐘義信;;基于實(shí)例的機(jī)器輔助寫(xiě)作翻譯系統(tǒng)[A];2006年首屆ICT大會(huì)信息、知識(shí)、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年
相關(guān)博士學(xué)位論文 前1條
1 阿達(dá)來(lái)提;中國(guó)烏孜別克族語(yǔ)言使用現(xiàn)狀研究[D];中央民族大學(xué);2013年
相關(guān)碩士學(xué)位論文 前7條
1 阿卜杜吾普爾·熱合曼;論翻譯批評(píng)及其漢維翻譯中的運(yùn)用研究[D];新疆大學(xué);2015年
2 翟云超;機(jī)器翻譯的問(wèn)題及對(duì)策研究[D];華北理工大學(xué);2015年
3 唐建;基于規(guī)則的漢英機(jī)器翻譯研究與實(shí)現(xiàn)[D];成都理工大學(xué);2013年
4 卡哈爾江·阿比的熱西提;基于實(shí)例的漢維—維漢雙向機(jī)器翻譯系統(tǒng)的研究[D];上海交通大學(xué);2012年
5 吉莉;烏茲別克斯坦?jié)h語(yǔ)教學(xué)狀況與分析[D];陜西師范大學(xué);2013年
6 魏巍;中英概念隱喻基于經(jīng)濟(jì)報(bào)道語(yǔ)料的對(duì)比分析[D];海南大學(xué);2010年
7 陳鵬;基于語(yǔ)料庫(kù)的維吾爾語(yǔ)詞干提取和詞性標(biāo)注[D];新疆大學(xué);2006年
,本文編號(hào):1856359
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1856359.html