天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 文藝論文 > 語言藝術論文 >

基于計算機自動句法分析的漢—英與漢—德數(shù)詞機器翻譯算法的設計與實現(xiàn)

發(fā)布時間:2018-08-28 16:22
【摘要】:本論文首先介紹了數(shù)詞機器翻譯研究的進展,并介紹了漢語、英語和德語數(shù)詞的構造規(guī)律。接著,論文參照生成語法中的X-bar理論,提出了一個用于表示現(xiàn)代漢語數(shù)詞內(nèi)部結構的句法模型,并基于該模型及漢語數(shù)詞中系數(shù)詞和位數(shù)詞的分布狀況,用上下文無關文法設計了一套供CYK句法分析算法使用的描寫漢語數(shù)詞結構的規(guī)則庫。句法分析在該機器翻譯系統(tǒng)中主要為判定漢語數(shù)詞中的“零”對應多少阿拉伯數(shù)字“0”而服務。為了彌補規(guī)則庫設計不足導致句法歧義從而影響“零”判定的問題,本論文采用“分而治之”的策略,實現(xiàn)了可以將漢語數(shù)詞自動翻譯為相應的英語數(shù)詞和德語數(shù)詞的算法,最后使用Python語言實現(xiàn)并測試了這一算法,并將該算法的翻譯結果與百度、谷歌與有道的在線翻譯結果進行了對比,提出了該系統(tǒng)仍然需要改進的四個方面。本論文提出的多語種數(shù)詞翻譯算法的架構具備可擴展性,可以在后續(xù)的開發(fā)過程中根據(jù)需求添加模塊,完成任意兩指定語種之間的數(shù)詞翻譯。
[Abstract]:This thesis first introduces the research progress of numerals machine translation, and introduces the construction rules of numerals in Chinese, English and German. Then, referring to the X-bar theory in generative grammar, this paper proposes a syntactic model to represent the internal structure of numerals in modern Chinese, and based on the model and the distribution of coefficient words and digit words in Chinese numerals. In this paper, a set of rules for describing the structure of Chinese numerals for CYK syntactic analysis algorithm is designed with context-free grammar. In this machine translation system, syntactic analysis is mainly used to determine how many Arabic digits "0" correspond to "zero" in Chinese numerals. In order to remedy the problem that the lack of rule base design leads to syntactic ambiguity and thus affects the "zero" decision, this paper adopts the strategy of "divide and conquer" and realizes an algorithm that can automatically translate Chinese numerals into corresponding English numerals and German numerals. Finally, the algorithm is implemented and tested in Python language, and the translation results of the algorithm are compared with those of Baidu, Google and youdao, and four aspects of the system that need to be improved are put forward. The framework of the multilingual numerals translation algorithm proposed in this paper is extensible, and it can add modules according to the requirements in the subsequent development process to complete the numeral translation between any two specified languages.
【學位授予單位】:上海外國語大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:H085.3

【參考文獻】

相關期刊論文 前9條

1 孫茂松;周建設;;從機器翻譯歷程看自然語言處理研究的發(fā)展策略[J];語言戰(zhàn)略研究;2016年06期

2 張磊;楊雅婷;米成剛;李曉;;維吾爾語數(shù)詞類命名實體的識別與翻譯[J];計算機應用與軟件;2015年08期

3 烏丹牧其爾;王斯日古楞;;蒙漢機器翻譯中的數(shù)詞自動翻譯研究[J];內(nèi)蒙古師范大學學報(自然科學漢文版);2015年03期

4 馮志偉;馮紹鋒;;第一次機器翻譯試驗的前前后后——紀念機器翻譯60周年[J];現(xiàn)代語文(語言研究版);2014年08期

5 孫萌;華卻才讓;劉凱;呂雅娟;劉群;;藏文數(shù)詞識別與翻譯[J];北京大學學報(自然科學版);2013年01期

6 張秉權,劉正東,黃河燕;機器翻譯中數(shù)字和數(shù)詞相關表達形式的詞法分析技術[J];計算機工程與應用;2002年18期

7 詹衛(wèi)東,常寶寶,俞士汶;漢語短語結構定界歧義類型分析及分布統(tǒng)計[J];中文信息學報;1999年03期

8 郭宏蕾,姚天順;數(shù)詞的語義結構及通用翻譯算法[J];中文信息學報;1996年04期

9 李竹;多語種(英法俄德日漢)數(shù)詞的自動翻譯[J];中文信息學報;1989年01期

相關會議論文 前1條

1 陳鄞;趙鐵軍;呂雅娟;于浩;;漢英機器翻譯中數(shù)詞的識別和翻譯[A];機器翻譯研究進展——2002年全國機器翻譯研討會論文集[C];2002年

相關碩士學位論文 前1條

1 鄭宏;漢英雙向時間數(shù)字和數(shù)量詞的識別與翻譯技術[D];哈爾濱工業(yè)大學;2011年

,

本文編號:2209937

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/2209937.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶785d2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com