天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于跨語言遷移學(xué)習(xí)的泰語依存句法解析方法研究

發(fā)布時間:2018-05-24 11:31

  本文選題:泰語句法解析 + 依存句法解析。 參考:《昆明理工大學(xué)》2017年碩士論文


【摘要】:隨著計算機(jī)科學(xué)和人工智能的發(fā)展,作為人工智能分支的自然語言處理對各國的政治、經(jīng)濟(jì)和文化發(fā)展起到很大的促進(jìn)作用,因此自然語言處理研究工作顯得尤為重要。句法分析是自然語言處理的重要研究內(nèi)容,是機(jī)器翻譯、信息檢索和文本分析等領(lǐng)域研究的基礎(chǔ)。目前,漢語、英語等語言采用基于傳統(tǒng)的依存句法分析的方法研究句法解析相對成熟,但是傳統(tǒng)的句法分析方法依賴于大規(guī)模標(biāo)注的語料庫和制定復(fù)雜的特征模板,人工標(biāo)注語料庫和制定特征模板費(fèi)時費(fèi)力,使得傳統(tǒng)的依存句法分析方法對缺乏語料資源的語言的研究很難正常開展;诖,本文提出基于跨語言遷移學(xué)習(xí)的方法研究缺乏語料資源的依存句法解析,泰語句法研究十分缺乏語料資源,因此針對泰語依存句法分析完成了如下工作:(1)基于漢泰平行句對語料的神經(jīng)網(wǎng)絡(luò)雙語詞分布表示方法。泰語的研究工作相對較少,沒有較大規(guī)模的語料庫,無形中增加了泰語自然語言處理研究的難度。但是漢語和泰語同屬漢藏語系,兩種語言在句法上有很大的相似性,相對于語料豐富的漢語自然語言處理,泰語可以借鑒漢語的研究。雙語詞分布表示可以構(gòu)建兩種語言之間的聯(lián)系,因此本文提出基于漢泰平行句對語料的雙語詞分布表示模型,實驗結(jié)果表明詞分布表示的準(zhǔn)確率達(dá)到82.60%。(2)基于遷移學(xué)習(xí)的泰語依存句法解析方法。漢語在依存句法解析方法上的研究較為成熟,因此,本文在雙語詞分布表示方法的基礎(chǔ)上,運(yùn)用40000句漢泰平行句對語料,通過從漢語中遷移特征的方法對泰語依存句法分析進(jìn)行研究。本文所提出的神經(jīng)網(wǎng)絡(luò)泰語依存句法解析模型,在依存弧準(zhǔn)確率、標(biāo)識準(zhǔn)確率和句子根節(jié)點(diǎn)的準(zhǔn)確率分別達(dá)到79.28%、75.01%和91.25%。(3)泰語依存句法分析系統(tǒng)的可視化。采用Java語言進(jìn)行開發(fā),輸出CoNLL格式的依存語句,同時借助DependencyViewer工具進(jìn)行界面化顯示,可以方便的觀察整個句子的水平依存視圖和樹狀視圖。通過以上分析,跨語言遷移學(xué)習(xí)的思想在—定程度上解決了語料稀缺的問題,但是本文同時也考慮了泰語的語言特征進(jìn)行遷移學(xué)習(xí)泰語依存句法解析,其中雙語詞分布表示為遷移學(xué)習(xí)句法解析做準(zhǔn)備,遷移學(xué)習(xí)句法解析是雙語詞分布表示的具體應(yīng)用,并取得較好的效果。
[Abstract]:With the development of computer science and artificial intelligence, natural language processing, as a branch of artificial intelligence, plays an important role in the political, economic and cultural development of various countries. Syntactic analysis is an important part of natural language processing and the basis of machine translation, information retrieval and text analysis. At present, it is relatively mature for Chinese, English and other languages to study syntactic parsing based on traditional dependency parsing. However, traditional syntactic analysis methods rely on large scale annotated corpus and complex feature templates. The manual annotation of corpus and the establishment of feature templates are time-consuming and laborious, which makes it difficult for traditional dependency syntactic analysis methods to study languages that lack of corpus resources. Based on this, this paper proposes a method based on cross-language transfer learning to study the dependency syntactic analysis of the lack of corpus resources, and the lack of corpus resources in Thai syntactic research. Therefore, for the syntactic analysis of Thai dependency, the following work is done: 1) A neural network method for the distribution of bilingual words based on Chinese-Thai parallel sentence pairs is proposed. The research work of Thai is relatively few and there is no large corpus, which makes the study of natural language processing in Thai more difficult. However, both Chinese and Thai belong to Chinese and Tibetan languages, and the two languages are syntactically similar. Bilingual word distribution representation can construct the relationship between two languages, so this paper proposes a bilingual word distribution representation model based on Chinese-Thai parallel sentence pairs. The experimental results show that the accuracy of word distribution representation is 82.60 and that the method of parsing dependent syntax in Thai language is based on transfer learning. The research on the parsing method of dependency syntax in Chinese is more mature. Therefore, based on the distribution representation of bilingual words, this paper applies 40000 Chinese and Thai parallel sentences to the corpus. This paper studies the syntactic analysis of dependency in Thai by means of transferring features from Chinese. The neural network model for parsing Thai dependency syntax is presented in this paper. The accuracy rate of dependency arc, identification accuracy and sentence root node are 79.28%, 75.01% and 91.25%, respectively. With the help of Java language, the dependency statements in CoNLL format are output, and the interfacial display is carried out with the help of DependencyViewer tools, which can conveniently observe the horizontal dependent view and tree view of the whole sentence. Through the above analysis, the idea of cross-language transfer learning solves the problem of the scarcity of language data to a certain extent. However, this paper also takes into account the language characteristics of Thai language to analyze the dependency syntax of Thai language. Bilingual word distribution is the preparation for transfer learning syntactic analysis. Transfer learning syntactic analysis is a concrete application of bilingual word distribution representation and good results have been obtained.
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 邱立坤;金澎;王厚峰;;基于依存語法構(gòu)建多視圖漢語樹庫[J];中文信息學(xué)報;2015年03期

2 李國臣;黨帥兵;王瑞波;李濟(jì)洪;;基于字的分布表征的漢語基本塊識別[J];中文信息學(xué)報;2014年06期

3 吳偉成;周俊生;曲維光;;基于統(tǒng)計學(xué)習(xí)模型的句法分析方法綜述[J];中文信息學(xué)報;2013年03期

4 車萬翔;張梅山;劉挺;;基于主動學(xué)習(xí)的中文依存句法分析[J];中文信息學(xué)報;2012年02期

5 陳利君;;充分發(fā)揮昆曼大通道的作用,積極推進(jìn)與東盟國家的經(jīng)貿(mào)合作[J];中國發(fā)展;2011年S1期

6 周強(qiáng);漢語句法樹庫標(biāo)注體系[J];中文信息學(xué)報;2004年04期

相關(guān)博士學(xué)位論文 前2條

1 徐潤華;基于詞語搭配知識和語法功能匹配的句法分析器[D];南京師范大學(xué);2013年

2 李正華;漢語依存句法分析關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前7條

1 趙世瑜;泰語詞法分析關(guān)鍵技術(shù)研究[D];昆明理工大學(xué);2016年

2 張金鵬;漢泰雙語新聞話題發(fā)現(xiàn)方法研究[D];昆明理工大學(xué);2016年

3 趙晶;漢語—泰語的跨語言查詢翻譯和擴(kuò)展[D];昆明理工大學(xué);2016年

4 李發(fā)杰;越南語依存樹庫構(gòu)建以及依存關(guān)系分析方法研究[D];昆明理工大學(xué);2016年

5 趙治鵬;采用機(jī)器學(xué)習(xí)方法實現(xiàn)泰語分詞[D];云南大學(xué);2014年

6 吳偉成;基于SEARN框架的中文句法分析技術(shù)研究[D];南京師范大學(xué);2013年

7 陳雨強(qiáng);圖像與文本數(shù)據(jù)間的異構(gòu)遷移學(xué)習(xí)[D];上海交通大學(xué);2012年



本文編號:1928893

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/zhengzhijingjixuelunwen/1928893.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3115***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com