天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

“自下而上”的傳統(tǒng)蒙古文簡單句句法分析研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-04-20 17:52

  本文選題:句法分析 + 傳統(tǒng)蒙古文簡單句; 參考:《內(nèi)蒙古大學(xué)》2017年碩士論文


【摘要】:句法分析(SyntacticParsing)是自然語言處理的一個(gè)關(guān)鍵技術(shù),其基本任務(wù)是確定句子的成分。因?yàn)榫浞ǚ治鲂枰Y(jié)合復(fù)雜的句法結(jié)構(gòu),所以該領(lǐng)域一直是自然語言處理的一個(gè)難點(diǎn)且發(fā)展較為緩慢。蒙古文是我國少數(shù)民族地區(qū)使用的語言文字之一,而且由于其蒙古文語言特點(diǎn)的復(fù)雜性,蒙古文句法分析研究一直處于緩慢發(fā)展的階段。本文結(jié)合蒙古文簡單句的特點(diǎn),采用基于規(guī)則的自下而上的方法對蒙古文簡單句進(jìn)行句法分析。本文的主要研究內(nèi)容有以下幾點(diǎn):(1)格與主語標(biāo)志詞還原規(guī)則的建立。蒙古文簡單句中經(jīng)常會(huì)出現(xiàn)省略格與主語標(biāo)志詞的情況。通過對省略格與主語標(biāo)志詞的句型進(jìn)行研究,制定了格與主語標(biāo)志詞還原規(guī)則,進(jìn)而達(dá)到了更好地分析句子成分的目的。(2)自下而上的傳統(tǒng)蒙古文簡單句句法分析算法。本文根據(jù)傳統(tǒng)蒙古文的特點(diǎn)提出了自下而上的句法分析的方法,同時(shí)設(shè)計(jì)了該方法的算法并加以實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,格與主語標(biāo)志詞的還原明顯地提高了句子成分劃分的準(zhǔn)確率。(3)蒙古文詞性標(biāo)注。本文的詞性標(biāo)注采用的是基于字典和規(guī)則相結(jié)合的方法,首先通過字典庫對單個(gè)詞和詞組進(jìn)行詞性標(biāo)注,然后采用基于規(guī)則的方法對未登錄詞進(jìn)行詞性標(biāo)注。實(shí)驗(yàn)結(jié)果表明該方法能夠達(dá)到句法分析的基本要求。(4)詞典庫的完善以及規(guī)則庫的建立。本文根據(jù)蒙古文詞的特點(diǎn),建立了詞綴庫并對原有的詞典庫進(jìn)行了完善。在建立的規(guī)則庫中,動(dòng)詞規(guī)則有141條(除去古語動(dòng)詞規(guī)則)、名詞規(guī)則有38條、形容詞規(guī)則有15條。實(shí)驗(yàn)結(jié)果表明,規(guī)則庫的完善這極大地提高了詞性標(biāo)注的準(zhǔn)確率。
[Abstract]:Syntactic parsing is a key technique in natural language processing, whose basic task is to determine the composition of sentences. Because syntactic analysis needs to be combined with complex syntactic structures, this field has been a difficulty in natural language processing and has been developing slowly. Mongolian is one of the languages used in minority areas of China, and because of the complexity of its Mongolian language characteristics, the study of Mongolian syntactic analysis has been in the stage of slow development. Based on the features of Mongolian simple sentences, this paper analyzes the syntax of Mongolian simple sentences by rule-based bottom-up method. The main research contents of this paper are as follows: 1) case and the establishment of the rule of restoring the subject marker. Ellipsis and subject markers are often found in simple Mongolian sentences. By studying the sentence pattern of ellipsis case and subject marker, this paper formulates the rules of the reduction of case and subject marker, and then achieves the purpose of better analyzing the sentence composition. 2) the bottom-up traditional Mongolian simple sentence syntax analysis algorithm. In this paper, a bottom-up syntactic analysis method is proposed according to the characteristics of traditional Mongolian, and the algorithm of this method is designed and implemented. The experimental results show that the reduction of case and subject markers significantly improves the accuracy of sentence component classification. The part of speech tagging in this paper is based on the combination of dictionaries and rules. Firstly, a dictionary is used to label a single word and a phrase, and then a rule-based method is used to label unregistered words in part of part of speech. The experimental results show that the method can meet the basic requirements of syntactic parsing. According to the characteristics of Mongolian words, the affix database is established and the original dictionary is improved. In the established rule base, there are 141 rules for verbs (except for old verbs, 38 for nouns and 15 for adjectives). Experimental results show that the improvement of rule base greatly improves the accuracy of part of speech tagging.
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 包薩仁圖雅;達(dá)胡白乙拉;;蒙古語句法結(jié)構(gòu)分析中句子的自動(dòng)識別和分類[J];內(nèi)蒙古民族大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2015年05期

2 蘇向東;高光來;閆學(xué)亮;;蒙古文依存句法分析[J];計(jì)算機(jī)科學(xué);2014年08期

3 趙建東;高光來;飛龍;;基于歷史模型的蒙古文自動(dòng)詞性標(biāo)注研究[J];中文信息學(xué)報(bào);2013年05期

4 吳偉成;周俊生;曲維光;;基于統(tǒng)計(jì)學(xué)習(xí)模型的句法分析方法綜述[J];中文信息學(xué)報(bào);2013年03期

5 袁里馳;;基于改進(jìn)的隱馬爾科夫模型的詞性標(biāo)注方法[J];中南大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年08期

6 張貫虹;斯·勞格勞;烏達(dá)巴拉;;融合形態(tài)特征的最大熵蒙古文詞性標(biāo)注模型[J];計(jì)算機(jī)研究與發(fā)展;2011年12期

7 姜文斌;吳金星;長青;那順烏日圖;劉群;趙理莉;;蒙古語詞法分析的有向圖模型[J];中文信息學(xué)報(bào);2011年05期

8 谷川;田喜平;;基于條件隨機(jī)場的漢語詞性標(biāo)注方法研究[J];安陽師范學(xué)院學(xué)報(bào);2010年05期

9 王鵬,戴新宇,陳家駿,王啟祥;基于規(guī)則的漢語句法分析方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年29期

10 孟遙,李生,趙鐵軍,曹海龍;四種基本統(tǒng)計(jì)句法分析模型在漢語句法分析中的性能比較[J];中文信息學(xué)報(bào);2003年03期

相關(guān)會(huì)議論文 前1條

1 王斯日古楞;德·薩日娜;那順烏日圖;;現(xiàn)代蒙古語謂語段自動(dòng)標(biāo)注系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

相關(guān)博士學(xué)位論文 前2條

1 斯·勞格勞;現(xiàn)代蒙古語依存句法自動(dòng)分析研究[D];內(nèi)蒙古大學(xué);2011年

2 達(dá)胡白乙拉;蒙古語基本動(dòng)詞短語自動(dòng)識別研究[D];內(nèi)蒙古大學(xué);2005年

相關(guān)碩士學(xué)位論文 前10條

1 莫日根;基于規(guī)則的傳統(tǒng)蒙古文句法分析研究[D];內(nèi)蒙古大學(xué);2016年

2 熊曉曉;基于蒙古語名詞語義網(wǎng)的同形詞歧義消除算法的研究[D];內(nèi)蒙古師范大學(xué);2015年

3 李坤;蒙古文網(wǎng)絡(luò)熱點(diǎn)詞提取算法研究[D];內(nèi)蒙古大學(xué);2015年

4 劉慧敏;中文詞性標(biāo)注及未登錄詞詞性預(yù)測研究[D];南京師范大學(xué);2015年

5 完么才讓;基于規(guī)則的藏語句法分析研究[D];青海民族大學(xué);2014年

6 阿榮;蒙古文統(tǒng)計(jì)句法分析研究[D];內(nèi)蒙古師范大學(xué);2014年

7 李華棟;基于規(guī)則的漢語兼類詞標(biāo)注方法研究[D];西南交通大學(xué);2014年

8 明玉;基于詞典、規(guī)則與統(tǒng)計(jì)的蒙古文詞切分系統(tǒng)的研究[D];內(nèi)蒙古大學(xué);2011年

9 吳金星;蒙古語詞法標(biāo)注語料庫的構(gòu)建及相關(guān)技術(shù)研究[D];內(nèi)蒙古大學(xué);2011年

10 艷紅;基于統(tǒng)計(jì)的蒙古文自動(dòng)詞性標(biāo)注的研究與實(shí)現(xiàn)[D];內(nèi)蒙古師范大學(xué);2010年

,

本文編號:1778795

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1778795.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶43ef6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com