基于規(guī)則的藏語句法分析研究
發(fā)布時(shí)間:2017-12-28 22:12
本文關(guān)鍵詞:基于規(guī)則的藏語句法分析研究 出處:《青海民族大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 分詞歧義 藏語句型 句法分析 詞性串匹配法 概率上下文無關(guān)語法
【摘要】:句法分析是自然語言處理過程中一項(xiàng)基礎(chǔ)性的工作,從二十世紀(jì)四十年代末到現(xiàn)在,國內(nèi)外學(xué)者們設(shè)計(jì)了很多自然語言處理的形式模型,這些模型有基于短語結(jié)構(gòu)語法的形式模型、基于合一運(yùn)算的形式模型、基于依存和配價(jià)的形式模型、基于詞匯主義的形式模型、N元語法、數(shù)據(jù)平滑和隱馬爾可夫模型等,它們都對(duì)自然語言處理中的句法分析研究做出了積極的貢獻(xiàn)。 文中所提基于規(guī)則的句法分析方法主要是指chomsky的上下文無關(guān)文法,也是基于短語結(jié)構(gòu)的語法。分詞、詞性標(biāo)注以及句法結(jié)構(gòu)的樹形圖表示,都屬于句法分析的研究范疇。 在描述分詞部分時(shí),對(duì)分詞歧義類型及消歧方法做了詳細(xì)的分析。除了利用傳統(tǒng)的最大概率匹配法分詞外,還提出了一種利用轉(zhuǎn)移概率消解分詞歧義的方法,文中稱這種方法為詞性轉(zhuǎn)移概率消歧法,它在消解分詞歧義上比最大概率匹配法更優(yōu)越。自動(dòng)詞性標(biāo)注是在藏語HMM模型基礎(chǔ)上,用Viterbi算法進(jìn)行的,還對(duì)藏語中的典型詞性歧義及其消解方法做了分析。在句法結(jié)構(gòu)的自動(dòng)表示上,首先把藏語句型分成六個(gè)大類,并以此為依據(jù),構(gòu)建了一個(gè)規(guī)模為480余個(gè)句法樹的樹庫,然后利用詞性串匹配法,以樹形圖表示出藏語句子的句法結(jié)構(gòu)。 考慮到文中所用句法分析方法不能像線圖算法、LR算法和Earley算法那樣表示歧義句的句法結(jié)構(gòu)。因此,對(duì)藏語中的常見歧義句做了分類,歸納出歧義句中存在的一些規(guī)律,利用概率上下文無關(guān)語法對(duì)句子歧義做了處理,使本文的句法分析系統(tǒng)具備解決簡單歧義問題的能力。 文中設(shè)計(jì)的句法分析器,能按照詞性串匹配算法把樹庫中的所有句型對(duì)應(yīng)的句法結(jié)構(gòu)以樹形圖的形式直觀地表達(dá)出來,但因?yàn)橹挥性~性串匹配成功才能提取對(duì)應(yīng)的用廣義表表示的句法樹,所以句法分析器的性能與詞性串匹配算法沒有太大的關(guān)系,而更多地依賴于足夠高準(zhǔn)確率的詞性標(biāo)注系統(tǒng),因此,自動(dòng)詞性標(biāo)注模塊設(shè)計(jì)的好壞,會(huì)直接影響整個(gè)句法分析器的效果。
[Abstract]:Syntactic parsing is the basic work of the Natural Language Processing process, from late 1940s to now, domestic and foreign scholars have designed a lot of Natural Language Processing model, these models are based on the formal model, based on phrase structure grammar form model, one based on operation form model, dependence and valence based on lexicalism form model N yuan, grammar, data smoothing and hidden Markov model, they made a positive contribution to the study of syntactic analysis in Natural Language Processing.
【學(xué)位授予單位】:青海民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:H214
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 王鵬,戴新宇,陳家駿,王啟祥;基于規(guī)則的漢語句法分析方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年29期
2 呂振洪,蘇光大;用可視化法建立二叉樹實(shí)例[J];計(jì)算機(jī)應(yīng)用研究;2001年09期
3 才讓加,吉太加;藏語語料庫的詞性分類方法研究[J];青海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2005年04期
4 高長江;句法結(jié)構(gòu)和句法分析[J];松遼學(xué)刊(社會(huì)科學(xué)版);1985年03期
,本文編號(hào):1347618
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/1347618.html
最近更新
教材專著