現(xiàn)代維吾爾語依存語法語料庫標(biāo)注研究
本文選題:依存語法 + 標(biāo)注規(guī)范。 參考:《新疆大學(xué)》2016年碩士論文
【摘要】:計(jì)算機(jī)語言學(xué)需要語言學(xué)理論,讓計(jì)算機(jī)處理人類語言,需要一套切實(shí)可行的語言學(xué)理論。依存語法具備了現(xiàn)代語言學(xué)的詞匯性、整體性、關(guān)系性、單層次性等特點(diǎn),在計(jì)算機(jī)語言學(xué)中得到了廣泛的運(yùn)用,也助長了依存語法理論的發(fā)展。依存語法的重心在句中詞語詞之間的關(guān)系,以動詞為核心詞,直觀的反映了句子的核心成分,更便于句法層面到語義層面的轉(zhuǎn)換,更宜于處理自由語序的語言,而維吾爾語作為自由語序的粘著性語言,在依存語法中可以得到更好的闡釋。近年來,英語、捷克語、俄語、日語、漢語、土耳其語、阿拉伯語等語言的依存語法樹庫相繼建立,作為全球740萬人通用的語言,維吾爾語依存語法樹庫的建立迫在眉睫。而建立依存樹庫的第一步是要有一套完整的依存標(biāo)注體系作為標(biāo)準(zhǔn)。本文討論了怎樣用依存關(guān)系標(biāo)注維吾爾語語料,即依存語法標(biāo)注規(guī)范,并介紹了維吾爾語依存樹庫UDT1,2(Uyghur dependency Treebank)的建立。本文從以下幾個(gè)方面進(jìn)行了研究:(1)介紹了根據(jù)維吾爾語句子詞間關(guān)系研制出的維吾爾語依存語法標(biāo)注體系。(2)從句中短語出發(fā),更詳細(xì)地討論了標(biāo)注規(guī)范。(3)用統(tǒng)計(jì)的方法,在現(xiàn)已標(biāo)注完的三千多個(gè)句子的基礎(chǔ)上討論了標(biāo)注距離、標(biāo)注關(guān)系出現(xiàn)量等問題并進(jìn)行詞性分析。(4)現(xiàn)存在的若干問題與總結(jié)。
[Abstract]:Computer linguistics needs linguistic theories, and a set of practical linguistic theories is needed for computers to deal with human languages. Dependency grammar has the characteristics of lexicality, integrity, relation and single level in modern linguistics. It has been widely used in computer linguistics, and has also contributed to the development of the theory of dependent grammar. The emphasis of dependency grammar is on the relationship between words and phrases in sentences. The verb is the core word, which directly reflects the core components of the sentence, facilitates the transformation from the syntactic level to the semantic level, and is more suitable for dealing with the language of free word order. Uyghur, as a cohesive language in free word order, can be better interpreted in dependency grammar. In recent years, the dependent grammar tree database of English, Czech, Russian, Japanese, Chinese, Turkish, Arabic and other languages has been established one after another. As a common language of 7.4 million people in the world, the establishment of Uygur dependent grammar tree is imminent. The first step to build dependency tree database is to have a complete dependency tagging system as the standard. This paper discusses how to annotate Uygur language data by dependency relation, that is, dependency syntax annotation specification, and introduces the establishment of UDT1Uyghur dependency tree library. This paper introduces the phrases of Uygur dependent grammar tagging system, which is developed according to the relationship between Uygur sentences and words, and discusses in more detail the tagging criterion. On the basis of more than 3,000 sentences that have been annotated now, this paper discusses the problems of tagging distance and the appearance of tagging relations, and analyzes the parts of speech.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:H215
【相似文獻(xiàn)】
相關(guān)期刊論文 前8條
1 劉彬;;基于依存語法的消歧策略在機(jī)譯中的運(yùn)用[J];湖南醫(yī)科大學(xué)學(xué)報(bào)(社會科學(xué)版);2003年03期
2 馬永軍;;基于依存語法的自然語言處理現(xiàn)狀及前景展望[J];學(xué)術(shù)交流;2007年10期
3 劉海濤;依存語法和機(jī)器翻譯[J];語言文字應(yīng)用;1997年03期
4 袁文宜;;依存語法概述[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2010年18期
5 劉彬;李麗;;淺析基于依存語法的翻譯軟件詞典的構(gòu)建[J];湖南醫(yī)科大學(xué)學(xué)報(bào)(社會科學(xué)版);2005年02期
6 周明,黃昌寧;面向語料庫標(biāo)注的漢語依存體系的探討[J];中文信息學(xué)報(bào);1994年03期
7 李良炎;何中市;;句法標(biāo)注的一般模型與參數(shù)分析[J];計(jì)算機(jī)科學(xué);2007年11期
8 ;[J];;年期
相關(guān)會議論文 前2條
1 趙懌怡;高松;劉海濤;;基于依存語法的漢語并列結(jié)構(gòu)自動分析研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
2 馮志偉;;判斷從屬樹合格性的五個(gè)條件[A];世紀(jì)之交的中國應(yīng)用語言學(xué)研究——第二屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];1998年
相關(guān)碩士學(xué)位論文 前5條
1 何亞瀾;中學(xué)生二語寫作中主賓語使用發(fā)展趨勢的研究[D];浙江大學(xué);2016年
2 伊再提·依斯買提;現(xiàn)代維吾爾語依存語法語料庫標(biāo)注研究[D];新疆大學(xué);2016年
3 高玲玲;基于依存語法的漢語句法分析研究[D];中國海洋大學(xué);2009年
4 張育;基于依存語法的統(tǒng)計(jì)機(jī)器翻譯研究[D];蘇州大學(xué);2011年
5 焦福增;基于特征的產(chǎn)品評論挖掘關(guān)鍵問題研究[D];山東大學(xué);2013年
,本文編號:1782014
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/1782014.html