現(xiàn)代漢語(yǔ)特殊句式的信息依存句法標(biāo)注研究
本文選題:信息依存語(yǔ)言模型 切入點(diǎn):現(xiàn)代漢語(yǔ) 出處:《重慶大學(xué)》2012年碩士論文
【摘要】:語(yǔ)料庫(kù)是語(yǔ)言研究與教學(xué)的重要基礎(chǔ),具有重要的應(yīng)用價(jià)值。目前語(yǔ)料庫(kù)建設(shè)已經(jīng)從量的積累轉(zhuǎn)向質(zhì)的提升,如何通過(guò)語(yǔ)料標(biāo)注對(duì)語(yǔ)料進(jìn)行精加工,成為語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的熱點(diǎn)和難點(diǎn)問(wèn)題。當(dāng)前大多數(shù)語(yǔ)料庫(kù)的標(biāo)注還集中在詞法層面,句法標(biāo)注的規(guī)模有限。傳統(tǒng)形式化句法理論(例如短語(yǔ)結(jié)構(gòu)語(yǔ)法、依存語(yǔ)法)還不夠成熟,無(wú)法應(yīng)用于語(yǔ)料庫(kù)中的大規(guī)模句法標(biāo)注實(shí)踐。信息依存語(yǔ)言模型(Information Dependency Language Model,IDLM)是李良炎(2009)提出的一種面向語(yǔ)料庫(kù)建設(shè)的句法標(biāo)注理論。該理論整合了短語(yǔ)結(jié)構(gòu)語(yǔ)法和依存語(yǔ)法的描寫(xiě)能力,借鑒了認(rèn)知語(yǔ)法的概念自主依存原理,注重語(yǔ)言描寫(xiě)與解釋?zhuān)哂芯浞ㄕZ(yǔ)義一體化的特點(diǎn)。作為一種新理論,在應(yīng)用于語(yǔ)料庫(kù)建設(shè)之前,需要結(jié)合具體語(yǔ)種對(duì)傳統(tǒng)句法研究中存在的難點(diǎn)和熱點(diǎn)問(wèn)題進(jìn)行深入分析,以探索這一理論的適用性,并初步形成句法標(biāo)注規(guī)范,從而為大規(guī)模句法標(biāo)注奠定理論和知識(shí)基礎(chǔ)。 現(xiàn)代漢語(yǔ)中存在大量的特殊句式,是現(xiàn)代漢語(yǔ)研究的難點(diǎn)和熱點(diǎn)。傳統(tǒng)研究主要從語(yǔ)言學(xué)角度對(duì)各種特殊句式分別研究,一直以來(lái)爭(zhēng)議不斷。還沒(méi)有看到有人從語(yǔ)料庫(kù)建設(shè)的角度對(duì)現(xiàn)代漢語(yǔ)的各種特殊句式進(jìn)行系統(tǒng)的形式化分析和整理。本文通過(guò)對(duì)傳統(tǒng)研究文獻(xiàn)的梳理,確定了四種有代表性的現(xiàn)代漢語(yǔ)特殊句式,以IDLM為理論基礎(chǔ)進(jìn)行形式化分析,給出句法標(biāo)注的理?yè)?jù)和表達(dá)式。研究目的在于:一方面驗(yàn)證IDLM對(duì)現(xiàn)代漢語(yǔ)的適用性,另一方面完成對(duì)現(xiàn)代漢語(yǔ)幾種代表性特殊句式的標(biāo)注。本文是將IDLM應(yīng)用于現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)建設(shè)的預(yù)研究。 本文共有五個(gè)章節(jié)。第一章是緒論,介紹了研究背景、研究?jī)?nèi)容以及研究的價(jià)值和意義。第二章為文獻(xiàn)綜述,包括對(duì)相關(guān)語(yǔ)料標(biāo)注領(lǐng)域和語(yǔ)言學(xué)領(lǐng)域研究現(xiàn)狀的梳理和總結(jié)。第三章為理論基礎(chǔ),詳細(xì)介紹了IDLM理論的原理和句法語(yǔ)義分析過(guò)程。第四章對(duì)各特殊句式進(jìn)行了句素關(guān)系分析和IDLM結(jié)構(gòu)分析,并在此基礎(chǔ)上對(duì)其進(jìn)行了句法語(yǔ)義解讀。第五章為全文結(jié)論。 本文創(chuàng)新之處在于:嘗試在充分考察傳統(tǒng)語(yǔ)言學(xué)研究成果的基礎(chǔ)上,以面向語(yǔ)料庫(kù)的形式化句法理論——IDLM來(lái)研究現(xiàn)代漢語(yǔ)特殊句式,從而有別于相對(duì)孤立的傳統(tǒng)語(yǔ)言學(xué)研究和傳統(tǒng)句法標(biāo)注研究;通過(guò)對(duì)幾種代表性現(xiàn)代漢語(yǔ)特殊句式的研究,使IDLM在現(xiàn)代漢語(yǔ)分析方面的應(yīng)用更加深入;IDLM對(duì)某些特殊句式的標(biāo)注不夠直觀和簡(jiǎn)潔,本文通過(guò)縮寫(xiě)形式予以簡(jiǎn)潔標(biāo)記。 通過(guò)研究發(fā)現(xiàn):IDLM句法標(biāo)注理論將句素之間以及句素內(nèi)部的各種關(guān)系呈現(xiàn)為一個(gè)個(gè)多元結(jié)構(gòu),再通過(guò)聯(lián)合或嵌套的方式相互關(guān)聯(lián),符合人們認(rèn)知邏輯和行為經(jīng)驗(yàn),方便了計(jì)算機(jī)對(duì)自然語(yǔ)言的學(xué)習(xí)和語(yǔ)言信息的提取。該理論的提出打破了當(dāng)前語(yǔ)料標(biāo)注在詞法層面停滯不前的僵局,為語(yǔ)料標(biāo)注的進(jìn)一步發(fā)展提供了參考,具有深遠(yuǎn)的實(shí)踐意義。 總之,IDLM理論以簡(jiǎn)潔的信息依存表達(dá)式和直觀的信息依存圖實(shí)現(xiàn)了對(duì)句法結(jié)構(gòu)的形式化,其標(biāo)注結(jié)果符合句子的真實(shí)語(yǔ)義,對(duì)特殊句式具有較好的描寫(xiě)能力,可供計(jì)算機(jī)檢索使用。這些研究成果為大規(guī)模語(yǔ)料庫(kù)建設(shè)作出了準(zhǔn)備,,是對(duì)傳統(tǒng)研究的有益補(bǔ)充。
[Abstract]:Corpus is an important foundation of language research and teaching , and it has important application value .
This paper makes a formal analysis of the special sentence patterns of modern Chinese from the perspective of linguistics , and gives a formal analysis of the special sentence patterns of modern Chinese from the perspective of linguistics . The aim of this paper is to verify the applicability of IDLM to modern Chinese and to complete the annotation of some special sentences in modern Chinese .
Chapter One is the introduction , introduces the research background , the research content and the value and significance of the research . The second chapter is the research background , the research content and the value and significance of the research . The second chapter provides the theoretical foundation , introduces the theory of IDLM theory and the syntax semantic analysis process in detail .
This paper tries to study the special sentence patterns of modern Chinese based on the formal syntactic theory _ IDLM of corpus based on the study of traditional linguistic research results , so that it is different from the relative isolation of traditional linguistic research and traditional syntactic tagging ;
By studying the special sentence patterns of several representative modern Chinese , the application of IDLM in modern Chinese analysis is further deepened ;
IDLM is not intuitive and concise for certain special sentences , which is abbreviated by abbreviated form .
Through the research , it is found that IDLM syntactic tagging theory presents a multi - element structure , which is associated with each other in a joint or nested manner . It accords with people ' s cognitive logic and behavioral experience . It is convenient for computer to extract natural language learning and language information . The proposed theory breaks the deadlock of the current corpus labeling at the lexical level , provides a reference for further development of corpus labeling , and has far - reaching practical significance .
In short , IDLM theory has realized the formal structure of sentence structure with simple information dependent expression and intuitive information dependency graph . The result of labeling accords with the true meaning of sentence , has better description ability for special sentence pattern , and can be used for computer retrieval . The research results are prepared for the construction of large - scale corpus , which is a beneficial complement to the traditional research .
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類(lèi)號(hào)】:H146
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 項(xiàng)菊;現(xiàn)代漢語(yǔ)兩種特殊句式的界定[J];高等函授學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2004年05期
2 寧文忠;對(duì)連動(dòng)句式的認(rèn)知和解讀——現(xiàn)代漢語(yǔ)特殊句式辨析之一[J];甘肅高師學(xué)報(bào);2002年03期
3 寧文忠;“把”字句的語(yǔ)義特征及語(yǔ)用價(jià)值——現(xiàn)代漢語(yǔ)特殊句式辯析之三[J];甘肅高師學(xué)報(bào);2003年03期
4 黃新強(qiáng);;論現(xiàn)代漢語(yǔ)把字句中“把”的詞類(lèi)歸屬[J];菏澤學(xué)院學(xué)報(bào);2011年04期
5 戴新宇;尹存燕;陳家駿;鄭國(guó)梁;;機(jī)器翻譯研究現(xiàn)狀與展望[J];計(jì)算機(jī)科學(xué);2004年11期
6 康競(jìng)春;;從認(rèn)知的角度看“把”字句[J];科技信息(科學(xué)教研);2008年15期
7 周強(qiáng);漢語(yǔ)句法樹(shù)庫(kù)標(biāo)注體系[J];中文信息學(xué)報(bào);2004年04期
8 趙金色;;“把”字句句法-語(yǔ)義研究[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2010年02期
9 鹿榮;;可逆句式的范圍及分類(lèi)[J];青島大學(xué)師范學(xué)院學(xué)報(bào);2008年02期
10 宋衛(wèi)華;漢語(yǔ)連動(dòng)句及其相關(guān)語(yǔ)法研究[J];青海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2002年04期
相關(guān)碩士學(xué)位論文 前1條
1 劉琴;現(xiàn)代漢語(yǔ)“被”字句生成句法研究[D];四川師范大學(xué);2008年
本文編號(hào):1701076
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/1701076.html