漢語篇章結(jié)構(gòu)表示體系及資源構(gòu)建研究
本文關(guān)鍵詞:漢語篇章結(jié)構(gòu)表示體系及資源構(gòu)建研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:篇章指由一系列連續(xù)的子句、句子或語段構(gòu)成的語言整體單位,每個篇章不僅具有內(nèi)部連貫性,而且篇章中的各級語言單位是描述同一問題或同一種情境的相對完整的語言整體。在一個篇章中,子句、句子或語段間具有一定的層次結(jié)構(gòu)和語義關(guān)系,篇章結(jié)構(gòu)分析旨在分析出這種結(jié)構(gòu)關(guān)系。篇章結(jié)構(gòu)分析結(jié)果對于提高自動文摘、知識抽取、自動問答等相關(guān)系統(tǒng)的性能均有重要作用。隨著詞法、句法分析技術(shù)的成熟,篇章結(jié)構(gòu)分析成為制約自然語言處理的關(guān)鍵基礎(chǔ)問題。目前篇章結(jié)構(gòu)分析研究主要面向英語,面向漢語的研究相對落后。主要表現(xiàn)在:1)適用于漢語的篇章結(jié)構(gòu)分析理論還不完善;2)符合漢語特點(diǎn)的大規(guī)模漢語篇章結(jié)構(gòu)語料資源匱乏;3)由于漢英語言上的差異性,適用于英語的篇章結(jié)構(gòu)分析方法不能直接應(yīng)用在漢語篇章結(jié)構(gòu)分析研究中。本文重點(diǎn)研究了漢語篇章結(jié)構(gòu)的理論表示體系。借鑒英語修辭結(jié)構(gòu)理論和賓州篇章樹庫體系的優(yōu)點(diǎn),參考漢語復(fù)句和句群的研究成果,結(jié)合漢語本身特點(diǎn),本文提出一種基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系,并根據(jù)漢語特點(diǎn)定義了其中的關(guān)鍵元素:子句(基本篇章單位)、連接詞、篇章結(jié)構(gòu)關(guān)系、篇章單位主次。連接依存樹的主要特征是葉子節(jié)點(diǎn)為子句,內(nèi)部節(jié)點(diǎn)為連接詞,連接詞通過其層級地位(管轄范圍)表示篇章結(jié)構(gòu)層次,通過其語義(具體與抽象)表示篇章關(guān)系,連接詞所連接的篇章單位根據(jù)篇章整體意圖區(qū)分主次。與修辭結(jié)構(gòu)理論、賓州篇章樹庫體系的理論對比表明,本文所提基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系在理論上具有一定的優(yōu)越性,并且符合漢語特點(diǎn);谶B接依存樹的漢語篇章結(jié)構(gòu)表示體系是進(jìn)一步開展篇章結(jié)構(gòu)語料庫構(gòu)建的理論基礎(chǔ)。在此基礎(chǔ)上,進(jìn)行了漢語篇章結(jié)構(gòu)語料庫的構(gòu)建研究;谶B接依存樹表示體系,本文采用自頂向下的標(biāo)注策略和人機(jī)結(jié)合的語料庫標(biāo)注方式,構(gòu)建了漢語篇章結(jié)構(gòu)語料庫(Chinese Discourse Treebank,CDTB)。CDTB目前包含來自Chinese Treebank的500個文檔,本文對其進(jìn)行分析并展示了語料庫的標(biāo)注情況。標(biāo)注一致性測試表明CDTB標(biāo)注質(zhì)量較好,統(tǒng)計(jì)數(shù)據(jù)表明所標(biāo)CDTB達(dá)到一定規(guī)模。CDTB可以為漢語篇章結(jié)構(gòu)分析研究提供資源支持。最后,本文實(shí)現(xiàn)了基于連接依存樹的漢語篇章結(jié)構(gòu)分析平臺。該平臺包括子句識別、篇章結(jié)構(gòu)樹構(gòu)建、篇章關(guān)系識別、篇章單位主次識別任務(wù),實(shí)驗(yàn)結(jié)果驗(yàn)證了本文所提基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系的合理性,以及所標(biāo)CDTB語料庫的可用性。目前,漢語篇章結(jié)構(gòu)分析研究尚處于起步階段,本文研究亦屬探索性工作,上述工作在理論研究、資源建設(shè)、計(jì)算分析上對漢語篇章結(jié)構(gòu)分析研究均有不同程度的創(chuàng)新,對該領(lǐng)域的相關(guān)研究具有重要參考價值。
【關(guān)鍵詞】:篇章結(jié)構(gòu)分析 連接依存樹 語料庫 子句 篇章關(guān)系
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 中文摘要4-6
- Abstract6-12
- 第1章 緒論12-35
- 1.1 研究背景和意義12-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-33
- 1.2.1 英語篇章結(jié)構(gòu)分析的理論研究15-20
- 1.2.1.1 淺層的銜接關(guān)系15
- 1.2.1.2 Hobbs模型15-16
- 1.2.1.3 修辭結(jié)構(gòu)理論16-18
- 1.2.1.4 賓州篇章樹庫體系18-20
- 1.2.1.5 其它相關(guān)理論20
- 1.2.2 英語篇章結(jié)構(gòu)分析的資源建設(shè)20-24
- 1.2.2.1 修辭結(jié)構(gòu)理論篇章樹庫20-22
- 1.2.2.2 賓州篇章樹庫22-24
- 1.2.3 英語篇章結(jié)構(gòu)分析的計(jì)算模型24-29
- 1.2.3.1 基于RSTDT的研究25-27
- 1.2.3.2 基于PDTB的研究27-29
- 1.2.3.3 結(jié)合RSTDT和PDTB的研究29
- 1.2.4 漢語篇章結(jié)構(gòu)分析研究現(xiàn)狀及存在問題29-33
- 1.2.4.1 漢語篇章結(jié)構(gòu)分析研究現(xiàn)狀29-32
- 1.2.4.2 存在問題32-33
- 1.3 本文的研究內(nèi)容33-34
- 1.4 本文的組織結(jié)構(gòu)34-35
- 第2章 基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系35-76
- 2.1 引言35-38
- 2.1.1 已有篇章結(jié)構(gòu)理論體系分析35-36
- 2.1.2 漢語篇章結(jié)構(gòu)的特點(diǎn)36-37
- 2.1.3 連接依存樹37-38
- 2.2 葉子節(jié)點(diǎn)——子句38-48
- 2.2.1 子句的定義38-40
- 2.2.2 子句的判定40-48
- 2.2.2.1 子句是單句40
- 2.2.2.2 子句是復(fù)句中的分句40-41
- 2.2.2.3 標(biāo)點(diǎn)與子句判定41-47
- 2.2.2.4 一些特別情況47-48
- 2.3 內(nèi)部節(jié)點(diǎn)——連接詞48-58
- 2.3.1 連接詞的特點(diǎn)49-52
- 2.3.1.1 連接詞的形式49-50
- 2.3.1.2 連接詞的分布50-51
- 2.3.1.3 連接詞的詞性51
- 2.3.1.4 連接詞的句法特性51
- 2.3.1.5 連接詞的邏輯語義關(guān)系51-52
- 2.3.1.6 其它連接詞52
- 2.3.2 隱式連接詞的添加52-57
- 2.3.2.1 添加連接詞的依據(jù)53-55
- 2.3.2.2 連接詞添加的位置55
- 2.3.2.3 其它情況55-57
- 2.3.3 顯式連接詞的刪除57-58
- 2.4 篇章結(jié)構(gòu)關(guān)系58-67
- 2.4.1 篇章結(jié)構(gòu)層次化及判定58-60
- 2.4.2 篇章關(guān)系類別及判定60-67
- 2.4.2.1 篇章關(guān)系類別61-65
- 2.4.2.2 篇章關(guān)系的判定65-67
- 2.5 篇章單位主次67-74
- 2.5.1 篇章單位主次區(qū)分67-68
- 2.5.2 篇章單位主次判定68-74
- 2.5.2.1 主次判定的依據(jù)69-71
- 2.5.2.2 主次判定的方法71-73
- 2.5.2.3 主次判定的難點(diǎn)73-74
- 2.6 與相關(guān)理論的比較74-75
- 2.7 本章小結(jié)75-76
- 第3章 基于連接依存樹表示體系的CDTB語料庫構(gòu)建76-92
- 3.1 引言76
- 3.2 自頂向下的CDTB標(biāo)注策略76-77
- 3.3 人機(jī)結(jié)合的CDTB標(biāo)注方法77-81
- 3.3.1 標(biāo)注流程設(shè)計(jì)78
- 3.3.2 語料標(biāo)注78-80
- 3.3.3 語料格式80-81
- 3.3.4 語料校對81
- 3.4 CDTB標(biāo)注一致性測試81-83
- 3.5 CDTB標(biāo)注信息統(tǒng)計(jì)與分析83-91
- 3.5.1 連接詞統(tǒng)計(jì)與分析84-85
- 3.5.2 篇章關(guān)系統(tǒng)計(jì)與分析85-87
- 3.5.3 篇章結(jié)構(gòu)統(tǒng)計(jì)與分析87-89
- 3.5.4 篇章單位主次統(tǒng)計(jì)與分析89-91
- 3.6 本章小結(jié)91-92
- 第4章 基于CDTB的漢語篇章結(jié)構(gòu)分析92-115
- 4.1 引言92-94
- 4.2 漢語篇章結(jié)構(gòu)分析框架94-96
- 4.3 實(shí)驗(yàn)方法96-103
- 4.3.1 所用特征96-101
- 4.3.1.1 子句識別97-98
- 4.3.1.2 連接詞識別與分類98-99
- 4.3.1.3 篇章關(guān)系及主次識別99-101
- 4.3.1.4 篇章結(jié)構(gòu)識別101
- 4.3.2 實(shí)驗(yàn)設(shè)置101-103
- 4.4 實(shí)驗(yàn)結(jié)果及分析103-114
- 4.4.1 基于標(biāo)點(diǎn)的子句識別103-106
- 4.4.2 連接詞識別與分類106-108
- 4.4.2.1 連接詞識別106-107
- 4.4.2.2 連接詞分類107-108
- 4.4.3 隱式篇章關(guān)系識別108-110
- 4.4.4 篇章單位主次識別110
- 4.4.5 基于連接依存樹的漢語篇章結(jié)構(gòu)分析平臺性能110-114
- 4.4.5.1 結(jié)構(gòu)和關(guān)系識別結(jié)果與分析111-112
- 4.4.5.2 篇章結(jié)構(gòu)樹構(gòu)建結(jié)果與分析112-114
- 4.5 本章小結(jié)114-115
- 第5章 總結(jié)與展望115-117
- 5.1 總結(jié)115-116
- 5.2 展望116-117
- 參考文獻(xiàn)117-125
- 作者在攻讀博士學(xué)位期間完成的論文及科研工作125-127
- 附錄127-137
- 致謝137-138
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 胡航麗;莫倩;;利用篇章結(jié)構(gòu)改進(jìn)股評觀點(diǎn)分類的研究[J];小型微型計(jì)算機(jī)系統(tǒng);2009年05期
2 陸應(yīng)鑄;在“三看”中選準(zhǔn)報道切入點(diǎn)[J];傳媒觀察;2003年09期
3 楊凌云;分析篇章結(jié)構(gòu)——提高學(xué)生閱讀能力的有效途徑[J];成都電訊工程學(xué)院學(xué)報;1988年S2期
4 陸應(yīng)鑄;;在“三看”中選準(zhǔn)報道切入點(diǎn)[J];記者搖籃;2003年12期
5 楊江;侯敏;王寧;;基于淺層篇章結(jié)構(gòu)的評論文傾向性分析[J];中文信息學(xué)報;2011年02期
6 黎炯宗;;通訊文章的節(jié)奏與韻味[J];新聞知識;2012年03期
7 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 馬艷云;;淺談多媒體在小學(xué)語文教學(xué)中的作用[A];2014年6月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會論文集[C];2014年
2 單永明;;漢語文本的篇章結(jié)構(gòu)及其標(biāo)引算法的研究[A];自然語言理解與機(jī)器翻譯——全國第六屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
3 陳佳君;;從辭章章法談作文運(yùn)材教學(xué)——以幾種常用于論說文的章法為例[A];文學(xué)語言理論與實(shí)踐叢書——辭章學(xué)論文集(上)[C];2002年
4 丁衛(wèi)宏;;淺談?wù)Z文對比藝術(shù)教學(xué)[A];中華教育理論與實(shí)踐科研論文成果選編(第1卷)[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 民勤縣蘇武鄉(xiāng)鄧岔小學(xué) 許鳳梅;淺議農(nóng)村小學(xué)生閱讀興趣的培養(yǎng)[N];武威日報;2008年
2 海門市三星中心小學(xué) 劉培;語文教學(xué)中如何引導(dǎo)學(xué)生質(zhì)疑[N];成才導(dǎo)報.教育周刊;2007年
3 陳文;科學(xué)性與實(shí)用性的統(tǒng)一[N];中華讀書報;2001年
4 清華大學(xué)外語系 許建平;標(biāo)題匹配題:注重整體篇章結(jié)構(gòu)[N];中國教育報;2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李艷翠;漢語篇章結(jié)構(gòu)表示體系及資源構(gòu)建研究[D];蘇州大學(xué);2015年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 阮茜;事故報道的篇章結(jié)構(gòu)[D];西安外國語大學(xué);2015年
2 劉兆林;英漢經(jīng)濟(jì)類語篇篇章結(jié)構(gòu)模式之比較研究[D];西南交通大學(xué);2003年
3 石靜;篇章結(jié)構(gòu)與接受心理[D];華東師范大學(xué);2003年
4 劉春芳;《世說新語》篇章結(jié)構(gòu)語用分析研究[D];山西大學(xué);2003年
5 廉愛寧;基于修辭結(jié)構(gòu)理論的留學(xué)生漢語議論文篇章結(jié)構(gòu)研究[D];東北師范大學(xué);2011年
6 杜平;中德新年賀詞之篇章結(jié)構(gòu)分析[D];西安外國語大學(xué);2013年
本文關(guān)鍵詞:漢語篇章結(jié)構(gòu)表示體系及資源構(gòu)建研究,由筆耕文化傳播整理發(fā)布。
本文編號:444887
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/444887.html