天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

漢語宏觀篇章資源建設與結(jié)構分析方法研究

發(fā)布時間:2021-01-30 18:22
  在自然語言處理領域,隨著研究對象逐漸從字詞和句子轉(zhuǎn)移到句群、段落和章節(jié)等更大的語義層面,篇章分析變得越來越重要。篇章分析是理解文本整體語義的基礎,廣泛應用于情感分析、問答系統(tǒng)、自動摘要等更深層次的自然語言處理應用。相較于微觀篇章分析研究取得的成功,宏觀篇章分析面臨諸多挑戰(zhàn)。宏觀篇章分析包括篇章結(jié)構分析、篇章主次識別和篇章關系識別三個子任務;跐h語宏觀篇章結(jié)構表示體系,本文對漢語宏觀篇章資源建設與結(jié)構分析方法展開深入研究,主要研究內(nèi)容包括以下三個方面:(1)針對漢語宏觀篇章語料匱乏的問題,本文構建漢語宏觀篇章語料庫(MCDTB)。首先,基于漢語宏觀篇章結(jié)構表示體系,標注宏觀篇章結(jié)構樹,并額外標注段落主題句和篇章摘要等更高層次的宏觀篇章信息;其次,在詳細的標注流程和標注準則確定后,開發(fā)標注工具并提出質(zhì)量保證策略,以保證標注速度和標注質(zhì)量;最后,共標注720篇漢語新聞語料,并取得一致率大于80%和Kappa值大于0.6的標注一致性。在MCDTB上的篇章主次識別實驗驗證了該語料庫的可用性。(2)針對高層次篇章結(jié)構識別由于樣本過少而產(chǎn)生過擬合的問題,本文提出基于標簽退化組合模型的宏觀篇章結(jié)構識... 

【文章來源】:蘇州大學江蘇省

【文章頁數(shù)】:82 頁

【學位級別】:碩士

【部分圖文】:

漢語宏觀篇章資源建設與結(jié)構分析方法研究


圖1-1?chtb_0056的宏觀篇章結(jié)構樹??

篇章結(jié)構,篇章


章構建一棵完整??的篇章結(jié)構樹,沒有顯式區(qū)分微觀層次和宏觀層次。??\f\?2-\i?(a)?In?addition,?(b)?Mrs.?Lidenvoodsaid,?(c)?Norfolk?is?hkely?to?draw?down?its??cash?initially?(d)?to?finance?the?purchases?(e)?and?this?forfeit?some?interest?income.??例2-1為RST-DT中wsj_l111的一個句子,其篇章結(jié)構樹標注如圖2-1所示,標??注內(nèi)容主要包括篇章的結(jié)構、主次(核性)和關系三個方面。篇章基本單元為a,?b,c,??d和e,箭頭指向的節(jié)點(如a,?c,a-d)為篇章關系中較為重要的部分,即核心(Nucelus)。??兩個篇章單兀使用篇章關系(如attribution-embedded,?same-unit)連接,從而合并為更??大的篇章單元,RST-DT的篇章關系分為18大類78小類。??a-e??consequence-s??a-d?e??same-unit??a-b?c-d??attribution-embedded?purpose??a?b?|?c?—?d??圖2-1?RST-DT?wsjj?111的篇章結(jié)構子樹??10??

鏈接圖,篇章結(jié)構,鏈接,篇章


料庫語料來源于CTB6.0,共標注500篇新??聞類文章,其中有效標注2342個篇章(段落),篇章基本單元(EDU)為子句或句子。??你\1-11?(a)亞洲國家和地區(qū)是中國主要外資來源,(b)來自香港、臺灣、日本、??韓國、東盟等國家和地區(qū),投資額占全國利用外資總額的百分之八十五以上。(c)其??中香港仍是內(nèi)地吸收外資的主要來源,(d)占累計實際吸收外商投資的比重為百分之??五十五以上。??在CDTB中,文章chtb_0076的部分片段如例2-2所示,其標注的篇章結(jié)構樹如??圖2-2所示,相較于RST-DT和PDTB,?CDTB既標注篇章的結(jié)構、主次和關系(如??RST-DT),也標注篇章關系中所包含的連接詞(共標注278個連接詞)和顯式、隱式??關系(共標注7310個關系,其中顯式1814個,隱式54%個)等。與RST-DT不同,??CDTB以-個段落構建?棵篇章結(jié)構樹,沒有構建段落及以上的篇章結(jié)構。??a-d?('今分){其中,符合語感,+吋刪除!??〈符合語感,f可添加>?〈符合語感,f可刪除〉???a???b??I?c?I??d???圖2-2?CDTB的基于鏈接依存樹的篇章結(jié)構樹(chtb_0076)??2.2漢語宏觀篇章分析相關任務介紹??篇章分析分為兩個層次:微觀層面和宏觀層面。在微觀層面,篇章基本單元(EDU)??為子句或句子,而在宏觀層面,篇章基本單元(EDU)為自然段落。篇章分析目的是??分析出篇章的層次結(jié)構及語義關系,具體的,是判斷篇章單元間是否存在關系、判斷??篇章單元的重要性以及對篇章單元間存在的關系分類。??篇章分析主要分為3個子任務:篇章結(jié)構分析、

【參考文獻】:
期刊論文
[1]基于轉(zhuǎn)移的中文篇章結(jié)構解析研究[J]. 孫成,孔芳.  中文信息學報. 2018(12)
[2]自然語言處理中的篇章主次關系研究[J]. 褚曉敏,朱巧明,周國棟.  計算機學報. 2017(04)
[3]基于框架的漢語篇章結(jié)構生成和篇章關系識別[J]. 呂國英,蘇娜,李茹,王智強,柴清華.  中文信息學報. 2015(06)
[4]漢語篇章修辭結(jié)構的標注研究[J]. 樂明.  中文信息學報. 2008(04)
[5]漢英語篇主題與段落結(jié)構模式的比較研究[J]. 李錦,廖開洪.  暨南學報(哲學社會科學版). 2001(05)

博士論文
[1]漢語篇章結(jié)構表示體系及資源構建研究[D]. 李艷翠.蘇州大學 2015

碩士論文
[1]面向問答系統(tǒng)的復述識別技術研究與實現(xiàn)[D]. 徐帥.哈爾濱工業(yè)大學 2009



本文編號:3009369

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3009369.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8e982***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产亚洲精品香蕉视频播放| 日韩成人中文字幕在线一区| 亚洲中文字幕在线观看黑人| 国产偷拍精品在线视频| 午夜国产福利在线播放| 欧美大粗爽一区二区三区| 欧美精品亚洲精品日韩精品| 好吊日成人免费视频公开| 亚洲中文字幕视频一区二区| 丰满人妻一二区二区三区av| 久久亚洲国产视频三级黄| 成人欧美一区二区三区视频| 欧美日本亚欧在线观看| 国产精品第一香蕉视频| 精品国产日韩一区三区| 亚洲欧美日韩另类第一页| 国产精品福利精品福利| 少妇在线一区二区三区| 免费在线观看激情小视频| 国产精品日韩精品最新| 亚洲一区二区精品久久av| 国产精品夜色一区二区三区不卡| 国产av天堂一区二区三区粉嫩 | 欧美激情中文字幕综合八区| 欧美精品激情视频一区| 加勒比日本欧美在线观看| 久久精品中文字幕人妻中文 | 91人妻丝袜一区二区三区| 99久久精品视频一区二区| 亚洲国产中文字幕在线观看| 日韩精品在线观看一区| 欧美一区二区三区高潮菊竹| 大尺度剧情国产在线视频| 91久久国产福利自产拍| 欧美午夜国产在线观看| 午夜亚洲少妇福利诱惑| 人妻少妇系列中文字幕| 成人日韩视频中文字幕| av在线免费播放一区二区| 婷婷伊人综合中文字幕| 激情少妇一区二区三区|