天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于動(dòng)詞—論元結(jié)構(gòu)的新聞篇章事件鏈構(gòu)建技術(shù)研究

發(fā)布時(shí)間:2018-09-08 14:30
【摘要】:新聞是人們所關(guān)注的重點(diǎn)信息之一,隨著大數(shù)據(jù)時(shí)代的到來,在茫茫數(shù)據(jù)海洋中充斥著各種各樣的新聞,每天都更新著無數(shù)新聞,怎樣以更小的代價(jià)取得更快捷、更有效的新聞信息是刻不容緩要解決的問題。本文針對(duì)獲取新聞文本信息點(diǎn)的問題,以事件為信息點(diǎn)表示新聞文本,提出用事件鏈構(gòu)建技術(shù)獲取文本的關(guān)鍵信息,以動(dòng)詞-論元結(jié)構(gòu)標(biāo)注語料為基礎(chǔ)表示事件,采用基于動(dòng)詞激起的事件框架庫定義事件類型,通過新聞文本詞匯鏈為基礎(chǔ),以事件關(guān)系鏈接事件構(gòu)建事件鏈,用事件鏈說明新聞事件的演變。事件鏈反映了新聞文本的脈絡(luò),與詞匯連息息相關(guān)。本文主要從以下四個(gè)方面展開研究:(1)動(dòng)詞-論元結(jié)構(gòu)語料庫的構(gòu)建對(duì)新聞文本經(jīng)過預(yù)處理后,標(biāo)記動(dòng)詞,對(duì)依存樹上不可能承擔(dān)謂詞角色的結(jié)點(diǎn)進(jìn)行剪枝處理,減少輸入到依存距離分類器中的實(shí)例個(gè)數(shù)進(jìn)行論元識(shí)別,再采用條件隨機(jī)場(chǎng)進(jìn)行論元語義角色的分類,最后采用基于距離的后處理方法實(shí)現(xiàn)語義角色的標(biāo)注,對(duì)文本進(jìn)行動(dòng)詞-論元結(jié)構(gòu)標(biāo)注,構(gòu)建語料庫。對(duì)所有組成動(dòng)詞-論元表達(dá)式結(jié)構(gòu)化形成動(dòng)詞-論元標(biāo)注語料庫。(2)事件框架的構(gòu)建事件框架是由一個(gè)個(gè)被形式化為框架的語義認(rèn)知結(jié)構(gòu)組成,用來描述一類事件的一組概念。具體來講,框架包含框架的名稱、定義、核心框架元素和非核心框架元素、框架所涉及的目標(biāo)詞元以及框架間的關(guān)系。定義事件信息描述框架為所描述事件的事件類型,框架關(guān)系即為事件關(guān)系。(3)事件鏈的構(gòu)建事件鏈的分為事件和事件鏈的銜接兩個(gè)部分,事件是事件鏈的基本構(gòu)成單位,主要以動(dòng)詞-論元結(jié)構(gòu)為基礎(chǔ)來完善描述事件的語義信息;而事件鏈主要將提取的事件按照一定的關(guān)系相互鏈接來表達(dá)。即以動(dòng)詞-論元結(jié)構(gòu)、詞匯鏈和事件框架為基礎(chǔ),按事件關(guān)系銜接事件構(gòu)成新聞文本的事件鏈。(4)構(gòu)建事件鏈的原型系統(tǒng)結(jié)合以上三個(gè)方面的研究成果,實(shí)現(xiàn)了事件鏈構(gòu)建的原型系統(tǒng)并以交互式平臺(tái)展示該系統(tǒng)。最后通過實(shí)驗(yàn)證明了本文提出的事件鏈構(gòu)建方法的有效性和平臺(tái)系統(tǒng)系能的優(yōu)越性。
[Abstract]:News is one of the key information that people pay close attention to. With the arrival of big data era, there are all kinds of news in the vast ocean of data. More effective news information is an urgent problem to be solved. Aiming at the problem of obtaining news text information points, this paper takes events as information points to represent news texts, proposes to use event chain construction technology to obtain the key information of text, and represents events on the basis of verb-argument meta-structure tagging corpus. The event type is defined by the event frame library based on verb arousal, and the event chain is constructed based on the lexical chain of news text, and the event chain is used to explain the evolution of news events. The event chain reflects the context of news texts and is closely related to vocabulary. This paper mainly focuses on the following four aspects: (1) the construction of verb-argument meta-structure corpus after preprocessing the news text, marking verbs, pruning the nodes in the dependency tree where the predicate role can not be assumed; Reducing the number of instances input to the dependency distance classifier for argument recognition, then using conditional random field to classify the semantic role of argument. Finally, the distance based postprocessing method is used to realize the annotation of semantic role. The text is annotated with verb-argument structure and the corpus is constructed. A verb-argument meta-annotation corpus is formed for all the compositional verb-argument expressions. (2) the event framework is constructed from a set of semantic cognitive structures that are formalized as frameworks to describe a set of concepts for a class of events. Specifically, the framework includes the name, definition, core frame elements and non-core framework elements, the target elements involved in the framework and the relationships between the frames. The event information description framework is defined as the event type of the described event, and the frame relation is the event relationship. (3) the construction of the event chain is divided into two parts: the event chain and the link of the event chain, and the event is the basic unit of the event chain. It is mainly based on the verb-argument structure to perfect the semantic information of describing events, while the event chain mainly links the extracted events to each other according to certain relationships. Based on the verb-argument structure, the lexical chain and the event framework, the event chain of news text is constructed according to the event relation. (4) the prototype system of the event chain is constructed in combination with the research results of the above three aspects. The prototype system of event chain is implemented and the system is displayed on an interactive platform. Finally, the effectiveness of the proposed method and the superiority of the platform system are proved by experiments.
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 曲云鵬;王文玲;;詞匯鏈文本表示模型計(jì)算方法綜述[J];知識(shí)管理論壇;2016年02期

2 邵X;楊春磊;錢立賓;方帥;;基于模式匹配的結(jié)構(gòu)化信息抽取[J];模式識(shí)別與人工智能;2014年08期

3 葉春蕾;冷伏海;;基于詞匯鏈的路線圖關(guān)鍵詞抽取方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2013年01期

4 肖升;何炎祥;;事件超圖模型及類型識(shí)別[J];中文信息學(xué)報(bào);2013年01期

5 胡博磊;賀瑞芳;孫宏;王文俊;;基于條件隨機(jī)域的中文事件類型識(shí)別[J];模式識(shí)別與人工智能;2012年03期

6 肖升;何炎祥;;基于動(dòng)詞論元結(jié)構(gòu)的中文事件抽取方法[J];計(jì)算機(jī)科學(xué);2012年05期

7 王鑫;穗志方;;基于依存樹距離識(shí)別論元的語義角色標(biāo)注系統(tǒng)[J];中文信息學(xué)報(bào);2012年02期

8 劉開瑛;;漢語框架語義網(wǎng)構(gòu)建及其應(yīng)用技術(shù)研究[J];中文信息學(xué)報(bào);2011年06期

9 許旭陽;李弼程;張先飛;韓永峰;;基于事件實(shí)例驅(qū)動(dòng)的新聞文本事件抽取[J];計(jì)算機(jī)科學(xué);2011年08期

10 丁效;宋凡;秦兵;劉挺;;音樂領(lǐng)域典型事件抽取方法研究[J];中文信息學(xué)報(bào);2011年02期

相關(guān)博士學(xué)位論文 前3條

1 張明堯;基于事件鏈的語篇連貫研究[D];武漢大學(xué);2013年

2 樊友新;從事件結(jié)構(gòu)到句子結(jié)構(gòu)[D];華東師范大學(xué);2010年

3 姜吉發(fā);自由文本的信息抽取模式獲取的研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年

相關(guān)碩士學(xué)位論文 前4條

1 周晶晶;基于依存樹的越南語新聞事件元素抽取技術(shù)研究[D];昆明理工大學(xué);2016年

2 王蓉;漢語文本事件鏈自動(dòng)生成系統(tǒng)[D];山西大學(xué);2015年

3 付小茗;基于謂詞—論元結(jié)構(gòu)的新聞文本事件鏈構(gòu)建技術(shù)研究[D];昆明理工大學(xué);2015年

4 宋凡;音樂領(lǐng)域典型事件抽取技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2009年

,

本文編號(hào):2230801

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2230801.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶69fee***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com