面向突發(fā)事件案例庫的事件抽取模型構(gòu)建研究
發(fā)布時(shí)間:2017-10-05 11:29
本文關(guān)鍵詞:面向突發(fā)事件案例庫的事件抽取模型構(gòu)建研究
更多相關(guān)文章: 突發(fā)事件 事件抽取 事件框架 案例表示 信息抽取
【摘要】:近年來世界各地突發(fā)事件頻繁發(fā)生,給人類社會(huì)的安全和發(fā)展造成了巨大的威脅,引起了國(guó)內(nèi)外學(xué)者和政府部門的高度關(guān)注。與一般事件相比,由于突發(fā)事件具有突然發(fā)生的特點(diǎn),往往存在信息上的匱乏,從而導(dǎo)致決策依據(jù)不足、決策風(fēng)險(xiǎn)性加大、事件處理難度增加等問題。對(duì)突發(fā)事件信息進(jìn)行結(jié)構(gòu)化抽取,建立突發(fā)事件典型案例庫是提升突發(fā)事件應(yīng)對(duì)能力的有效手段。因而,構(gòu)建面向突發(fā)事件案例庫的事件抽取模型實(shí)現(xiàn)案例信息的自動(dòng)化抽取對(duì)于突發(fā)事件的應(yīng)急決策具有十分重要的意義。為了使抽取模型能夠更好地適用于構(gòu)建突發(fā)事件案例庫,本文首先對(duì)突發(fā)事件案例信息抽取過程中涉及到的突發(fā)事件案例信息、突發(fā)事件和突發(fā)事件抽取框架等問題進(jìn)行界定:提出一個(gè)描述突發(fā)事件案例的四元特征向量模型,從案例類型、案例描述、解決方案、決策環(huán)境等方面對(duì)突發(fā)事件進(jìn)行描述;根據(jù)突發(fā)事件類型的不同在每個(gè)特征維度下對(duì)事件要素分別進(jìn)行確定;同時(shí),基于這一特征向量模型構(gòu)建帶有繼承機(jī)制的突發(fā)事件案例信息的抽取框架;然后針對(duì)抽取框架的不同側(cè)面的特點(diǎn),將側(cè)面分為事件時(shí)間、事件地點(diǎn)、事件其他側(cè)面三類,并分別對(duì)每一類信息的抽取方法和模式進(jìn)行詳細(xì)說明,具體為:1)時(shí)間類。根據(jù)突發(fā)事件相關(guān)文本中時(shí)間表達(dá)式的形態(tài)特點(diǎn),提出基本時(shí)間要素概念,用來代指時(shí)間表達(dá)式中的基本組成成分。并對(duì)基本時(shí)間要素的匹配模式和組合規(guī)則進(jìn)行總結(jié)和說明;針對(duì)時(shí)間表達(dá)式的標(biāo)準(zhǔn)化問題提出非數(shù)值時(shí)間數(shù)值化策略和時(shí)間塊、模糊時(shí)間的數(shù)值化轉(zhuǎn)換規(guī)則;利用時(shí)間文檔位置、時(shí)間重要性等特征對(duì)事件的發(fā)生時(shí)間進(jìn)行推斷。2)地點(diǎn)類。針對(duì)突發(fā)事件相關(guān)文本分詞后地理信息領(lǐng)域名詞誤識(shí)別、外國(guó)地名識(shí)別率低的特點(diǎn),建立附加的領(lǐng)域詞典、地名詞典;針對(duì)地名語塊識(shí)別能力不足等問題,提出基本地理要素概念,并對(duì)基本地理要素的抽取模式和組合規(guī)則進(jìn)行總結(jié)和定義;針對(duì)地名的規(guī)范化問題建立地名數(shù)據(jù)庫、地名-簡(jiǎn)稱對(duì)照表,提出地名指代詞消解策略;利用地點(diǎn)信息文檔位置、地點(diǎn)信息重要性、地點(diǎn)信息關(guān)系等特征對(duì)事件的發(fā)生地點(diǎn)進(jìn)行推斷。3)其他側(cè)面類。根據(jù)事件其他側(cè)面與元事件的關(guān)系,將事件其他側(cè)面的抽取轉(zhuǎn)化為元事件的抽取,并對(duì)要抽取元事件類型進(jìn)行定義。采用基于擴(kuò)展觸發(fā)詞和知網(wǎng)語義相似度計(jì)算的候選事件抽取方法,根據(jù)不同側(cè)面的特點(diǎn)分別采用基于模式和基于語義角色標(biāo)注的方法對(duì)不同側(cè)面進(jìn)行抽取。4)事件歸并。以地理信息和時(shí)間信息為特征,提出一種多文檔環(huán)境下事件的歸并判別方法和歸并規(guī)則。經(jīng)過在公共衛(wèi)生類突發(fā)事件語料上進(jìn)行實(shí)驗(yàn),結(jié)果表明本文提出的抽取模型是可行的,對(duì)于突發(fā)事件要素抽取達(dá)到較高的準(zhǔn)確率和召回率。
【關(guān)鍵詞】:突發(fā)事件 事件抽取 事件框架 案例表示 信息抽取
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:D035.2;G254
【目錄】:
- 中文摘要5-7
- Abstract7-11
- 1 緒論11-15
- 1.1 研究的背景和意義11
- 1.2 研究?jī)?nèi)容和方法11-13
- 1.2.1 研究?jī)?nèi)容11-12
- 1.2.2 研究方法12-13
- 1.3 本文組織結(jié)構(gòu)13-15
- 2 突發(fā)事件抽取相關(guān)工作介紹15-26
- 2.1 事件抽取方法介紹15-22
- 2.1.1 元事件抽取方法介紹15-19
- 2.1.2 主題事件抽取方法介紹19-22
- 2.2 事件抽取測(cè)評(píng)會(huì)議介紹22-25
- 2.2.1 MUC測(cè)評(píng)會(huì)議22-23
- 2.2.2 ACE測(cè)評(píng)會(huì)議23-25
- 2.3 突發(fā)事件抽取進(jìn)展介紹25-26
- 3 基于框架的突發(fā)事件抽取模型構(gòu)建26-53
- 3.1 突發(fā)事件信息抽取中的概念定義和介紹26-32
- 3.1.1 突發(fā)事件案例信息的定義26-28
- 3.1.2 事件定義和抽取框架定義28-32
- 3.2 事件時(shí)間的抽取32-40
- 3.2.1 時(shí)間元素識(shí)別32-34
- 3.2.2 時(shí)間元素標(biāo)準(zhǔn)化34-37
- 3.2.3 報(bào)道時(shí)間的抽取37-38
- 3.2.4 事件發(fā)生時(shí)間推斷38-40
- 3.3 事件地點(diǎn)的抽取40-45
- 3.3.1 地點(diǎn)元素識(shí)別40-42
- 3.3.2 地名規(guī)范化42-43
- 3.3.3 事件發(fā)生地點(diǎn)推斷43-45
- 3.4 其他信息要素的抽取45-51
- 3.4.1 元事件的識(shí)別過程說明46-48
- 3.4.2 事件元素的抽取48-51
- 3.5 事件的歸并51-53
- 3.5.1 事件歸并判斷51
- 3.5.2 事件歸并規(guī)則51-53
- 4 實(shí)驗(yàn)53-59
- 4.1 準(zhǔn)備工作說明53-55
- 4.2 評(píng)價(jià)指標(biāo)說明55
- 4.3 實(shí)驗(yàn)結(jié)果和分析55-57
- 4.4 對(duì)比實(shí)驗(yàn)57-59
- 5 總結(jié)和展望59-61
- 5.1 工作總結(jié)59
- 5.2 不足和展望59-61
- 參考文獻(xiàn)61-67
- 致謝67-68
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前4條
1 牛之賢;白鵬洲;段富;;基于框架語義標(biāo)注的自由文本信息抽取研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年25期
2 吳平博,陳群秀,馬亮;基于事件框架的事件相關(guān)文檔的智能檢索研究[J];中文信息學(xué)報(bào);2003年06期
3 丁效;宋凡;秦兵;劉挺;;音樂領(lǐng)域典型事件抽取方法研究[J];中文信息學(xué)報(bào);2011年02期
4 高強(qiáng);游宏梁;;事件抽取技術(shù)研究綜述[J];情報(bào)理論與實(shí)踐;2013年04期
,本文編號(hào):976547
本文鏈接:http://sikaile.net/tushudanganlunwen/976547.html
最近更新
教材專著