天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 新聞傳播論文 >

突發(fā)事件信息提取研究

發(fā)布時間:2021-10-30 03:54
  隨著Internet的飛速發(fā)展,我們被包圍在信息的汪洋大海之中。準確、有效地從信息海洋中提取有用的信息,正是信息提取任務要解決的問題。信息提取(Information Extraction,簡稱IE)是指從大量的文本中提取出特定的感興趣的信息,并以結(jié)構化的形式表現(xiàn)出來。其基本目標是提高信息處理的速度和質(zhì)量,把人們從大量、低效的文本閱讀勞動中解放出來。信息提取與信息檢索、文本摘要等同屬于文本信息處理的范疇,是自然語言處理的一個研究領域。20世紀80年代末以來,信息提取一直是該領域的熱點研究問題。美國、歐洲都制定了相應的文本處理計劃,信息提取技術及評測是其中一項重要的研究內(nèi)容。有關漢語的信息提取研究起步較晚,尚處在探索階段。近年來,各種突發(fā)事件頻繁地發(fā)生,突發(fā)事件的應對已經(jīng)成為考驗政府執(zhí)政能力的一個重要方面。應對突發(fā)事件是一個系統(tǒng)工程,其中一個重要環(huán)節(jié)就是信息的收集、整理、加工和發(fā)布。及時、客觀、準確地收集信息,快速、高效地提取有用信息,為分析形勢、制定策略提供翔實可靠的參考數(shù)據(jù),已經(jīng)成為提高突發(fā)事件應對能力的一個重要方面,也是衡量突發(fā)事件應對能力的一個重要指標。本文在對突發(fā)事件新聞報道特... 

【文章來源】:北京語言大學北京市 教育部直屬院校

【文章頁數(shù)】:176 頁

【學位級別】:博士

【部分圖文】:

突發(fā)事件信息提取研究


ACEZOO4實體標注示例

文稿,印度洋,文本,突發(fā)事件


造成v186m人n死亡1000多m人n受傷v.wp圖3一1馬德里311娜炸案報道文稿在歷時關系下,隨著時間的變化,事件本身的信息也在變化,比如,圖3一2中,印度洋海嘯中的捐款救助信息,隨著時間的推移(10日、12日、14日),捐款金額在增加。類似的表現(xiàn)事件某個方面的信息散落在不同的文本中,構成了事件某一個方面的信息變化的鏈條。圖3一2印度洋海喃捐款報道文稿3.1.,.2文本內(nèi)特征除了上述外部特征,在突發(fā)事件的報道文稿內(nèi)部還具有如下特征:()l未登錄詞語的凸顯性突發(fā)事件是一個社會熱點話題

指代詞,短語,共指,指代


西班牙首都馬德里的3個火車站發(fā)生了爆炸,……,還沒有任何組織或個人宣布對該事件負責.圖3一3指代示例其中,“該”是代詞,與“事件”一起構成指示語,“西班牙首都馬德里的3個火車站發(fā)生了爆炸”是先行語。共指是指兩個名詞(包括代詞、名詞短語)指向真實世界中的同一概念。共指關系可以獨立于上下文存在。如“巴斯克民族分裂組織”和“埃塔”就是共指.指代的使用是文本中信息表達的基本手段。在意義上,指示語與先行詞語之間所表達的概念相同。在文本的內(nèi)容處理中,指代消解既是一個關鍵問題,又是一個基本的任務。在MUC定義的信息提取任務中,CO任務的目標就是解決文本中的指代現(xiàn)象。在ACE定義的任務中,每一個識別任務(實體、實體關系、事件)都對應了關于mne幻no的發(fā)現(xiàn)和識別,而mnetino就是關于同一個實體(實體關系、事件)在文本中的所有表達形式(ACEugidelni,eVesroin.42.4)

【參考文獻】:
期刊論文
[1]一種跨語句漢語事件信息抽取方法[J]. 姜吉發(fā).  計算機工程. 2005(02)
[2]基于小規(guī)模語料庫和機器可讀詞典的二元分布語義獲取[J]. 郝秀蘭,楊爾弘.  中文信息學報. 2004(06)
[3]漢語篇章的指代消解淺論[J]. 王厚峰.  語言文字應用. 2004(04)
[4]基于網(wǎng)絡的中文問答系統(tǒng)及信息抽取算法研究[J]. 崔桓,蔡東風,苗雪雷.  中文信息學報. 2004(03)
[5]信息抽取模式自動生成方法的研究[J]. 鄭家恒,王興義,李飛.  中文信息學報. 2004(01)
[6]中文文本分類中特征抽取方法的比較研究[J]. 代六玲,黃河燕,陳肇雄.  中文信息學報. 2004(01)
[7]信息抽取研究綜述[J]. 李保利,陳玉忠,俞士汶.  計算機工程與應用. 2003(10)
[8]信息提取技術概述(下)[J]. 孫斌.  術語標準化與信息技術. 2003(01)
[9]信息提取技術概述(中)[J]. 孫斌.  術語標準化與信息技術. 2002(04)
[10]基于Ontology的信息抽取[J]. 廖樂健,曹元大,李新穎.  計算機工程與應用. 2002(23)

博士論文
[1]基于動態(tài)流通語料庫(DCC)的信息技術領域新術語自動提取研究[D]. 王強軍.北京語言文化大學 2003

碩士論文
[1]金融領域中漢語時間信息抽取的研究[D]. 王昀.清華大學 2004
[2]基于事件框架的主題相關文檔智能檢索的初步研究[D]. 吳平博.清華大學 2004



本文編號:3465999

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3465999.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶ab6c0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com