基于微博的事件演化分析及摘要抽取方法研究
發(fā)布時間:2021-03-23 11:29
如今微博平臺已經(jīng)成為了實時信息的傳播的重要媒介,每當一個熱門事件發(fā)生時,微博平臺如Twitter會在第一時間涌現(xiàn)出大量與該事件相關的推文,并且融入到微博的海量信息當中。由于微博數(shù)據(jù)具有低密度性和高冗余性的特點,使得用戶很難通過搜索瀏覽的方式快速準確的了解該熱點事件的發(fā)生及演化過程。因此在海量的微博數(shù)據(jù)中,如何快速掌握一個熱點事件的演化過程并以簡明扼要的摘要形式呈現(xiàn)給用戶,成為了社交網(wǎng)絡分析領域的一個研究熱點。然而微博數(shù)據(jù)的簡短、不規(guī)范和規(guī)模龐大等特殊性,使得傳統(tǒng)的適用于長文本(如新聞報道)話題檢測與追蹤技術不再適用。本文以Twitter平臺為基礎,提出了一種基于微博事件的演化分析及摘要抽取方法,該方法按時間線形式呈現(xiàn)事件演化形成的各個演化階段的摘要。本文主要研究工作如下:第一,提出基于關鍵詞共現(xiàn)圖的演化階段檢測算法。由于隨著微博事件的動態(tài)發(fā)展,會演化出不同的階段。所以該算法以Twitter事件的推文數(shù)據(jù)流為輸入,基于關鍵詞及其共現(xiàn)關系構(gòu)建關鍵詞共現(xiàn)圖;然后基于重疊社團劃分算法得到關鍵詞社團,其中一個社團對應一個演化階段,然后推文數(shù)據(jù)集基于社團中的關鍵詞進行文檔聚類得到演化階段推文簇,即...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
蛋白質(zhì)網(wǎng)絡實例圖
達維臺風事件社團劃分部分結(jié)果圖
本文編號:3095711
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
蛋白質(zhì)網(wǎng)絡實例圖
達維臺風事件社團劃分部分結(jié)果圖
本文編號:3095711
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3095711.html
最近更新
教材專著