面向微博突發(fā)事件發(fā)現的自適應社區(qū)檢測算法研究及系統實現
本文關鍵詞:面向微博突發(fā)事件發(fā)現的自適應社區(qū)檢測算法研究及系統實現,,由筆耕文化傳播整理發(fā)布。
【摘要】:伴隨著社交媒體的快速發(fā)展,微博類應用已經成為傳統媒體以外的一個重要的信息來源。如何及時且準確地從微博數據流中發(fā)現突發(fā)事件信息,已成為數據挖掘領域近些年來的研究熱點之一。為了從海量噪聲數據中過濾出稀疏的事件信號,學術界提出了很多方案來描述和檢測突發(fā)特征,并對這些特征進行聚類以得到完整的事件信息。然而,在實時更新的微博流場景中,需要以有限的時空開銷來生成事件信息,所以傳統的靜態(tài)聚類方案不能滿足需求。本文針對這一問題,提出用突發(fā)特征網絡中的社區(qū)結構來描述事件,且以歷史事件為基礎生成最新事件的信息,旨在減少實時檢測突發(fā)事件的時空開銷,并提高事件發(fā)現的準確度。本文的主要內容和貢獻如下:第一,提出了一個面向帶權網絡的自適應社區(qū)檢測算法。該算法基于無權動態(tài)網絡下的QCA社區(qū)檢測算法,采用了模塊度局部優(yōu)化的思路。在帶權網絡出現動態(tài)變化的情況下,該算法能夠對歷史的社區(qū)結構進行自適應調整;谧饔昧Φ母拍,可以分析得知網絡變化對于結點移動趨勢的全局影響,從而避免了不必要的網絡調整開銷。在此基礎上,再以模塊度優(yōu)化為目標,對不穩(wěn)定的社區(qū)結構進行局部調整。第二,提出采用帶權網絡模型對突發(fā)單詞的重要性和共現性建模,并以詞圖網絡中的社區(qū)結構來描述事件信息。此外,本文基于帶權網絡提出了權重強度的概念,以描述網絡中局部子圖的重要性,并據此推導出帶權網絡下的模塊度度量公式。第三,提出了一個微博突發(fā)事件在線檢測系統的實現方案。該方案采用特征優(yōu)先的策略,結合預處理和突發(fā)性估計的結果來構建帶權詞圖模型,應用自適應社區(qū)檢測算法來發(fā)現單詞網絡中的事件信息。通過實驗可以證明,利用該系統方案能夠快速且準確地發(fā)現突發(fā)事件。
【關鍵詞】:事件檢測 社區(qū)檢測 動態(tài)網絡 數據挖掘 自然語言處理
【學位授予單位】:西南交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.092;TP391.1
【目錄】:
- 摘要6-7
- Abstract7-10
- 第1章 緒論10-15
- 1.1 課題的研究背景和意義10-11
- 1.2 微博事件檢測研究現狀11-13
- 1.2.1 文檔優(yōu)先與特征優(yōu)先11-12
- 1.2.2 回顧式事件和新事件發(fā)現12-13
- 1.3 本文的主要內容和結構安排13-15
- 第2章 特征優(yōu)先的微博突發(fā)事件檢測15-27
- 2.1 算法框架15-16
- 2.2 特征檢測16-21
- 2.2.1 概率生成模型16-17
- 2.2.2 指數平滑預測17-19
- 2.2.3 頻域分析19-20
- 2.2.4 總結20-21
- 2.3 事件生成21-25
- 2.3.1 基于向量空間模型與文檔聚類的事件生成21-22
- 2.3.2 基于網絡模型與社區(qū)檢測的事件生成22-25
- 2.3.3 總結25
- 2.4 事件檢測的評價標準25-26
- 2.5 本章小結26-27
- 第3章 面向帶權動態(tài)網絡的自適應社區(qū)檢測算法27-53
- 3.1 帶權動態(tài)網絡模型27-30
- 3.1.1 模型定義及符號標記27-28
- 3.1.2 權重強度28-29
- 3.1.3 調整Modularity指標29-30
- 3.2 QCA算法30-32
- 3.2.1 符號標記及目標函數30
- 3.2.2 算法流程30-31
- 3.2.3 擴展至帶權動態(tài)網絡31-32
- 3.3 自適應社區(qū)檢測算法32-41
- 3.3.1 基于作用力概念的推論及證明33-36
- 3.3.2 算法流程36-41
- 3.4 社區(qū)檢測結果的評價方法41-42
- 3.5 實驗結果42-52
- 3.5.1 實驗集42-43
- 3.5.2 自適應社區(qū)檢測算法性能分析43-50
- 3.5.3 自適應社區(qū)檢測算法結果示例和分析50-52
- 3.6 本章小結52-53
- 第4章 微博突發(fā)事件在線檢測系統實現53-72
- 4.1 系統框架53-54
- 4.2 模塊實現54-64
- 4.2.1 預處理54-55
- 4.2.2 突發(fā)性估計55-59
- 4.2.3 詞圖構建59-61
- 4.2.4 事件生成61-64
- 4.3 實驗結果64-71
- 4.3.1 實驗集64
- 4.3.2 事件發(fā)現性能分析64-67
- 4.3.3 事件發(fā)現結果展示67-71
- 4.4 本章小結71-72
- 結論72-73
- 致謝73-74
- 參考文獻74-78
- 攻讀碩士學位期間發(fā)表的論文及科研成果78
【相似文獻】
中國期刊全文數據庫 前10條
1 關治洪;張皓;朱茹;;一類時空切換動態(tài)網絡的穩(wěn)定性[J];華中師范大學學報(自然科學版);2006年01期
2 鄭海青;井元偉;劉曉平;;一類具有多種耦合時滯的復雜動態(tài)網絡的牽制同步[J];控制與決策;2010年11期
3 李濤;于曉楠;;延遲復雜動態(tài)網絡的穩(wěn)定性研究[J];網絡安全技術與應用;2011年08期
4 高琳;楊建業(yè);覃桂敏;;動態(tài)網絡模式挖掘方法及其應用[J];軟件學報;2013年09期
5 陳關榮;;復雜動態(tài)網絡環(huán)境下控制理論遇到的問題與挑戰(zhàn)[J];自動化學報;2013年04期
6 段文勇;蔡晨曉;鄒云;尤靜;;時滯耦合和非時滯耦合的奇異復雜動態(tài)網絡之同步性準則(英文)[J];控制理論與應用;2013年08期
7 于蘋,張堯弼,虞春宜;使用動態(tài)網絡提高分布應用的性能[J];計算機工程與應用;2002年03期
8 王得蓉;;試論能源管理計算機動態(tài)網絡體系的建設[J];資源節(jié)約與環(huán)保;2010年03期
9 鄭宏珍,胡屏;動態(tài)網絡需要動態(tài)的安全策略[J];中國信息導報;2002年01期
10 王學光;;基于動態(tài)網絡影響擴散問題研究[J];計算機科學;2012年06期
中國重要會議論文全文數據庫 前10條
1 朱陳平;孔輝;李莉;古志鳴;熊詩杰;;耦合演化動態(tài)網絡的穩(wěn)定效率與反選舉人模型[A];2009年第五屆全國網絡科學論壇論文集[C];2009年
2 徐式蘊;楊瑩;;一類復雜動態(tài)網絡的全局魯棒H_-/H_∞同步[A];第五屆全國復雜網絡學術會議論文(摘要)匯集[C];2009年
3 盧劍權;Daniel W.C.Ho;曹進德;;脈沖動態(tài)網絡的一個統一同步標準[A];第五屆全國復雜網絡學術會議論文(摘要)匯集[C];2009年
4 劉斌;雷鳴;余沛;馮春;;具有多藕合時滯的不確定脈沖動態(tài)網絡的魯棒指數同步[A];2006全國復雜網絡學術會議論文集[C];2006年
5 汪小帆;蘇厚勝;;復雜動態(tài)網絡控制研究進展[A];第四屆全國網絡科學學術論壇暨研究生暑期學校論文集[C];2008年
6 張海濤;陳志強;周濤;;二階動態(tài)網絡的模型預測一致性控制策略研究[A];第五屆全國復雜網絡學術會議論文(摘要)匯集[C];2009年
7 廖丙連;蔣國平;;具有不同拓撲結構的時滯耦合復雜動態(tài)網絡同步控制[A];中國自動化學會控制理論專業(yè)委員會A卷[C];2011年
8 陳姚;呂金虎;;復雜動態(tài)網絡的有限時間同步[A];第五屆全國復雜網絡學術會議論文(摘要)匯集[C];2009年
9 李常品;陳關榮;周天壽;;帶非線性內部耦合函數的復雜動態(tài)網絡的同步注記[A];第二屆全國復雜動態(tài)網絡學術論壇論文集[C];2005年
10 雷曉;蔣國平;張躍;;復雜動態(tài)網絡不穩(wěn)定平衡點的輸出反饋牽制控制[A];第24屆中國控制與決策會議論文集[C];2012年
中國重要報紙全文數據庫 前1條
1 周海龍;秦電:動態(tài)網絡圖實時演示檢修進度[N];華北電力報;2005年
中國博士學位論文全文數據庫 前6條
1 郭曉永;復雜動態(tài)網絡的自適應同步控制研究[D];西安電子科技大學;2013年
2 陳卓;動態(tài)網絡上的演化博弈研究[D];上海交通大學;2012年
3 張麗麗;具有相似節(jié)點的復雜動態(tài)網絡鎮(zhèn)定與同步控制研究[D];廣東工業(yè)大學;2014年
4 仲偉松;幾類復雜動態(tài)網絡的若干動力學問題的研究[D];東北大學;2012年
5 朱會賓;復雜動態(tài)網絡的同步控制及應用[D];江南大學;2011年
6 朱牧;復雜網絡中社區(qū)發(fā)現關鍵技術研究[D];中國礦業(yè)大學;2014年
中國碩士學位論文全文數據庫 前10條
1 張陽揚;面向微博突發(fā)事件發(fā)現的自適應社區(qū)檢測算法研究及系統實現[D];西南交通大學;2015年
2 顧瑜;隨機噪聲環(huán)境下的復雜動態(tài)網絡外部同步[D];南京郵電大學;2013年
3 曹素雯;基于牽制控制的時延復雜動態(tài)網絡外部同步研究[D];南京郵電大學;2013年
4 韋慶陽;隨機耦合的復雜動態(tài)網絡控制[D];南京郵電大學;2013年
5 楊建業(yè);動態(tài)網絡拓撲結構變化的多角度度量[D];西安電子科技大學;2013年
6 王慧麗;動態(tài)網絡中多維意見的傳播模型研究[D];大連理工大學;2011年
7 賈琳;復雜動態(tài)網絡的同步和能源結構調控分析的研究[D];江蘇大學;2009年
8 李芳;復雜動態(tài)網絡與混沌系統的同步[D];江南大學;2006年
9 寧方清;一類非恒等節(jié)點的復雜動態(tài)網絡同步化分析[D];東北大學;2010年
10 廖丙連;具有不同拓撲結構的復雜動態(tài)網絡同步控制研究[D];南京郵電大學;2011年
本文關鍵詞:面向微博突發(fā)事件發(fā)現的自適應社區(qū)檢測算法研究及系統實現,由筆耕文化傳播整理發(fā)布。
本文編號:298093
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/298093.html