面向微博突發(fā)事件發(fā)現(xiàn)的自適應(yīng)社區(qū)檢測(cè)算法研究及系統(tǒng)實(shí)現(xiàn)
本文關(guān)鍵詞:面向微博突發(fā)事件發(fā)現(xiàn)的自適應(yīng)社區(qū)檢測(cè)算法研究及系統(tǒng)實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:伴隨著社交媒體的快速發(fā)展,微博類應(yīng)用已經(jīng)成為傳統(tǒng)媒體以外的一個(gè)重要的信息來源。如何及時(shí)且準(zhǔn)確地從微博數(shù)據(jù)流中發(fā)現(xiàn)突發(fā)事件信息,已成為數(shù)據(jù)挖掘領(lǐng)域近些年來的研究熱點(diǎn)之一。為了從海量噪聲數(shù)據(jù)中過濾出稀疏的事件信號(hào),學(xué)術(shù)界提出了很多方案來描述和檢測(cè)突發(fā)特征,并對(duì)這些特征進(jìn)行聚類以得到完整的事件信息。然而,在實(shí)時(shí)更新的微博流場(chǎng)景中,需要以有限的時(shí)空開銷來生成事件信息,所以傳統(tǒng)的靜態(tài)聚類方案不能滿足需求。本文針對(duì)這一問題,提出用突發(fā)特征網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)來描述事件,且以歷史事件為基礎(chǔ)生成最新事件的信息,旨在減少實(shí)時(shí)檢測(cè)突發(fā)事件的時(shí)空開銷,并提高事件發(fā)現(xiàn)的準(zhǔn)確度。本文的主要內(nèi)容和貢獻(xiàn)如下:第一,提出了一個(gè)面向帶權(quán)網(wǎng)絡(luò)的自適應(yīng)社區(qū)檢測(cè)算法。該算法基于無權(quán)動(dòng)態(tài)網(wǎng)絡(luò)下的QCA社區(qū)檢測(cè)算法,采用了模塊度局部優(yōu)化的思路。在帶權(quán)網(wǎng)絡(luò)出現(xiàn)動(dòng)態(tài)變化的情況下,該算法能夠?qū)v史的社區(qū)結(jié)構(gòu)進(jìn)行自適應(yīng)調(diào)整;谧饔昧Φ母拍,可以分析得知網(wǎng)絡(luò)變化對(duì)于結(jié)點(diǎn)移動(dòng)趨勢(shì)的全局影響,從而避免了不必要的網(wǎng)絡(luò)調(diào)整開銷。在此基礎(chǔ)上,再以模塊度優(yōu)化為目標(biāo),對(duì)不穩(wěn)定的社區(qū)結(jié)構(gòu)進(jìn)行局部調(diào)整。第二,提出采用帶權(quán)網(wǎng)絡(luò)模型對(duì)突發(fā)單詞的重要性和共現(xiàn)性建模,并以詞圖網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)來描述事件信息。此外,本文基于帶權(quán)網(wǎng)絡(luò)提出了權(quán)重強(qiáng)度的概念,以描述網(wǎng)絡(luò)中局部子圖的重要性,并據(jù)此推導(dǎo)出帶權(quán)網(wǎng)絡(luò)下的模塊度度量公式。第三,提出了一個(gè)微博突發(fā)事件在線檢測(cè)系統(tǒng)的實(shí)現(xiàn)方案。該方案采用特征優(yōu)先的策略,結(jié)合預(yù)處理和突發(fā)性估計(jì)的結(jié)果來構(gòu)建帶權(quán)詞圖模型,應(yīng)用自適應(yīng)社區(qū)檢測(cè)算法來發(fā)現(xiàn)單詞網(wǎng)絡(luò)中的事件信息。通過實(shí)驗(yàn)可以證明,利用該系統(tǒng)方案能夠快速且準(zhǔn)確地發(fā)現(xiàn)突發(fā)事件。
【關(guān)鍵詞】:事件檢測(cè) 社區(qū)檢測(cè) 動(dòng)態(tài)網(wǎng)絡(luò) 數(shù)據(jù)挖掘 自然語言處理
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092;TP391.1
【目錄】:
- 摘要6-7
- Abstract7-10
- 第1章 緒論10-15
- 1.1 課題的研究背景和意義10-11
- 1.2 微博事件檢測(cè)研究現(xiàn)狀11-13
- 1.2.1 文檔優(yōu)先與特征優(yōu)先11-12
- 1.2.2 回顧式事件和新事件發(fā)現(xiàn)12-13
- 1.3 本文的主要內(nèi)容和結(jié)構(gòu)安排13-15
- 第2章 特征優(yōu)先的微博突發(fā)事件檢測(cè)15-27
- 2.1 算法框架15-16
- 2.2 特征檢測(cè)16-21
- 2.2.1 概率生成模型16-17
- 2.2.2 指數(shù)平滑預(yù)測(cè)17-19
- 2.2.3 頻域分析19-20
- 2.2.4 總結(jié)20-21
- 2.3 事件生成21-25
- 2.3.1 基于向量空間模型與文檔聚類的事件生成21-22
- 2.3.2 基于網(wǎng)絡(luò)模型與社區(qū)檢測(cè)的事件生成22-25
- 2.3.3 總結(jié)25
- 2.4 事件檢測(cè)的評(píng)價(jià)標(biāo)準(zhǔn)25-26
- 2.5 本章小結(jié)26-27
- 第3章 面向帶權(quán)動(dòng)態(tài)網(wǎng)絡(luò)的自適應(yīng)社區(qū)檢測(cè)算法27-53
- 3.1 帶權(quán)動(dòng)態(tài)網(wǎng)絡(luò)模型27-30
- 3.1.1 模型定義及符號(hào)標(biāo)記27-28
- 3.1.2 權(quán)重強(qiáng)度28-29
- 3.1.3 調(diào)整Modularity指標(biāo)29-30
- 3.2 QCA算法30-32
- 3.2.1 符號(hào)標(biāo)記及目標(biāo)函數(shù)30
- 3.2.2 算法流程30-31
- 3.2.3 擴(kuò)展至帶權(quán)動(dòng)態(tài)網(wǎng)絡(luò)31-32
- 3.3 自適應(yīng)社區(qū)檢測(cè)算法32-41
- 3.3.1 基于作用力概念的推論及證明33-36
- 3.3.2 算法流程36-41
- 3.4 社區(qū)檢測(cè)結(jié)果的評(píng)價(jià)方法41-42
- 3.5 實(shí)驗(yàn)結(jié)果42-52
- 3.5.1 實(shí)驗(yàn)集42-43
- 3.5.2 自適應(yīng)社區(qū)檢測(cè)算法性能分析43-50
- 3.5.3 自適應(yīng)社區(qū)檢測(cè)算法結(jié)果示例和分析50-52
- 3.6 本章小結(jié)52-53
- 第4章 微博突發(fā)事件在線檢測(cè)系統(tǒng)實(shí)現(xiàn)53-72
- 4.1 系統(tǒng)框架53-54
- 4.2 模塊實(shí)現(xiàn)54-64
- 4.2.1 預(yù)處理54-55
- 4.2.2 突發(fā)性估計(jì)55-59
- 4.2.3 詞圖構(gòu)建59-61
- 4.2.4 事件生成61-64
- 4.3 實(shí)驗(yàn)結(jié)果64-71
- 4.3.1 實(shí)驗(yàn)集64
- 4.3.2 事件發(fā)現(xiàn)性能分析64-67
- 4.3.3 事件發(fā)現(xiàn)結(jié)果展示67-71
- 4.4 本章小結(jié)71-72
- 結(jié)論72-73
- 致謝73-74
- 參考文獻(xiàn)74-78
- 攻讀碩士學(xué)位期間發(fā)表的論文及科研成果78
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 關(guān)治洪;張皓;朱茹;;一類時(shí)空切換動(dòng)態(tài)網(wǎng)絡(luò)的穩(wěn)定性[J];華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
2 鄭海青;井元偉;劉曉平;;一類具有多種耦合時(shí)滯的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的牽制同步[J];控制與決策;2010年11期
3 李濤;于曉楠;;延遲復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的穩(wěn)定性研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2011年08期
4 高琳;楊建業(yè);覃桂敏;;動(dòng)態(tài)網(wǎng)絡(luò)模式挖掘方法及其應(yīng)用[J];軟件學(xué)報(bào);2013年09期
5 陳關(guān)榮;;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下控制理論遇到的問題與挑戰(zhàn)[J];自動(dòng)化學(xué)報(bào);2013年04期
6 段文勇;蔡晨曉;鄒云;尤靜;;時(shí)滯耦合和非時(shí)滯耦合的奇異復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)之同步性準(zhǔn)則(英文)[J];控制理論與應(yīng)用;2013年08期
7 于蘋,張堯弼,虞春宜;使用動(dòng)態(tài)網(wǎng)絡(luò)提高分布應(yīng)用的性能[J];計(jì)算機(jī)工程與應(yīng)用;2002年03期
8 王得蓉;;試論能源管理計(jì)算機(jī)動(dòng)態(tài)網(wǎng)絡(luò)體系的建設(shè)[J];資源節(jié)約與環(huán)保;2010年03期
9 鄭宏珍,胡屏;動(dòng)態(tài)網(wǎng)絡(luò)需要?jiǎng)討B(tài)的安全策略[J];中國信息導(dǎo)報(bào);2002年01期
10 王學(xué)光;;基于動(dòng)態(tài)網(wǎng)絡(luò)影響擴(kuò)散問題研究[J];計(jì)算機(jī)科學(xué);2012年06期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 朱陳平;孔輝;李莉;古志鳴;熊詩杰;;耦合演化動(dòng)態(tài)網(wǎng)絡(luò)的穩(wěn)定效率與反選舉人模型[A];2009年第五屆全國網(wǎng)絡(luò)科學(xué)論壇論文集[C];2009年
2 徐式蘊(yùn);楊瑩;;一類復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的全局魯棒H_-/H_∞同步[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
3 盧劍權(quán);Daniel W.C.Ho;曹進(jìn)德;;脈沖動(dòng)態(tài)網(wǎng)絡(luò)的一個(gè)統(tǒng)一同步標(biāo)準(zhǔn)[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
4 劉斌;雷鳴;余沛;馮春;;具有多藕合時(shí)滯的不確定脈沖動(dòng)態(tài)網(wǎng)絡(luò)的魯棒指數(shù)同步[A];2006全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年
5 汪小帆;蘇厚勝;;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)控制研究進(jìn)展[A];第四屆全國網(wǎng)絡(luò)科學(xué)學(xué)術(shù)論壇暨研究生暑期學(xué)校論文集[C];2008年
6 張海濤;陳志強(qiáng);周濤;;二階動(dòng)態(tài)網(wǎng)絡(luò)的模型預(yù)測(cè)一致性控制策略研究[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
7 廖丙連;蔣國平;;具有不同拓?fù)浣Y(jié)構(gòu)的時(shí)滯耦合復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)同步控制[A];中國自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)A卷[C];2011年
8 陳姚;呂金虎;;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的有限時(shí)間同步[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
9 李常品;陳關(guān)榮;周天壽;;帶非線性內(nèi)部耦合函數(shù)的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的同步注記[A];第二屆全國復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)學(xué)術(shù)論壇論文集[C];2005年
10 雷曉;蔣國平;張躍;;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)不穩(wěn)定平衡點(diǎn)的輸出反饋牽制控制[A];第24屆中國控制與決策會(huì)議論文集[C];2012年
中國重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 周海龍;秦電:動(dòng)態(tài)網(wǎng)絡(luò)圖實(shí)時(shí)演示檢修進(jìn)度[N];華北電力報(bào);2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 郭曉永;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的自適應(yīng)同步控制研究[D];西安電子科技大學(xué);2013年
2 陳卓;動(dòng)態(tài)網(wǎng)絡(luò)上的演化博弈研究[D];上海交通大學(xué);2012年
3 張麗麗;具有相似節(jié)點(diǎn)的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)鎮(zhèn)定與同步控制研究[D];廣東工業(yè)大學(xué);2014年
4 仲偉松;幾類復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的若干動(dòng)力學(xué)問題的研究[D];東北大學(xué);2012年
5 朱會(huì)賓;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的同步控制及應(yīng)用[D];江南大學(xué);2011年
6 朱牧;復(fù)雜網(wǎng)絡(luò)中社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中國礦業(yè)大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張陽揚(yáng);面向微博突發(fā)事件發(fā)現(xiàn)的自適應(yīng)社區(qū)檢測(cè)算法研究及系統(tǒng)實(shí)現(xiàn)[D];西南交通大學(xué);2015年
2 顧瑜;隨機(jī)噪聲環(huán)境下的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)外部同步[D];南京郵電大學(xué);2013年
3 曹素雯;基于牽制控制的時(shí)延復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)外部同步研究[D];南京郵電大學(xué);2013年
4 韋慶陽;隨機(jī)耦合的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)控制[D];南京郵電大學(xué);2013年
5 楊建業(yè);動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化的多角度度量[D];西安電子科技大學(xué);2013年
6 王慧麗;動(dòng)態(tài)網(wǎng)絡(luò)中多維意見的傳播模型研究[D];大連理工大學(xué);2011年
7 賈琳;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的同步和能源結(jié)構(gòu)調(diào)控分析的研究[D];江蘇大學(xué);2009年
8 李芳;復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)與混沌系統(tǒng)的同步[D];江南大學(xué);2006年
9 寧方清;一類非恒等節(jié)點(diǎn)的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)同步化分析[D];東北大學(xué);2010年
10 廖丙連;具有不同拓?fù)浣Y(jié)構(gòu)的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)同步控制研究[D];南京郵電大學(xué);2011年
本文關(guān)鍵詞:面向微博突發(fā)事件發(fā)現(xiàn)的自適應(yīng)社區(qū)檢測(cè)算法研究及系統(tǒng)實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):298093
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/298093.html