基于微博的事件實(shí)時(shí)監(jiān)測框架與系統(tǒng)
發(fā)布時(shí)間:2017-10-15 07:20
本文關(guān)鍵詞:基于微博的事件實(shí)時(shí)監(jiān)測框架與系統(tǒng)
更多相關(guān)文章: 微博事件 社會感知網(wǎng)絡(luò) 實(shí)時(shí)監(jiān)測 異常檢測 地理定位
【摘要】:與傳統(tǒng)的社交媒體相比,微博是一種新型的社交網(wǎng)絡(luò)和信息服務(wù)平臺。其單向關(guān)注和操作簡便的社交特性使得信息的傳播與擴(kuò)散更加快速和廣泛,尤其是針對突發(fā)事件和社會事件。微博的誕生拓展了信息傳播和共享的渠道,使其逐步成為信息發(fā)布和交流傳播的主要平臺之一。與此同時(shí)其不良影響也隨之而來,通過微博平臺傳播謠言、宣傳淫穢色情和煽動暴力動亂變得更加容易和猛烈。這些惡意信息經(jīng)微博平臺的發(fā)酵和傳播,將對國家秩序和社會穩(wěn)定造成嚴(yán)重威脅。 如何通過微博監(jiān)測突發(fā)事件的發(fā)展趨勢,對異常事件的爆發(fā)進(jìn)行預(yù)警成為了各國政府的迫切需求。在此背景下,本文結(jié)合微博平臺上事件的傳播規(guī)律和演化特點(diǎn),并根據(jù)社會感知網(wǎng)絡(luò)相關(guān)理論,提出了基于中文微博的事件實(shí)時(shí)監(jiān)測框架。該框架包含若干模塊,主要為數(shù)據(jù)采集模塊、事件處理模塊、熱點(diǎn)模塊及可視化展示模塊,同時(shí)也衍生出三個(gè)核心算法——事件相關(guān)度算法、異常檢測算法和地理位置定位算法。實(shí)驗(yàn)表明,這些算法具有較好的性能,其中事件相關(guān)度和異常檢測算法的準(zhǔn)確率分別達(dá)到了86%和73.33%,地理位置定位算法則具有更高的“性價(jià)比”和更低的實(shí)現(xiàn)復(fù)雜度,達(dá)到了預(yù)期目標(biāo)。 最后,根據(jù)此框架本文實(shí)現(xiàn)了基于新浪微博的事件實(shí)時(shí)監(jiān)測原型系統(tǒng)。該系統(tǒng)采用混合的網(wǎng)絡(luò)爬蟲和開放API接口方式實(shí)現(xiàn)數(shù)據(jù)采集模塊,同時(shí)采用多種展示方式從多維度展示事件的分析結(jié)果。 總的來說,本文主要解決的問題是探索虛擬社交網(wǎng)絡(luò)與物理世界時(shí)空關(guān)聯(lián)性,監(jiān)測并跟蹤微博平臺的特定“事件”,在其爆發(fā)前發(fā)現(xiàn)并定位其地理位置,從而提供突發(fā)事件預(yù)警和技術(shù)支撐。
【關(guān)鍵詞】:微博事件 社會感知網(wǎng)絡(luò) 實(shí)時(shí)監(jiān)測 異常檢測 地理定位
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-15
- 1.1 研究背景9-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-12
- 1.3 研究內(nèi)容和意義12-13
- 1.4 論文結(jié)構(gòu)13-15
- 第二章 相關(guān)背景知識簡介15-24
- 2.1 微博平臺簡介15-16
- 2.2 微博開放平臺16-22
- 2.2.1 OAuth2.0授權(quán)協(xié)議17-19
- 2.2.2 基于開放API接口的微博數(shù)據(jù)獲取技術(shù)19-22
- 2.3 文本相似度算法22
- 2.4 層次聚類算法22-23
- 2.5 本章小結(jié)23-24
- 第三章 基于微博的事件實(shí)時(shí)監(jiān)測框架研究24-29
- 3.1 社會感知網(wǎng)絡(luò)24-26
- 3.2 框架設(shè)計(jì)26-28
- 3.3 本章小結(jié)28-29
- 第四章 核心算法概要設(shè)計(jì)29-47
- 4.1 事件相關(guān)度算法29-30
- 4.2 事件異常檢測算法30-34
- 4.3 地理位置定位算法34-42
- 4.4 實(shí)驗(yàn)分析42-46
- 4.4.1 實(shí)驗(yàn)平臺42-43
- 4.4.2 驗(yàn)證相關(guān)度算法43
- 4.4.3 驗(yàn)證異常檢測算法43-45
- 4.4.4 驗(yàn)證地理位置定位算法45-46
- 4.5 本章小結(jié)46-47
- 第五章 基于微博的事件實(shí)時(shí)監(jiān)測系統(tǒng)47-62
- 5.1 系統(tǒng)架構(gòu)與流程47-48
- 5.2 微博數(shù)據(jù)采集48-52
- 5.3 微博數(shù)據(jù)預(yù)處理52-54
- 5.3.1 數(shù)據(jù)清洗52-54
- 5.3.2 微博去重54
- 5.4 事件檢索模塊54-55
- 5.5 事件實(shí)時(shí)監(jiān)測模塊55-56
- 5.6 熱點(diǎn)模塊56-59
- 5.6.1 熱點(diǎn)話題收集模塊56-58
- 5.6.2 話題推薦子模塊58-59
- 5.7 相關(guān)研究成果59-60
- 5.8 本章小結(jié)60-62
- 第六章 總結(jié)和展望62-64
- 6.1 總結(jié)62
- 6.2 展望62-64
- 參考文獻(xiàn)64-67
- 致謝67-68
- 作者攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄68
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 蔡淑琴;張靜;王e,
本文編號:1035814
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1035814.html
最近更新
教材專著