基于微博的新興熱點(diǎn)事件檢測(cè)研究
發(fā)布時(shí)間:2017-09-04 18:37
本文關(guān)鍵詞:基于微博的新興熱點(diǎn)事件檢測(cè)研究
更多相關(guān)文章: 微博 新興熱點(diǎn)事件 事件檢測(cè) 微博影響力
【摘要】:隨著社交網(wǎng)絡(luò)的不斷發(fā)展,用戶迫切需要一種簡(jiǎn)便快捷的信息發(fā)布和獲取方式,微博的出現(xiàn)也就成為了必然的趨勢(shì)。微博的實(shí)時(shí)性和便捷性的特點(diǎn)使得其迅速發(fā)展,每天都會(huì)產(chǎn)生大量有實(shí)用價(jià)值的文本信息,其中就有對(duì)當(dāng)前生活中熱點(diǎn)事件的描述和評(píng)論。微博平臺(tái)常常會(huì)將一些熱門的話題或事件在首頁(yè)上羅列出來(lái),推薦給用戶,但是這些話題往往只列出最近幾天的少量事件,沒(méi)有實(shí)時(shí)的給出每天更多的熱點(diǎn)事件。這些事件往往不能滿足用戶對(duì)新興事件的需求,用戶如果要找到自己感興趣的新興事件,就必須自己尋找相關(guān)的微博帖子閱讀,在這個(gè)信息爆炸的互聯(lián)網(wǎng)時(shí)代,這必然帶來(lái)很大的不便。當(dāng)前從微博中準(zhǔn)確高效地挖掘出正在發(fā)生的熱點(diǎn)事件是近年來(lái)研究的熱點(diǎn)。本文就微博中的新興熱點(diǎn)事件檢測(cè)做了研究,微博中的新興熱點(diǎn)檢測(cè)具有實(shí)用意義,某些新興事件,如自然災(zāi)害、傳染疾病和危害巨大的襲擊等事件如果能在早期就檢測(cè)出來(lái)可以有效的幫助政府或者個(gè)人及時(shí)預(yù)防和處理相關(guān)事件,從而盡量減少不必要的傷害和損失。論文綜合考慮微博用戶的粉絲數(shù)量和微博本身的轉(zhuǎn)發(fā)、評(píng)論次數(shù)計(jì)算每條微博的影響力,從而提出一種基于影響力的微博新興熱點(diǎn)事件檢測(cè)方法(Influence-Based Emerging Hotspot Event Detection,IEED)。該方法首先對(duì)微博數(shù)據(jù)進(jìn)行預(yù)處理,得到特征向量;隨后運(yùn)用層次聚類將微博文本聚類為事件,得到候選事件集合,聚類過(guò)程中運(yùn)用滑動(dòng)窗口控制數(shù)據(jù)流入;最后運(yùn)用微博影響力以及事件發(fā)布微博的數(shù)量計(jì)算事件的新興熱點(diǎn)評(píng)分,并提取出事件中的關(guān)鍵詞構(gòu)成事件摘要,將評(píng)分top-k的新興熱點(diǎn)事件推薦給用戶。通過(guò)運(yùn)用現(xiàn)實(shí)生活中的新浪微博數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集來(lái)測(cè)試論文提出的算法,實(shí)驗(yàn)結(jié)果表明,基于影響力的微博新興熱點(diǎn)事件檢測(cè)方法(IEED)能在早期高效地檢測(cè)出微博中的新興熱點(diǎn)事件,并準(zhǔn)確給出事件摘要,具備一定的實(shí)際應(yīng)用價(jià)值。
【關(guān)鍵詞】:微博 新興熱點(diǎn)事件 事件檢測(cè) 微博影響力
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092
【目錄】:
- 中文摘要3-4
- 英文摘要4-8
- 1 緒論8-13
- 1.1 研究背景及意義8-9
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀9-10
- 1.3 論文研究的主要內(nèi)容10-11
- 1.4 論文的組織結(jié)構(gòu)11-12
- 1.5 小結(jié)12-13
- 2 相關(guān)技術(shù)和概念綜述13-26
- 2.1 微博簡(jiǎn)介及其特征13-15
- 2.1.1 微博簡(jiǎn)介13-14
- 2.1.2 微博的特征14-15
- 2.2 中文分詞技術(shù)15-18
- 2.2.1 中文分詞簡(jiǎn)介16-17
- 2.2.2 中文分詞算法介紹17-18
- 2.3 文本相似性度量方法18-22
- 2.3.1 文本表示方法19
- 2.3.2 文本預(yù)處理及特征表示19-21
- 2.3.3 文本相似性計(jì)算21-22
- 2.4 微博事件檢測(cè)技術(shù)22-25
- 2.4.1 事件檢測(cè)22-23
- 2.4.2 微博事件檢測(cè)23-25
- 2.5 本章小結(jié)25-26
- 3 微博新興熱點(diǎn)事件檢測(cè)方法26-41
- 3.1 微博數(shù)據(jù)預(yù)處理27-29
- 3.2 微博文本事件聚類29-33
- 3.2.1 聚類算法29
- 3.2.2 微博事件聚類29-33
- 3.3 基于影響力的事件新興熱點(diǎn)評(píng)定33-38
- 3.3.1 基于影響力的事件熱點(diǎn)評(píng)分33-36
- 3.3.2 事件新興熱點(diǎn)評(píng)分36-38
- 3.4 新興熱點(diǎn)事件摘要生成38-40
- 3.4.1 摘要生成模型38
- 3.4.2 微博事件摘要的生成38-40
- 3.5 本章小結(jié)40-41
- 4 實(shí)驗(yàn)結(jié)果與分析41-54
- 4.1 實(shí)驗(yàn)數(shù)據(jù)41-42
- 4.2 數(shù)據(jù)預(yù)處理42-43
- 4.3 新興熱點(diǎn)事件檢測(cè)評(píng)估43-53
- 4.3.1 評(píng)估指標(biāo)43-44
- 4.3.2 相關(guān)參數(shù)確定44-46
- 4.3.3 新興熱點(diǎn)事件檢測(cè)結(jié)果分析46-49
- 4.3.4 與Key Graph算法對(duì)比實(shí)驗(yàn)49-51
- 4.3.5 IEED方法部分檢測(cè)結(jié)果展示51-53
- 4.4 本章小結(jié)53-54
- 5 總結(jié)與展望54-56
- 5.1 總結(jié)54-55
- 5.2 展望55-56
- 致謝56-57
- 參考文獻(xiàn)57-60
- 附錄60
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 ;3G[J];通信世界;2009年35期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 證券時(shí)報(bào)記者 鄧飛;強(qiáng)勢(shì)!新興熱點(diǎn)逆市走紅[N];證券時(shí)報(bào);2013年
2 本報(bào)實(shí)習(xí)生 韓笑;假日經(jīng)濟(jì)趨于理性 新興熱點(diǎn)有待考驗(yàn)[N];工人日?qǐng)?bào);2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 黃琰;基于微博平臺(tái)的新興熱點(diǎn)話題檢測(cè)研究[D];華南理工大學(xué);2015年
2 朱荔;基于微博的新興熱點(diǎn)事件檢測(cè)研究[D];重慶大學(xué);2015年
,本文編號(hào):793196
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/793196.html
最近更新
教材專著