天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博中話題的傳播模型及熱點預測

發(fā)布時間:2017-10-09 11:24

  本文關(guān)鍵詞:微博中話題的傳播模型及熱點預測


  更多相關(guān)文章: 微博過濾 微博話題 分類模型 熱點預測


【摘要】:微博作為新興的網(wǎng)絡(luò)社交平臺,因其信息流通速度快、信息內(nèi)容豐富、人群覆蓋面廣吸引了大量用戶的加入,這使得微博在輿論傳播中的作用日益凸顯。有很多微博是圍繞同一相關(guān)事件而展開討論的,這便構(gòu)成了一個話題。研究話題的傳播規(guī)律并對熱點話題進行有效預測,有助于我們了解事件的發(fā)展動態(tài)及趨勢,可用于新聞熱點的挖掘和不良信息的監(jiān)管等領(lǐng)域。 本文介紹了微博中話題的傳播模型及完整的熱點預測系統(tǒng)流程,包括數(shù)據(jù)的獲取及預處理、話題聚類和熱點話題預測模塊。 論文的主要工作有: 1.由于微博中包含大量的廣告、商家促銷、活動宣傳等無意義信息,本文提出了一種從用戶和微博兩個角度構(gòu)建微博特征向量的方法,通過支持向量機(Support Vector Machine, SVM)實現(xiàn)了信息的有效過濾; 2.論文將話題傳播過程劃分為三個階段(即潛伏期、爆發(fā)期與消退期),統(tǒng)計各個時期用戶特征項及微博特征項的變化規(guī)律,并采用VIP用戶比例、用戶粉絲數(shù)分布、#話題標簽和url外鏈比例四個特征刻畫話題傳播,取得了較好的實驗結(jié)果; 3.論文采用了基于“潛在基底”假設(shè)的分類模型,并提出了時序信號表示話題趨勢的方法,最后對話題進行熱點預測和參數(shù)分析。實驗結(jié)果表明83.5%的話題可以提前預測,平均提前時間約為1.6小時,驗證了算法的有效性。
【關(guān)鍵詞】:微博過濾 微博話題 分類模型 熱點預測
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.092
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 緒論9-14
  • 1.1 本文研究的背景及意義9-10
  • 1.2 國內(nèi)外研究現(xiàn)狀10-12
  • 1.2.1 微博內(nèi)容過濾技術(shù)的研究現(xiàn)狀10-11
  • 1.2.2 話題的傳播分析及熱點預測研究現(xiàn)狀11-12
  • 1.3 本文的主要研究工作12
  • 1.4 論文的內(nèi)容安排12-14
  • 第二章 微博數(shù)據(jù)的準備及預處理14-26
  • 2.1 微博數(shù)據(jù)的爬取14-16
  • 2.2 垃圾信息的過濾16-23
  • 2.2.1 微博特征16-18
  • 2.2.2 文本內(nèi)容的向量化18-20
  • 2.2.3 過濾算法的實現(xiàn)20-22
  • 2.2.4 實驗效果評估22-23
  • 2.3 微博話題的聚類23-25
  • 2.3.1 LDA模型建模23-24
  • 2.3.2 話題聚類24-25
  • 2.4 本章小結(jié)25-26
  • 第三章 話題的傳播分析與分類模型26-48
  • 3.1 話題的傳播分析26-40
  • 3.1.1 話題傳播階段的劃分27-31
  • 3.1.2 話題傳播中的用戶分析31-36
  • 3.1.3 話題傳播中的微博分析36-40
  • 3.2 分類模型40-47
  • 3.2.1 分類的思想40-41
  • 3.2.2 隨機模型41
  • 3.2.3 類別檢測41-45
  • 3.2.4 算法的實現(xiàn)45-47
  • 3.3 本章小結(jié)47-48
  • 第四章 話題的熱點預測48-66
  • 4.1 話題趨勢特征的構(gòu)建48-54
  • 4.1.1 微博變化率48-49
  • 4.1.2 數(shù)據(jù)規(guī)范化49-51
  • 4.1.3 話題信號峰值處理51-53
  • 4.1.4 話題信號對數(shù)處理53-54
  • 4.2 在線話題距離的計算54-56
  • 4.3 實驗結(jié)果及分析56-64
  • 4.3.1 算法的測試及參數(shù)分析57-60
  • 4.3.2 案例分析60-64
  • 4.4 本章小結(jié)64-66
  • 第五章 總結(jié)與展望66-68
  • 5.1 論文主要工作66-67
  • 5.2 工作展望67-68
  • 參考文獻68-71
  • 致謝71-72
  • 攻讀學位期間發(fā)表或已錄用的學術(shù)論文72

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前5條

1 李學明;李海瑞;薛亮;何光軍;;基于信息增益與信息熵的TFIDF算法[J];計算機工程;2012年08期

2 馬社祥,劉貴忠,曾召華;基于小波分析的非平穩(wěn)時間序列分析與預測[J];系統(tǒng)工程學報;2000年04期

3 蘭月新;;突發(fā)事件網(wǎng)絡(luò)衍生輿情監(jiān)測模型研究[J];現(xiàn)代圖書情報技術(shù);2013年03期

4 韓忠明;張慧;張夢;;基于內(nèi)容的熱點話題傳播模型[J];智能系統(tǒng)學報;2013年03期

5 王昊;李義萍;馮卓楠;馮鈴;;流行病模型在微博轉(zhuǎn)發(fā)預測中的應(yīng)用(英文)[J];中國通信;2013年03期



本文編號:999914

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/999914.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶12c8c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com