基于計劃行為理論的微博用戶轉發(fā)行為預測研究
發(fā)布時間:2024-03-03 20:45
移動互聯(lián)網技術的成熟及智能終端的廣泛應用,驅動著人們進入個人互聯(lián)網時代。個人互聯(lián)網時代的出現(xiàn)源于社交媒體的興起,耳熟能詳?shù)纳缃幻襟w平臺有Twitter,Facebook,微博,微信等。隨著微博用戶規(guī)模的不斷擴增,微博數(shù)據(jù)更新速度加快,其作為傳播信息的重要載體之一,已經成為社會輿論事件發(fā)酵的一個渠道。目前,國內外學者關于用戶轉發(fā)行為的研究分別從內容特征、用戶、網絡拓撲結構及網絡特性三個方面分析并預測用戶轉發(fā)行為,F(xiàn)有研究中,一方面缺乏對于微博平臺這個傳播載體的分析;另一方面,缺乏對用戶情感偏好的研究。因此,本研究針對以上問題,通過對微博用戶行為以及微博信息傳播機制進行分析后,基于計劃行為理論從三個不同方面來建立微博用戶轉發(fā)行為影響因素模型,并據(jù)此提出本研究的一系列研究假設。首先,根據(jù)研究需要設計一定的數(shù)據(jù)采集方案完成所需數(shù)據(jù)集的獲取。其次,在對文本信息進行預處理的基礎上,用戶興趣和待預測微博的主題分布采用LDA主題模型來獲取,并進一步計算兩者之間的語義相似度,以此表征用戶興趣與微博內容的接近程度;基于情感詞典分別計算得到用戶及微博的情感值,利用兩者之間的距離來衡量情感相似度的大小;根據(jù)微...
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3918327
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
圖2.2有向無環(huán)圖
計算得到每條路徑的權重,選擇權重最大的即是最終的切分結果。圖2.2有向無環(huán)圖2.2.2去停用詞微博文本中存在大量對于研究毫無價值的的詞或者詞語,若將這些數(shù)據(jù)用于后續(xù)的主題概率分布分析、情感分析,將不可避免地對結果的準確性產生一定的影響。因此,應在文本分析之前進行停用詞過濾....
圖2.5KNN分類示例
KNN(K-NearestNeighbor)算法的核心思想:對待分類樣本,如分類樣本距離最近的K個樣本中大多數(shù)屬于哪個類別,則將待分類別中。具體實現(xiàn)如下:算測試集與訓練集中樣本之間的距離;照距離逐漸增加的方式排序,并選擇距離最小的K個點;據(jù)已選擇的K個點中大多數(shù)點所....
圖2.6SVM分類示例
21(,)()nkkkdxyxy1(,)||nkkkdxyxy3)SVM(SupportVectorMachine)的原理是將一個樣本通過某種映射維空間或者是無窮維特征空間,使樣本空間中的非線性分類問題在特征線性可分的問題[70....
圖3.1微博消息傳播過程
一個典型的社交平臺,用戶之間通過關注關系形成特點在于其屬于單向社交,即用戶1和2之間不需要在瀏覽微博的過程中發(fā)現(xiàn)用戶2的微博內容比較符戶2而不需要征得用戶2的同意。微博的社交網絡可該有向圖G中每個節(jié)點u∈U表示一個用戶,每條。微博用戶行為主要包括以下四種類....
本文編號:3918327
本文鏈接:http://sikaile.net/tushudanganlunwen/3918327.html