基于微博轉(zhuǎn)發(fā)的特征分析與預(yù)測研究
發(fā)布時間:2023-04-02 14:32
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,越來越多的網(wǎng)民傾向于在社交平臺如Facebook、新浪微博、騰訊微博和人人網(wǎng)等上建立自己的交際圈。在微博中,當某個用戶發(fā)布了一篇微博帖子,其它用戶可能轉(zhuǎn)發(fā)他的帖子,這個轉(zhuǎn)發(fā)過程就會使得信息的快速傳播與擴散。有益的信息能給社會帶來積極的影響,不良的信息則會造成病毒式傳播,最后導(dǎo)致輿情的產(chǎn)生,給社會帶來危害。研究微博用戶轉(zhuǎn)發(fā)行為,分析其傳播規(guī)律,可以提前預(yù)測某條微博傳播結(jié)果,這對研究網(wǎng)絡(luò)輿情、廣告投放、商業(yè)決策等具有重要意義。通過對微博用戶在社交網(wǎng)絡(luò)中的轉(zhuǎn)發(fā)行為規(guī)律研究和分析,本文提出了全面又新奇的方法,其中包括影響微博轉(zhuǎn)發(fā)的特征體系構(gòu)建、基于Filter和Wrapper的特征篩選模型和基于集成學(xué)習(xí)的微博轉(zhuǎn)發(fā)預(yù)測模型。針對主流方法考慮的轉(zhuǎn)發(fā)因素比較單一的缺點,本文提出了影響微博轉(zhuǎn)發(fā)的特征體系構(gòu)建方法?紤]到用戶的興趣隨著時間是不斷變化的,針對這一問題,本文提出了基于興趣漂移的LDA主題模型;考慮到地理位置與用戶轉(zhuǎn)發(fā)行為存在密切關(guān)系,本文提出了基于地理位置相似度;在以往的研究中,研究者很少考慮用戶間的網(wǎng)絡(luò)結(jié)構(gòu)和用戶交互行為,本文提出了用戶聚集系數(shù)特征、用戶間鄰里重疊...
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 關(guān)于影響轉(zhuǎn)發(fā)行為因素的研究
1.2.2 關(guān)于社交網(wǎng)絡(luò)的轉(zhuǎn)發(fā)行為研究
1.2.3 關(guān)于信息傳播的研究
1.2.4 本章小結(jié)
1.3 本文主要研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
2 相關(guān)背景知識
2.1 文本處理技術(shù)
2.1.1 漢語分詞
2.1.2 去停用詞
2.1.3 文本表示
2.2 特征篩選
2.3 機器學(xué)習(xí)方法
2.3.1 邏輯斯諦回歸
2.3.2 集成學(xué)習(xí)
3 影響微博轉(zhuǎn)發(fā)的特征體系
3.1 用戶轉(zhuǎn)發(fā)行為定義和分析
3.2 用戶特征
3.2.1 微博用戶是否認證
3.2.2 微博用戶性別是否相同
3.2.3 用戶間命名實體相似度
3.2.4 地理位置相似度
3.3 微博特征
3.3.1 微博帖子是否含話題標簽(#hashtag)
3.3.2 微博帖子是否含URL
3.3.3 基于興趣漂移的主題相似度
3.3.4 TF-IDF空間向量相似度
3.4 網(wǎng)絡(luò)結(jié)構(gòu)特征
3.4.1 用戶聚集系數(shù)
3.4.2 用戶間的鄰里重疊度
3.4.3 用戶影響力
3.4.4 網(wǎng)絡(luò)局部結(jié)構(gòu)影響力
3.5 交互行為特征
3.5.1 用戶間是否互為好友
3.5.2 用戶是否提及(@)對方
3.5.3 用戶是否評論對方
3.5.4 用戶的轉(zhuǎn)發(fā)影響力
3.5.5 下游用戶轉(zhuǎn)發(fā)活躍度
3.6 特征值歸一化處理
3.7 指標體系的構(gòu)建
4 基于Filter和Wrapper的特征篩選模型
4.1 Filter單一因素檢驗
4.1.1 方差分析
4.1.2 卡方檢驗
4.1.3 點二列相關(guān)性分析
4.2 Wrapper多因素檢驗
5 微博用戶轉(zhuǎn)發(fā)預(yù)測模型構(gòu)建
6 實驗
6.1 實驗準備
6.1.1 實驗環(huán)境
6.1.2 實驗數(shù)據(jù)
6.1.3 實驗指標
6.2 特征分析
6.2.1 方差分析
6.2.2 卡方檢驗
6.2.3 點二列相關(guān)性分析
6.2.4 LVW特征組合分析
6.3 基于多特征的Adaboost預(yù)測模型
總結(jié)與展望
參考文獻
攻讀碩士學(xué)位期間發(fā)表論文及科研成果
致謝
本文編號:3779391
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 關(guān)于影響轉(zhuǎn)發(fā)行為因素的研究
1.2.2 關(guān)于社交網(wǎng)絡(luò)的轉(zhuǎn)發(fā)行為研究
1.2.3 關(guān)于信息傳播的研究
1.2.4 本章小結(jié)
1.3 本文主要研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
2 相關(guān)背景知識
2.1 文本處理技術(shù)
2.1.1 漢語分詞
2.1.2 去停用詞
2.1.3 文本表示
2.2 特征篩選
2.3 機器學(xué)習(xí)方法
2.3.1 邏輯斯諦回歸
2.3.2 集成學(xué)習(xí)
3 影響微博轉(zhuǎn)發(fā)的特征體系
3.1 用戶轉(zhuǎn)發(fā)行為定義和分析
3.2 用戶特征
3.2.1 微博用戶是否認證
3.2.2 微博用戶性別是否相同
3.2.3 用戶間命名實體相似度
3.2.4 地理位置相似度
3.3 微博特征
3.3.1 微博帖子是否含話題標簽(#hashtag)
3.3.2 微博帖子是否含URL
3.3.3 基于興趣漂移的主題相似度
3.3.4 TF-IDF空間向量相似度
3.4 網(wǎng)絡(luò)結(jié)構(gòu)特征
3.4.1 用戶聚集系數(shù)
3.4.2 用戶間的鄰里重疊度
3.4.3 用戶影響力
3.4.4 網(wǎng)絡(luò)局部結(jié)構(gòu)影響力
3.5 交互行為特征
3.5.1 用戶間是否互為好友
3.5.2 用戶是否提及(@)對方
3.5.3 用戶是否評論對方
3.5.4 用戶的轉(zhuǎn)發(fā)影響力
3.5.5 下游用戶轉(zhuǎn)發(fā)活躍度
3.6 特征值歸一化處理
3.7 指標體系的構(gòu)建
4 基于Filter和Wrapper的特征篩選模型
4.1 Filter單一因素檢驗
4.1.1 方差分析
4.1.2 卡方檢驗
4.1.3 點二列相關(guān)性分析
4.2 Wrapper多因素檢驗
5 微博用戶轉(zhuǎn)發(fā)預(yù)測模型構(gòu)建
6 實驗
6.1 實驗準備
6.1.1 實驗環(huán)境
6.1.2 實驗數(shù)據(jù)
6.1.3 實驗指標
6.2 特征分析
6.2.1 方差分析
6.2.2 卡方檢驗
6.2.3 點二列相關(guān)性分析
6.2.4 LVW特征組合分析
6.3 基于多特征的Adaboost預(yù)測模型
總結(jié)與展望
參考文獻
攻讀碩士學(xué)位期間發(fā)表論文及科研成果
致謝
本文編號:3779391
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3779391.html
最近更新
教材專著