基于圖結構與多特征的微博水軍團體識別
發(fā)布時間:2024-12-26 00:29
隨著以Twitter、微博等為代表的在線社交網(wǎng)絡快速發(fā)展,網(wǎng)絡水軍利用這些平臺傳播謠言、欺騙大眾,嚴重影響了社會的穩(wěn)定和網(wǎng)絡的發(fā)展。如何快速而有效地識別出這些社交網(wǎng)絡水軍,對維護網(wǎng)絡秩序、營造良好的網(wǎng)絡環(huán)境具有重要的意義。傳統(tǒng)的網(wǎng)絡水軍識別研究已經(jīng)取得了階段性進展,他們主要通過內(nèi)容特征、用戶特征,環(huán)境特征及綜合特征進行水軍識別。然而,網(wǎng)絡水軍逐漸形成團體規(guī)模,對整個網(wǎng)絡產(chǎn)生了更大的影響,不少研究者開始將網(wǎng)絡水軍團體作為研究對象,他們先利用以往的水軍識別技術發(fā)現(xiàn)網(wǎng)絡水軍,再利用聚類、社區(qū)劃分等算法挖掘網(wǎng)絡水軍團體。雖然能有效地發(fā)現(xiàn)部分水軍團體成員,但是越來越多的水軍用戶隱藏自己的內(nèi)容、行為等異常特征,使個體趨向于正常用戶,導致現(xiàn)有的網(wǎng)絡水軍團體識別方法準確率不高?紤]到水軍團體成員往往會為了同一個目標集體行動,其呈現(xiàn)出的整體特征是無法掩蓋的,因此本文將水軍團體作為一個整體進行研究,以圖的方式全局分析水軍成員之間的關系,并利用網(wǎng)絡水軍團體的多個特征進一步檢測,提出了一種基于圖結構和多特征的微博水軍團體識別方法。主要識別過程如下:(1)對每篇炒作博文下的參與用戶構建用戶關系圖,利用改進的最大頻...
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外網(wǎng)絡水軍研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文的組織結構
第二章 相關研究
2.1 網(wǎng)絡水軍概述
2.1.1 網(wǎng)絡水軍概念及其特征
2.1.2 網(wǎng)絡水軍團體概念及其特征
2.2 網(wǎng)絡水軍識別技術研究
2.2.1 網(wǎng)絡水軍識別
2.2.2 網(wǎng)絡水軍團體識別
2.3 現(xiàn)有研究不足和本文研究改進
2.3.1 現(xiàn)有研究的不足
2.3.2 本文研究改進
2.4 本章小結
第三章 基于圖結構的疑似水軍團體發(fā)現(xiàn)
3.1 用戶關系圖的構建
3.2 基于頻繁子圖的疑似水軍團體挖掘
3.2.1 頻繁子圖的引入
3.2.2 改進的頻繁子圖挖掘算法
3.2.3 算法偽代碼
3.3 疑似水軍團體中的正常用戶過濾
3.3.1 離群點的引入
3.3.2 用戶特征屬性的選取及相似度計算
3.3.3 基于用戶相似度的離群點算法
3.3.4 算法偽代碼
3.4 疑似網(wǎng)絡水軍團體發(fā)現(xiàn)
3.5 本章小結
第四章 基于多特征的水軍團體檢測
4.1 網(wǎng)絡水軍團體特征的選取和量化
4.1.1 網(wǎng)絡水軍團體結構特征
4.1.2 網(wǎng)絡水軍團體內(nèi)容特征
4.1.3 網(wǎng)絡水軍團體時間特征
4.2 基于機器學習的網(wǎng)絡水軍團體分類模型
4.2.1 網(wǎng)絡水軍團體特征模塊
4.2.2 分類決策模塊
4.3 基于C4.5決策樹的網(wǎng)絡水軍團體檢測
4.3.1 決策樹C4.5算法
4.3.2 生成決策樹
4.3.3 網(wǎng)絡水軍團體檢測
4.4 本章小結
第五章 實驗與結果分析
5.1 實驗準備
5.1.1 實驗環(huán)境搭建
5.1.2 數(shù)據(jù)集獲取
5.1.3 數(shù)據(jù)集預處理
5.1.4 數(shù)據(jù)集人工標識與劃分
5.2 頻繁子圖的發(fā)現(xiàn)
5.2.1 構建用戶關系圖
5.2.2 最小支持度閾值的設定
5.2.3 評價指標
5.2.4 實驗結果與分析
5.3 屬性權重的設定
5.4 對比實驗
5.4.1 實驗評估標準
5.4.2 實驗及結果分析
5.5 本章小結
第六章 研究工作總結與展望
6.1 研究工作總結
6.2 對未來工作的展望
參考文獻
附錄1 攻讀碩士學位期間撰寫的論文
致謝
本文編號:4020243
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外網(wǎng)絡水軍研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文的組織結構
第二章 相關研究
2.1 網(wǎng)絡水軍概述
2.1.1 網(wǎng)絡水軍概念及其特征
2.1.2 網(wǎng)絡水軍團體概念及其特征
2.2 網(wǎng)絡水軍識別技術研究
2.2.1 網(wǎng)絡水軍識別
2.2.2 網(wǎng)絡水軍團體識別
2.3 現(xiàn)有研究不足和本文研究改進
2.3.1 現(xiàn)有研究的不足
2.3.2 本文研究改進
2.4 本章小結
第三章 基于圖結構的疑似水軍團體發(fā)現(xiàn)
3.1 用戶關系圖的構建
3.2 基于頻繁子圖的疑似水軍團體挖掘
3.2.1 頻繁子圖的引入
3.2.2 改進的頻繁子圖挖掘算法
3.2.3 算法偽代碼
3.3 疑似水軍團體中的正常用戶過濾
3.3.1 離群點的引入
3.3.2 用戶特征屬性的選取及相似度計算
3.3.3 基于用戶相似度的離群點算法
3.3.4 算法偽代碼
3.4 疑似網(wǎng)絡水軍團體發(fā)現(xiàn)
3.5 本章小結
第四章 基于多特征的水軍團體檢測
4.1 網(wǎng)絡水軍團體特征的選取和量化
4.1.1 網(wǎng)絡水軍團體結構特征
4.1.2 網(wǎng)絡水軍團體內(nèi)容特征
4.1.3 網(wǎng)絡水軍團體時間特征
4.2 基于機器學習的網(wǎng)絡水軍團體分類模型
4.2.1 網(wǎng)絡水軍團體特征模塊
4.2.2 分類決策模塊
4.3 基于C4.5決策樹的網(wǎng)絡水軍團體檢測
4.3.1 決策樹C4.5算法
4.3.2 生成決策樹
4.3.3 網(wǎng)絡水軍團體檢測
4.4 本章小結
第五章 實驗與結果分析
5.1 實驗準備
5.1.1 實驗環(huán)境搭建
5.1.2 數(shù)據(jù)集獲取
5.1.3 數(shù)據(jù)集預處理
5.1.4 數(shù)據(jù)集人工標識與劃分
5.2 頻繁子圖的發(fā)現(xiàn)
5.2.1 構建用戶關系圖
5.2.2 最小支持度閾值的設定
5.2.3 評價指標
5.2.4 實驗結果與分析
5.3 屬性權重的設定
5.4 對比實驗
5.4.1 實驗評估標準
5.4.2 實驗及結果分析
5.5 本章小結
第六章 研究工作總結與展望
6.1 研究工作總結
6.2 對未來工作的展望
參考文獻
附錄1 攻讀碩士學位期間撰寫的論文
致謝
本文編號:4020243
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/4020243.html
最近更新
教材專著