天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

微博垃圾博主的行為分析與檢測

發(fā)布時間:2020-10-12 08:57
   隨著互聯網的日益發(fā)展,越來越多的組織或個人開始通過社交網絡獲取信息。社交網絡的用戶群體巨大,用戶關系通常是基于同學、朋友或者親人等社會關系,信息在傳播過程中更容易被接受。于是便產生了許多通過發(fā)布有害鏈接、病毒,暴力、色情信息等對普通用戶危害較大的微博來獲取不正當利益的用戶。然而,隨著反作弊技術的不斷提升以及社交網絡系統(tǒng)的不斷自我完善,這一類的作弊行為已經幾乎不復存在。作弊者的行為逐漸趨于隱藏化,對用戶造成的危害變小且相對間接,這種危害更多地體現在對用戶從社交網絡汲取信息效率的影響。本文從產生上述的影響的大小以及產生這種影響的行為的主動性等方面進行考慮,定義了不同類型的微博垃圾用戶,然后對各種類型的微博用戶的行為進行研究與分析。本文設計了大規(guī)模并行微博爬蟲爬取了500多萬條微博,對原數據集進行了擴充。同時從用戶個人信息、用戶行為、用戶關系、用戶微博博文四個方面對新數據集進行預處理,進一步提取特征,構建了包含手機廣告被動營銷用戶、明星以及體育賽事被動宣傳用戶以及典型微博垃圾用戶的中文微博樣本集。同時,對用戶的微博內容進行了分詞和主題生成,構建了基于微博內容的主題詞庫。在此基礎上,本文對數據集做平衡處理之后,通過對比實驗,對不同特征組合的貢獻效果進行了比較,最終選出了最優(yōu)分類檢測效果下的特征組合。之后,本文比較了兩兩不同子類的特征差異度,據此使用了基于多元分類的DAG-SVM算法對數據進行分類,并與其他算法進行了性能對比,在分類效果上具有優(yōu)勢。最后,本文設計了基于綜合權重的多元SVM分類算法,根據任意兩個子類間互相分錯的樣本個數來計算每個二元子分類器的權重,將其加入目標函數后進行分類,提高了分類的準確性。
【學位單位】:西南交通大學
【學位級別】:碩士
【學位年份】:2016
【中圖分類】:TP393.092;TP391.1
【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景和意義
    1.2 國內外研究現狀
        1.2.1 國內研究現狀
        1.2.2 國外研究現狀
    1.3 研究內容和目標
    1.4 論文結構安排
第2章 微博垃圾博主行為分析與相關檢測技術
    2.1 微博垃圾博主的行為分析
    2.2 基于微博博文鏈接內容的微博推廣聯盟的檢測
    2.3 基于支持向量機的微博垃圾博主分類算法
        2.3.1 支持向量機分類算法概述
        2.3.2 支持向量機分類算法的優(yōu)點與不足
    2.4 本章小結
第3章 中文微博樣本集與微博主題詞庫的構建
    3.1 中文微博樣本集的數據獲取與存儲
        3.1.1 用戶授權控制部分
        3.1.2 數據獲取部分
        3.1.3 數據持久化部分
    3.2 數據集預處理
    3.3 基于主題生成模型的微博博文關鍵詞數據樣本集構建
        3.3.1 微博博文主題生成
        3.3.2 博文主題關鍵字選擇
    3.4 數據集標注
    3.5 本章小結
第4章 垃圾微博用戶特征分析與選擇
    4.1 特征選擇與分析
        4.1.1 用戶行為特征分析與選擇
        4.1.2 用戶個人資料特征特征分析與選擇
        4.1.3 用戶微博內容特征分析與選擇
        4.1.4 用戶關系特征分析與選擇
    4.2 實驗對比
        4.2.1 數據集平衡
        4.2.2 分類性能評價標準
        4.2.3 特征貢獻與特征組合
    4.3 本章小結
第5章 微博垃圾博主檢測
    5.1 基于多元分類支持向量機的多層次微博博主檢測
        5.1.1 多元支持向量機的主要實現方式
        5.1.2 快速多元支持向量機分類算法
        5.1.3 對比實驗
    5.2 基于綜合權重的多層次微博垃圾博主檢測算法
        5.2.1 綜合權重的計算
        5.2.2 對比實驗
    5.3 本章小結
第6章 總結與展望
    6.1 總結
    6.2 展望
致謝
參考文獻

【相似文獻】

相關期刊論文 前10條

1 陳翔;楊明靜;;基于SVM與多數據集的摔倒檢測方法研究[J];信息通信;2018年04期

2 劉悅婷;;基于近鄰密度改進的SVM不平衡數據集分類算法[J];延邊大學學報(自然科學版);2018年01期

3 覃希;蘇一丹;張雯;;商空間框架下的大規(guī)模SVM數據集約減法[J];計算機科學;2013年12期

4 黃秀麗;王蔚;;SVM在非平衡數據集中的應用[J];計算機技術與發(fā)展;2009年06期

5 業(yè)寧,梁作鵬,董逸生,王厚立;一種SVM非線性回歸算法[J];計算機工程;2005年20期

6 趙小強;張露;;基于SVM的高維不平衡數據集分類算法[J];南京大學學報(自然科學);2018年02期

7 應維云;覃正;趙宇;李兵;李秀;;SVM方法及其在客戶流失預測中的應用研究[J];系統(tǒng)工程理論與實踐;2007年07期

8 劉悅婷;張燕;孫偉剛;;基于局部密度改進的SVM不平衡數據集分類算法[J];寧夏大學學報(自然科學版);2019年03期

9 李書玲;劉蓉;張鎏欽;劉紅;;基于改進型SVM算法的語音情感識別[J];計算機應用;2013年07期

10 劉進軍;;基于懲罰的SVM和集成學習的非平衡數據分類算法研究[J];計算機應用與軟件;2014年01期


相關博士學位論文 前10條

1 張婧;基于SVM的肺結節(jié)自動識別方法研究[D];華南理工大學;2011年

2 張元俠;基于SVM學習模型的換擋決策研究[D];吉林大學;2019年

3 李鑫;基于位置社交網絡的地點推薦方法及應用研究[D];中國科學技術大學;2015年

4 杜威;社交網絡中媒體數據處理關鍵技術研究[D];中國科學院大學(中國科學院沈陽計算技術研究所);2017年

5 劉立;基于多個社交網絡的用戶關系分析[D];北京理工大學;2016年

6 曾雪;在線社交網絡用戶的分類及采樣研究[D];電子科技大學;2013年

7 張君;用戶行為驅動的社交網絡演化分析[D];清華大學;2015年

8 羅貴珣;社交網絡中觀點演化模式及信息轉發(fā)預測研究[D];北京交通大學;2018年

9 王健;突發(fā)公共事件背景下在線社交網絡信息擴散及治理研究[D];南京師范大學;2018年

10 唐興;線上社交網絡中用戶個體行為挖掘方法研究[D];西安電子科技大學;2016年


相關碩士學位論文 前10條

1 孫子川;微博垃圾博主的行為分析與檢測[D];西南交通大學;2016年

2 趙弘陽;基于數據集的社交特性挖掘[D];浙江大學;2014年

3 許雙;基于頻繁子圖挖掘的小群體社交網絡用戶關系分析[D];北京郵電大學;2016年

4 楊也康;社交網絡上的可信度分析[D];北京郵電大學;2016年

5 宋艷紅;社交網絡中異常用戶的識別與研究[D];長春理工大學;2017年

6 任毅;社交網絡數據提取與分析[D];北京郵電大學;2016年

7 馮雪艷;社交網絡中基于成本的廣告投放策略的設計與實現[D];東南大學;2017年

8 李志永;基于SVM的煤與瓦斯突出區(qū)域分類預測模型研究[D];太原科技大學;2010年

9 吳琪;移動社交網絡中的位置預測方法研究[D];重慶郵電大學;2016年

10 蔡丹莉;混合核函數SVM的蛋白質相互作用預測方法研究[D];福州大學;2014年



本文編號:2837919

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2837919.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶57295***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com