天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于XGBoost方法的社交網(wǎng)絡異常用戶檢測技術

發(fā)布時間:2021-08-01 05:31
  針對傳統(tǒng)社交網(wǎng)絡異常用戶檢測算法應用于現(xiàn)實中非平衡數(shù)據(jù)集時存在召回率低、運行效率低等問題,對社交網(wǎng)絡數(shù)據(jù)集提取用戶內(nèi)容、行為、屬性、關系特征,應用梯度增強集成分類器XGBoost算法進行特征選擇,建立分類模型,構造非平衡數(shù)據(jù)集并識別三類垃圾廣告發(fā)送賬號。實驗結果表明,該方法與隨機森林等傳統(tǒng)分類方法相比,對平衡及非平衡數(shù)據(jù)集進行異常用戶檢測均實現(xiàn)召回率和F1值的有效提升;同時其選取少量特征同樣可達到較高檢測水平,證明了該方法的有效性。 

【文章來源】:計算機應用研究. 2020,37(03)北大核心CSCD

【文章頁數(shù)】:4 頁

【部分圖文】:

基于XGBoost方法的社交網(wǎng)絡異常用戶檢測技術


實驗步驟

流程圖,社交,流程,類別


社交網(wǎng)絡異常用戶檢測的本質(zhì)是將數(shù)據(jù)集中的所有樣本劃分為正常用戶及各類異常用戶的多分類任務。本文選擇XGBoost(extreme gradient boosting)[15]集成提升方法構建分類模型。分類訓練數(shù)據(jù)集的每一個樣本對應社交網(wǎng)絡中的每一個用戶,由包含內(nèi)容、行為、屬性、關系等在內(nèi)的n維特征向量xi和對應的p個類別標簽yi構成:{xi,yi}i∈[1,m],xi∈Rn,yi∈{class1,class2,…,classp};赬GBoost對用戶進行分類的方法是通過學習輸入的訓練樣本構造分類模型,挖掘特征取值xi與類別標簽yi的關系f(xi)=yi,從而預測新樣本的類別。整體檢測流程如圖1所示。對本文分類任務,XGBoost每一輪訓練都是在上一輪的基礎上迭代產(chǎn)生的,第t次迭代對生成樹構造的目標函數(shù)為

過程圖,交叉驗證,過程,外循環(huán)


經(jīng)驗證,參數(shù)max_depth=3,n_estimators=100,n_threthould=none時,XGBoost可獲得最優(yōu)分類效果,如圖2、3所示。圖3為內(nèi)循環(huán)選擇模型參數(shù),外循環(huán)驗證實驗結果。圖3 實驗步驟

【參考文獻】:
期刊論文
[1]面向網(wǎng)絡輿情數(shù)據(jù)的異常行為識別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞.  計算機研究與發(fā)展. 2016(03)
[2]基于RSBoost算法的不平衡數(shù)據(jù)分類方法[J]. 李克文,楊磊,劉文英,劉璐,劉洪太.  計算機科學. 2015(09)
[3]在線社交網(wǎng)絡中異常帳號檢測方法研究[J]. 張玉清,呂少卿,范丹.  計算機學報. 2015(10)

碩士論文
[1]基于行為分析的社交網(wǎng)絡異常賬號的檢測[D]. 劉琛.北京交通大學 2017



本文編號:3314914

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3314914.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶f7fae***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com