天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于XGBoost方法的社交網(wǎng)絡(luò)異常用戶檢測(cè)技術(shù)

發(fā)布時(shí)間:2021-08-01 05:31
  針對(duì)傳統(tǒng)社交網(wǎng)絡(luò)異常用戶檢測(cè)算法應(yīng)用于現(xiàn)實(shí)中非平衡數(shù)據(jù)集時(shí)存在召回率低、運(yùn)行效率低等問(wèn)題,對(duì)社交網(wǎng)絡(luò)數(shù)據(jù)集提取用戶內(nèi)容、行為、屬性、關(guān)系特征,應(yīng)用梯度增強(qiáng)集成分類器XGBoost算法進(jìn)行特征選擇,建立分類模型,構(gòu)造非平衡數(shù)據(jù)集并識(shí)別三類垃圾廣告發(fā)送賬號(hào)。實(shí)驗(yàn)結(jié)果表明,該方法與隨機(jī)森林等傳統(tǒng)分類方法相比,對(duì)平衡及非平衡數(shù)據(jù)集進(jìn)行異常用戶檢測(cè)均實(shí)現(xiàn)召回率和F1值的有效提升;同時(shí)其選取少量特征同樣可達(dá)到較高檢測(cè)水平,證明了該方法的有效性。 

【文章來(lái)源】:計(jì)算機(jī)應(yīng)用研究. 2020,37(03)北大核心CSCD

【文章頁(yè)數(shù)】:4 頁(yè)

【部分圖文】:

基于XGBoost方法的社交網(wǎng)絡(luò)異常用戶檢測(cè)技術(shù)


實(shí)驗(yàn)步驟

流程圖,社交,流程,類別


社交網(wǎng)絡(luò)異常用戶檢測(cè)的本質(zhì)是將數(shù)據(jù)集中的所有樣本劃分為正常用戶及各類異常用戶的多分類任務(wù)。本文選擇XGBoost(extreme gradient boosting)[15]集成提升方法構(gòu)建分類模型。分類訓(xùn)練數(shù)據(jù)集的每一個(gè)樣本對(duì)應(yīng)社交網(wǎng)絡(luò)中的每一個(gè)用戶,由包含內(nèi)容、行為、屬性、關(guān)系等在內(nèi)的n維特征向量xi和對(duì)應(yīng)的p個(gè)類別標(biāo)簽yi構(gòu)成:{xi,yi}i∈[1,m],xi∈Rn,yi∈{class1,class2,…,classp};赬GBoost對(duì)用戶進(jìn)行分類的方法是通過(guò)學(xué)習(xí)輸入的訓(xùn)練樣本構(gòu)造分類模型,挖掘特征取值xi與類別標(biāo)簽yi的關(guān)系f(xi)=yi,從而預(yù)測(cè)新樣本的類別。整體檢測(cè)流程如圖1所示。對(duì)本文分類任務(wù),XGBoost每一輪訓(xùn)練都是在上一輪的基礎(chǔ)上迭代產(chǎn)生的,第t次迭代對(duì)生成樹(shù)構(gòu)造的目標(biāo)函數(shù)為

過(guò)程圖,交叉驗(yàn)證,過(guò)程,外循環(huán)


經(jīng)驗(yàn)證,參數(shù)max_depth=3,n_estimators=100,n_threthould=none時(shí),XGBoost可獲得最優(yōu)分類效果,如圖2、3所示。圖3為內(nèi)循環(huán)選擇模型參數(shù),外循環(huán)驗(yàn)證實(shí)驗(yàn)結(jié)果。圖3 實(shí)驗(yàn)步驟

【參考文獻(xiàn)】:
期刊論文
[1]面向網(wǎng)絡(luò)輿情數(shù)據(jù)的異常行為識(shí)別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞.  計(jì)算機(jī)研究與發(fā)展. 2016(03)
[2]基于RSBoost算法的不平衡數(shù)據(jù)分類方法[J]. 李克文,楊磊,劉文英,劉璐,劉洪太.  計(jì)算機(jī)科學(xué). 2015(09)
[3]在線社交網(wǎng)絡(luò)中異常帳號(hào)檢測(cè)方法研究[J]. 張玉清,呂少卿,范丹.  計(jì)算機(jī)學(xué)報(bào). 2015(10)

碩士論文
[1]基于行為分析的社交網(wǎng)絡(luò)異常賬號(hào)的檢測(cè)[D]. 劉琛.北京交通大學(xué) 2017



本文編號(hào):3314914

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3314914.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f7fae***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com