天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 法律論文 > 治安法論文 >

社交網(wǎng)絡(luò)異常用戶檢測(cè)技術(shù)研究

發(fā)布時(shí)間:2020-12-05 19:51
  近年來,社交網(wǎng)絡(luò)服務(wù)蓬勃發(fā)展,但由于自身具有開放性,在人們對(duì)其依賴性日益增長(zhǎng)的同時(shí),涌現(xiàn)出大量惡意牟利的異常用戶,他們發(fā)送廣告鏈接、傳播虛假信息、甚至發(fā)起惡意攻擊等,不僅降低社交網(wǎng)絡(luò)的服務(wù)質(zhì)量,擾亂社交網(wǎng)絡(luò)秩序,還對(duì)正常用戶帶來嚴(yán)重的安全威脅,為公安工作帶來嚴(yán)峻挑戰(zhàn)。本文綜合分析了國(guó)內(nèi)外學(xué)術(shù)成果和現(xiàn)有研究方法,針對(duì)Twitter、微博等大規(guī)模社交網(wǎng)絡(luò)中的異常用戶檢測(cè)技術(shù)進(jìn)行了深入研究,將社交網(wǎng)絡(luò)異常檢測(cè)映射為向量空間中的分類問題,確立了集成分類的研究思路,對(duì)特征提取和算法選擇兩方面提出了改進(jìn)措施,從而提升異常檢測(cè)的效果。第一,在特征提取方面,針對(duì)當(dāng)前研究未能有效挖掘用戶關(guān)注關(guān)系的現(xiàn)狀,改進(jìn)了現(xiàn)有的社交網(wǎng)絡(luò)用戶特征提取方法,基于信息論和同質(zhì)性原理,提出融合特征提取模型,從而綜合提取用戶自身節(jié)點(diǎn)特征與鄰居特征。首先應(yīng)用Word2vec、LDA等自然語言處理模型以及復(fù)雜網(wǎng)絡(luò)計(jì)算方法,全面提取用戶行為、文本、網(wǎng)絡(luò)等方面顯式和隱式的節(jié)點(diǎn)特征,充分挖掘語義信息和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)信息。其次,利用節(jié)點(diǎn)鄰接矩陣和影響力矩陣共同運(yùn)算得到鄰居特征,并根據(jù)Relief算法選擇對(duì)分類效果貢獻(xiàn)最大的K個(gè)鄰居特征,與節(jié)... 

【文章來源】:中國(guó)人民公安大學(xué)北京市

【文章頁數(shù)】:74 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

社交網(wǎng)絡(luò)異常用戶檢測(cè)技術(shù)研究


SVM最大間隔示意圖

示意圖,決策樹,模型,示意圖


然后子節(jié)點(diǎn)作為新的父親節(jié)點(diǎn)繼續(xù)分裂,直至不能分裂為止。生成的決策樹中,葉子節(jié)點(diǎn)是沒有子節(jié)點(diǎn)的節(jié)點(diǎn),每個(gè)葉子結(jié)點(diǎn)包含某一特定類別的數(shù)據(jù),即分類結(jié)果;每一個(gè)非葉子結(jié)點(diǎn)表示判斷條件,決策樹生成后可對(duì)新的數(shù)據(jù)進(jìn)行分類預(yù)測(cè)(如圖2.2)。圖 2.2 決策樹模型示意圖決策樹一般用葉子結(jié)點(diǎn)的純度或復(fù)雜度作為評(píng)價(jià)指標(biāo),往往復(fù)雜度通過信息熵來確定,純度用基尼系數(shù)來確定,公式為:Entropy = ∑ p log(p ) (公式 2.3)Gain = 1 ∑ p (公式 2.4)節(jié)點(diǎn)分裂過程中,用信息增益表示分裂前后根的數(shù)據(jù)復(fù)雜度和分裂節(jié)點(diǎn)數(shù)據(jù)復(fù)雜度的變化值,從而判斷分裂依據(jù)的特征,并計(jì)算作為分類標(biāo)準(zhǔn)的特征值。信息增益為:

模型圖,森林分類,模型圖


圖 2.3 隨機(jī)森林分類模型圖 Adaboost 算法daboost[54]是一種串行迭代的自適應(yīng)增強(qiáng)算法,該算法通過改變數(shù)據(jù)的分布程中通過修改樣本的權(quán)值來實(shí)現(xiàn)分類。根據(jù)每次迭代中訓(xùn)練集內(nèi)每個(gè)樣本否,并參考上次迭代的分類正確率,來更新每個(gè)樣本的權(quán)值。其核心思想訓(xùn)練集訓(xùn)練不同的分類器(弱分類器),對(duì)于前一個(gè)弱分類器分錯(cuò)的樣本加強(qiáng),加權(quán)后的全體樣本再次被用來訓(xùn)練下一個(gè)基本分類器,同時(shí)在每一新的弱分類器,直到達(dá)到預(yù)先指定的迭代次數(shù)或者預(yù)定的最小錯(cuò)誤率,每,所有的弱分類器融合作為最終的決策強(qiáng)分類器。章小結(jié)章分析了社交網(wǎng)絡(luò)異常用戶檢測(cè)領(lǐng)域的國(guó)內(nèi)外研究現(xiàn)狀,并按照研究對(duì)象作歸納為基于社交網(wǎng)絡(luò)圖模型方法和節(jié)點(diǎn)特征分析方法,確定了分類檢測(cè)異常用戶的劃分類別、研究數(shù)據(jù)獲取途徑、常見特征選擇方法,并簡(jiǎn)述了

【參考文獻(xiàn)】:
期刊論文
[1]針對(duì)行為特征的社交網(wǎng)絡(luò)異常用戶檢測(cè)方法[J]. 王鵬,宋艷紅,李松江,楊華民,邱寧佳.  計(jì)算機(jī)應(yīng)用. 2017(S2)
[2]基于社會(huì)認(rèn)同理論的微博群體用戶畫像[J]. 林燕霞,謝湘生.  情報(bào)理論與實(shí)踐. 2018(03)
[3]基于行為特征分析的社交網(wǎng)絡(luò)女巫節(jié)點(diǎn)檢測(cè)機(jī)制[J]. 吳大鵬,司書山,閆俊杰,王汝言.  電子與信息學(xué)報(bào). 2017(09)
[4]同質(zhì)性和社會(huì)影響對(duì)混合型社交網(wǎng)絡(luò)形成的仿真分析[J]. 何軍,劉業(yè)政.  現(xiàn)代情報(bào). 2017(04)
[5]面向網(wǎng)絡(luò)輿情數(shù)據(jù)的異常行為識(shí)別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞.  計(jì)算機(jī)研究與發(fā)展. 2016(03)
[6]基于RSBoost算法的不平衡數(shù)據(jù)分類方法[J]. 李克文,楊磊,劉文英,劉璐,劉洪太.  計(jì)算機(jī)科學(xué). 2015(09)
[7]在線社交網(wǎng)絡(luò)中異常帳號(hào)檢測(cè)方法研究[J]. 張玉清,呂少卿,范丹.  計(jì)算機(jī)學(xué)報(bào). 2015(10)
[8]基于用戶行為的微博用戶社會(huì)影響力分析[J]. 毛佳昕,劉奕群,張敏,馬少平.  計(jì)算機(jī)學(xué)報(bào). 2014(04)

博士論文
[1]在線社交網(wǎng)絡(luò)中異常帳號(hào)檢測(cè)研究[D]. 呂少卿.西安電子科技大學(xué) 2016

碩士論文
[1]基于行為分析的社交網(wǎng)絡(luò)異常賬號(hào)的檢測(cè)[D]. 劉琛.北京交通大學(xué) 2017
[2]微博垃圾博主的行為分析與檢測(cè)[D]. 孫子川.西南交通大學(xué) 2016



本文編號(hào):2899995

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/falvlunwen/fanzuizhian/2899995.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fa221***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com