微博惡意用戶識別
本文關(guān)鍵詞:微博惡意用戶識別
更多相關(guān)文章: 微博 惡意用戶識別 博弈論 用戶關(guān)系 蟻群算法 機(jī)器學(xué)習(xí)
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,以Facebook, Twitter為代表的在線社交網(wǎng)絡(luò)成為了人們相互之間交流的重要途徑。而在國內(nèi),微博更是成為時(shí)下最熱門的在線社交網(wǎng)絡(luò)。然而,微博中還充斥著大量的利用微博傳遞惡意信息、實(shí)施惡意行為的惡意用戶,對微博生態(tài)和微博中正常用戶的隱私和財(cái)產(chǎn)安全構(gòu)成了威脅。因此,關(guān)于反惡意用戶方法的研究具有很大現(xiàn)實(shí)意義,這其中就包括惡意用戶識別技術(shù)。當(dāng)前,微博惡意用戶識別的研究主要集中在兩個(gè)方面,一是基于惡意信息內(nèi)容與統(tǒng)計(jì)特征分析,二是基于惡意用戶的行為特征和用戶關(guān)系。研究者們或從一個(gè)方向,或從兩個(gè)方向同時(shí)著手,取得了大量的研究成果。然而目前的方法普遍只能利用二分類方法簡單區(qū)分惡意用戶與正常用戶。本文承襲前人經(jīng)驗(yàn),從微博及其惡意用戶行為研究入手,依照惡意用戶行為策略,對惡意用戶進(jìn)行了更為系統(tǒng)的分類。結(jié)合博弈論建立了正常用戶與惡意用戶之間的行為博弈模型,并以模型為基礎(chǔ)對微博用戶的謹(jǐn)慎程度進(jìn)行定量計(jì)算。通過謹(jǐn)慎度,強(qiáng)化了微博用戶行為特征對正常用戶和惡意用戶的區(qū)分能力。最后應(yīng)用基于置信度的多蟻群隨機(jī)游走(CARW)算法對惡意用戶進(jìn)行識別。本文的主要工作包括以下幾方面:首先,本文針對當(dāng)前惡意用戶分類不夠清晰的現(xiàn)狀,對惡意用戶類型進(jìn)行了更為系統(tǒng)的劃分。研究過程中,通過更為多樣的途徑對微博中的惡意用戶樣本及相關(guān)數(shù)據(jù)進(jìn)行采集,經(jīng)過對用戶樣本在實(shí)施惡意行為過程中行為策略的觀察與研究,重新劃分惡意用戶的類型。在此基礎(chǔ)上,本文對各類用戶的行為特征進(jìn)行了定量分析和對比。隨后,為了應(yīng)對惡意用戶針對當(dāng)前識別方法做出的適應(yīng)性改變,本文利用博弈論建立了正常用戶與惡意用戶之間的行為博弈模型,并通過行為博弈模型對用戶的謹(jǐn)慎度進(jìn)行了求解。利用謹(jǐn)慎度對用戶的行為特征進(jìn)行調(diào)整,有效抵消了惡意用戶通過模仿普通用戶行為對一般識別方法帶來的干擾。通過實(shí)驗(yàn)證明,利用通過用戶行為博弈模型求解出的謹(jǐn)慎度有效提高了識別算法的性能,綜合提高比例達(dá)到5%。最后,針對傳統(tǒng)惡意用戶識別方法不能夠?qū)阂庥脩暨M(jìn)行多類分類的不足,本文在使用謹(jǐn)慎度對用戶行為特征調(diào)整的基礎(chǔ)上,采用CARW算法對微博中惡意用戶進(jìn)行識別。實(shí)驗(yàn)結(jié)果證明,算法不僅能夠有效識別出微博中的惡意用戶,還能夠?qū)ζ渌鶎俚挠脩纛愋瓦M(jìn)行歸類。其中將惡意用戶正確歸類的準(zhǔn)確率可以達(dá)到50%以上,識別出惡意用戶的準(zhǔn)確率接近90%。
【關(guān)鍵詞】:微博 惡意用戶識別 博弈論 用戶關(guān)系 蟻群算法 機(jī)器學(xué)習(xí)
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.09
【目錄】:
- 致謝5-6
- 摘要6-8
- ABSTRACT8-13
- 1 緒論13-18
- 1.1 研究背景13-14
- 1.2 研究意義14-15
- 1.3 國內(nèi)外研究現(xiàn)狀15-17
- 1.4 論文主要內(nèi)容17-18
- 2 主要技術(shù)和基本理論18-30
- 2.1 微博基礎(chǔ)研究18-21
- 2.1.1 微博相關(guān)概念18-19
- 2.1.2 微博的傳播特點(diǎn)19
- 2.1.3 微博社交模式19-21
- 2.2 博弈論基礎(chǔ)研究21-23
- 2.2.1 博弈論相關(guān)概念21
- 2.2.2 博弈論的分類21-22
- 2.2.3 博弈論的相關(guān)定義22-23
- 2.3 機(jī)器學(xué)習(xí)23-27
- 2.3.1 基本概念23-24
- 2.3.2 支持向量機(jī)24-26
- 2.3.3 基于隨機(jī)游走的標(biāo)簽分類26-27
- 2.4 蟻群算法27-28
- 2.5 本章小結(jié)28-30
- 3 微博惡意用戶行為策略研究30-39
- 3.1 微博用戶樣本收集30-33
- 3.1.1 建立主動型微博蜜罐30-31
- 3.1.2 使用爬蟲程序31-32
- 3.1.3 購買粉絲32
- 3.1.4 關(guān)鍵詞搜索32-33
- 3.2 惡意用戶分類33-34
- 3.2.1 激進(jìn)策略惡意用戶33-34
- 3.2.2 謹(jǐn)慎策略惡意用戶34
- 3.3 惡意用戶特征分析34-38
- 3.4 本章小結(jié)38-39
- 4 基于博弈論的微博用戶謹(jǐn)慎度39-54
- 4.1 謹(jǐn)慎度39-40
- 4.2 用戶行為博弈模型40-44
- 4.3 基于謹(jǐn)慎度的用戶行為博弈模型44-45
- 4.4 用戶謹(jǐn)慎度的求解45-46
- 4.5 基于謹(jǐn)慎度的參數(shù)調(diào)整46-49
- 4.5.1 響應(yīng)率47-48
- 4.5.2 聚類系數(shù)48-49
- 4.6 相關(guān)實(shí)驗(yàn)與結(jié)果分析49-52
- 4.7 本章小結(jié)52-54
- 5 基于CARW算法的微博惡意用戶識別54-74
- 5.1 群體隨機(jī)游走算法框架搭建54-57
- 5.1.1 微博惡意用戶識別問題刻畫54-56
- 5.1.2 群體隨機(jī)游走模型56-57
- 5.2 微博用戶關(guān)系強(qiáng)度57-62
- 5.2.1 鏈接相關(guān)度58-59
- 5.2.2 文本相似度59-60
- 5.2.3 行為相似度60-61
- 5.2.4 微博用戶關(guān)系強(qiáng)度61-62
- 5.3 基于置信度的多蟻群隨機(jī)游走分類算法62-69
- 5.3.1 多蟻群隨機(jī)游走建模62-64
- 5.3.2 多蟻群隨機(jī)游走分類算法64-68
- 5.3.3 基于置信度的多蟻群隨機(jī)游走68-69
- 5.4 利用CARW算法識別微博惡意用戶69-71
- 5.5 相關(guān)實(shí)驗(yàn)與結(jié)果分析71-73
- 5.6 本章小結(jié)73-74
- 6 總結(jié)與展望74-75
- 參考文獻(xiàn)75-79
- 作者簡歷及攻讀碩士學(xué)位期間取得的研究成果79-81
- 學(xué)位論文數(shù)據(jù)集81
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 志宏;用戶識別與信息驗(yàn)證的一種方法[J];通信保密;1983年01期
2 傅山鋮;李燕寅;趙振煜;王詩云;;關(guān)于空巢老人手機(jī)用戶識別的方法初探[J];電子世界;2014年01期
3 ;如何解除手機(jī)自鎖[J];家庭科技;2000年09期
4 ;手機(jī)自鎖如何解[J];廣西質(zhì)量監(jiān)督導(dǎo)報(bào);2001年04期
5 文堯;;偷懶也可做慈善[J];成功營銷;2011年11期
6 葉娜;趙銀亮;邊根慶;李健;何箐;;模式無關(guān)的社交網(wǎng)絡(luò)用戶識別算法[J];西安交通大學(xué)學(xué)報(bào);2013年12期
7 ;貝加萊 便于用戶識別的RFID技術(shù)[J];自動化博覽;2010年10期
8 李煊,莊鎮(zhèn)泉;Web訪問挖掘預(yù)處理的用戶識別算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年07期
9 湯偉;黃培磊;陳璐藝;林祥;;基于行為分析的Web日志用戶識別算法[J];軟件產(chǎn)業(yè)與工程;2013年06期
10 陳亮輝;胡捍英;;基于MCMC的CDMA系統(tǒng)聯(lián)合激活用戶識別和信道估計(jì)[J];數(shù)據(jù)采集與處理;2009年04期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 童建剛;;計(jì)算機(jī)用戶識別技術(shù)[A];第三次全國計(jì)算機(jī)安全技術(shù)交流會論文集[C];1988年
2 孫偉;周燦;徐春虎;房晨婕;張超;李占先;嚴(yán)純?nèi)A;;構(gòu)筑具有用戶識別能力的分子計(jì)算平臺[A];中國化學(xué)會第26屆學(xué)術(shù)年會無機(jī)與配位化學(xué)分會場論文集[C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前2條
1 趙慧玲 吳江;VPN放心用[N];中國計(jì)算機(jī)報(bào);2001年
2 劉春輝;加強(qiáng)“標(biāo)識的唯一性”研究為下一代網(wǎng)服務(wù)[N];人民郵電;2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李楠;軟件產(chǎn)品創(chuàng)新中的領(lǐng)先用戶識別研究[D];東北財(cái)經(jīng)大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 趙建勛;微博惡意用戶識別[D];北京交通大學(xué);2016年
2 魏聰;互聯(lián)網(wǎng)訪問數(shù)據(jù)用戶識別與興趣度分析[D];東華大學(xué);2015年
3 沈昌干;運(yùn)營商數(shù)據(jù)管理平臺中的獨(dú)立用戶識別研究[D];東華大學(xué);2015年
4 陳媛媛;移動通信系統(tǒng)中校園用戶精確識別與細(xì)分研究[D];重慶大學(xué);2010年
5 何榮華;智能云電視的用戶識別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2014年
6 李桐;消費(fèi)類軟件產(chǎn)品的領(lǐng)先用戶識別研究[D];東北財(cái)經(jīng)大學(xué);2013年
7 李福明;基于海量信令數(shù)據(jù)的服務(wù)業(yè)線上活躍用戶識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
8 李麗欣;微博群體網(wǎng)絡(luò)結(jié)構(gòu)及其核心用戶識別[D];哈爾濱工業(yè)大學(xué);2014年
,本文編號:948149
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/948149.html