社交網(wǎng)絡(luò)中的用戶(hù)行為特征分析與挖掘
發(fā)布時(shí)間:2017-09-17 10:41
本文關(guān)鍵詞:社交網(wǎng)絡(luò)中的用戶(hù)行為特征分析與挖掘
更多相關(guān)文章: 社交網(wǎng)絡(luò) 微博用戶(hù)行為 spam問(wèn)題 支持向量機(jī)
【摘要】:可以說(shuō)自從有了人類(lèi)以來(lái)就產(chǎn)生了社交網(wǎng)絡(luò),而研究人類(lèi)在社交網(wǎng)絡(luò)中的行為模式與相互作用原理一直是學(xué)術(shù)界的熱門(mén)領(lǐng)域。然而針對(duì)真實(shí)的人類(lèi)社交網(wǎng)絡(luò),由于數(shù)據(jù)采集、試驗(yàn)困難等的限制,對(duì)社交網(wǎng)絡(luò)的研究一直停留在定性分析的層面。各種在線(xiàn)社交應(yīng)用的流行帶來(lái)了數(shù)據(jù)量的激增,海量的用戶(hù)行為數(shù)據(jù)被記錄下來(lái)。這為我們更好的研究社交網(wǎng)絡(luò)中的人類(lèi)行為帶來(lái)了便利。 本文以復(fù)雜網(wǎng)絡(luò)理論為基礎(chǔ),以新浪微博平臺(tái)為數(shù)據(jù)來(lái)源,從宏觀(guān)層面和微觀(guān)層面對(duì)微博用戶(hù)的行為特征進(jìn)行了分析。宏觀(guān)層面上對(duì)微博用戶(hù)行為產(chǎn)生的用戶(hù)網(wǎng)絡(luò)特征進(jìn)行了實(shí)證統(tǒng)計(jì)研究,驗(yàn)證了微博網(wǎng)絡(luò)的小世界特性和無(wú)標(biāo)度特性,與復(fù)雜網(wǎng)絡(luò)特性相吻合,奠定了后續(xù)研究的基礎(chǔ);微觀(guān)層面上對(duì)微博用戶(hù)的個(gè)體屬性,發(fā)微博行為和微博轉(zhuǎn)發(fā)行為進(jìn)行了實(shí)證分析,并通過(guò)對(duì)比分析,對(duì)微博上spam用戶(hù)的行為進(jìn)行建模。然后首次提出了利用增量學(xué)習(xí)的支持向量機(jī)(I-SVM)算法結(jié)合spam用戶(hù)行為模型對(duì)其進(jìn)行動(dòng)態(tài)檢測(cè)的方法,并進(jìn)行實(shí)驗(yàn)驗(yàn)證了該方法的有效性。 實(shí)驗(yàn)表明此方法準(zhǔn)確率高,并且可以有效應(yīng)對(duì)spam用戶(hù)行為的動(dòng)態(tài)性問(wèn)題。而且基于支持向量機(jī)算法對(duì)數(shù)據(jù)維度不敏感的優(yōu)點(diǎn),此方法的運(yùn)行效率高,可以應(yīng)對(duì)大規(guī)模數(shù)據(jù)集的處理。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 微博用戶(hù)行為 spam問(wèn)題 支持向量機(jī)
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-15
- 1.1 研究背景及意義9-11
- 1.2 研究現(xiàn)狀11-12
- 1.3 本文的主要研究工作12-13
- 1.4 本文的組織結(jié)構(gòu)13-15
- 第二章 社交網(wǎng)絡(luò)中的用戶(hù)行為模型15-29
- 2.1 社交網(wǎng)絡(luò)宏觀(guān)特征分析理論15-18
- 2.1.1 度與度分布(Degree & Degree Distribution)15-16
- 2.1.2 平均路徑長(zhǎng)度(Mean Path Length)與網(wǎng)絡(luò)直徑(Network Diameter)16
- 2.1.3 聚類(lèi)系數(shù)(Clustering Coefficient)16-17
- 2.1.4 介數(shù)(Betweenness)17
- 2.1.5 度相關(guān)性(Degree Correlation)17-18
- 2.2 社交網(wǎng)絡(luò)模型18-21
- 2.2.1 規(guī)則網(wǎng)絡(luò)18
- 2.2.2 ER隨機(jī)圖18-19
- 2.2.3 WS小世界網(wǎng)絡(luò)模型19-20
- 2.2.4 BA無(wú)標(biāo)度網(wǎng)絡(luò)20-21
- 2.3 社交網(wǎng)絡(luò)用戶(hù)行為研究21-23
- 2.3.1 用戶(hù)行為的實(shí)證統(tǒng)計(jì)研究21-22
- 2.3.2 用戶(hù)行為的模型理論研究22-23
- 2.4 社交網(wǎng)絡(luò)中spam行為分析23-26
- 2.5 社交網(wǎng)絡(luò)上spam問(wèn)題的檢測(cè)方法26-28
- 2.5.1 微博平臺(tái)的反spam問(wèn)題機(jī)制26-27
- 2.5.2 基于微博內(nèi)容的檢測(cè)方法27
- 2.5.3 基于微博用戶(hù)分析的檢測(cè)方法27-28
- 2.6 本章小結(jié)28-29
- 第三章 微博網(wǎng)絡(luò)用戶(hù)行為實(shí)證研究29-47
- 3.1 數(shù)據(jù)集采集與存儲(chǔ)29-38
- 3.1.1 數(shù)據(jù)集獲取29-30
- 3.1.2 抓取系統(tǒng)30-32
- 3.1.3 數(shù)據(jù)結(jié)構(gòu)化與存儲(chǔ)32-34
- 3.1.4 數(shù)據(jù)預(yù)處理34-35
- 3.1.5 數(shù)據(jù)全文檢索35-38
- 3.2 新浪微博網(wǎng)絡(luò)的網(wǎng)絡(luò)特性分析38-41
- 3.2.1 新浪微博的無(wú)標(biāo)度特性分析39-40
- 3.2.2 新浪微博網(wǎng)絡(luò)的小世界特性分析40-41
- 3.3 新浪微博用戶(hù)行為實(shí)證分析41-46
- 3.3.1 新浪微博用戶(hù)發(fā)微博行為實(shí)證分析41-42
- 3.3.2 新浪微博用戶(hù)的微博轉(zhuǎn)發(fā)行為實(shí)證分析42-46
- 3.4 本章小結(jié)46-47
- 第四章 新浪微博用戶(hù)行為研究與SPAM用戶(hù)檢測(cè)47-61
- 4.1 微博spam用戶(hù)行為模式分析與特征向量提取47-52
- 4.2 支持向量機(jī)(Support Vector Machine)52-55
- 4.2.1 線(xiàn)性可分支持向量機(jī)52-54
- 4.2.2 非線(xiàn)性支持向量機(jī)54
- 4.2.3 常用的核函數(shù)54-55
- 4.3 支持向量機(jī)的增量學(xué)習(xí)55-56
- 4.4 spam用戶(hù)檢測(cè)系統(tǒng)56-58
- 4.5 測(cè)試與實(shí)驗(yàn)分析58-59
- 4.6 本章小結(jié)59-61
- 第五章 總結(jié)和下一步工作61-63
- 5.1 全文總結(jié)61
- 5.2 下一步工作展望61-63
- 參考文獻(xiàn)63-65
- 致謝65-67
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄67
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 李楠楠;周濤;張寧;;人類(lèi)動(dòng)力學(xué)基本概念與實(shí)證分析[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2008年02期
2 李楠楠;張寧;周濤;;人類(lèi)通信模式中基于時(shí)間統(tǒng)計(jì)的實(shí)證研究[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2008年03期
3 汪秉宏;韓筱璞;;人類(lèi)行為的動(dòng)力學(xué)與統(tǒng)計(jì)力學(xué)研究[J];物理;2010年01期
,本文編號(hào):868975
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/868975.html
最近更新
教材專(zhuān)著