天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機器學習的社交網(wǎng)絡(luò)用戶特征分析

發(fā)布時間:2017-10-23 14:18

  本文關(guān)鍵詞:基于機器學習的社交網(wǎng)絡(luò)用戶特征分析


  更多相關(guān)文章: 用戶特征分析 機器學習 譜聚類 復(fù)雜網(wǎng)絡(luò) 信息傳播


【摘要】:Web2.0時代的到來使得社交網(wǎng)絡(luò)日益普及,社交網(wǎng)絡(luò)中的海量數(shù)據(jù)蘊藏了無限寶藏等待挖掘。社交網(wǎng)絡(luò)形態(tài)多樣且技術(shù)日新月異,大數(shù)據(jù)趨勢成為必然,運用先進技術(shù)手段對網(wǎng)絡(luò)中的數(shù)據(jù)進行訓練學習是現(xiàn)實的要求。 由于社交網(wǎng)絡(luò)發(fā)展迅猛,傳統(tǒng)的網(wǎng)絡(luò)研究方法、成果等不再適用。在對社交網(wǎng)絡(luò)用戶進行分析時,大多數(shù)研究僅集中于用戶某一方面的特征,如行為時間間隔特征等。鑒于此,本文著眼于個體用戶的屬性、信息、關(guān)系三方面特征對社交網(wǎng)絡(luò)中的用戶特征進行了全面的分析。進一步借助機器學習中較為先進的譜聚類算法對所采集的微博實際數(shù)據(jù)進行了無監(jiān)督學習。 論文基于社交網(wǎng)絡(luò)研究多學科交叉結(jié)合的特點,采用機器學習、文本處理等手段對以微博為代表的社交網(wǎng)絡(luò)平臺整體特性、用戶信息傳播特征、用戶行為特征、屬性特征、關(guān)系特征、文本特征進行綜合研究?梢暬治鍪谴髷(shù)據(jù)時代對數(shù)據(jù)進行分析的必然要求,本文對社交網(wǎng)絡(luò)用戶特征分析時實現(xiàn)了網(wǎng)絡(luò)特性的可視化。 論文完成的主要工作包括:在圖論、復(fù)雜網(wǎng)絡(luò)研究、經(jīng)典病毒傳播模型、人類動力學傳播模型等理論基礎(chǔ)上研究了社交網(wǎng)絡(luò)特性;利用Gephi實現(xiàn)了社交網(wǎng)絡(luò)特征可視化;建立了SEIR微博信息傳播模型;為微博用戶建立了興趣驅(qū)動的用戶交互動力學模型;同時,論文采集了微博平臺中用戶的實際數(shù)據(jù),利用LDA主題向量模型對采集的數(shù)據(jù)進行了處理,再進一步得到了用戶之間的相似矩陣,在此基礎(chǔ)上利用優(yōu)于K-means聚類等傳統(tǒng)聚類方法的譜聚類算法對樣本數(shù)據(jù)進行了興趣社區(qū)挖掘。通過理論推導(dǎo)和實證分析,論文全面地分析了微博社交平臺中用戶信息、屬性、關(guān)系、行為特征,對采集到的樣本用戶進行了基于興趣相似度的聚類,采用譜聚類對用戶相似興趣進行聚類時取得了較好的聚類效果。
【關(guān)鍵詞】:用戶特征分析 機器學習 譜聚類 復(fù)雜網(wǎng)絡(luò) 信息傳播
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.09;TP181
【目錄】:
  • 致謝5-6
  • 摘要6-7
  • ABSTRACT7-11
  • 1 引言11-15
  • 1.1 研究背景11
  • 1.2 選題意義11-12
  • 1.3 本論文的主要工作12-13
  • 1.4 本論文的組成結(jié)構(gòu)13-15
  • 2 相關(guān)理論基礎(chǔ)及國內(nèi)外研究現(xiàn)狀15-27
  • 2.1 復(fù)雜網(wǎng)絡(luò)15-19
  • 2.1.1 小世界特性15-18
  • 2.1.2 無標度特性18-19
  • 2.2 社交網(wǎng)絡(luò)分析19-21
  • 2.2.1 社交網(wǎng)絡(luò)19
  • 2.2.2 社交網(wǎng)絡(luò)研究的主要領(lǐng)域19-21
  • 2.3 社交網(wǎng)絡(luò)研究現(xiàn)狀21-23
  • 2.3.1 社交網(wǎng)絡(luò)信息研究現(xiàn)狀21-22
  • 2.3.2 社交網(wǎng)絡(luò)用戶研究現(xiàn)狀22-23
  • 2.4 機器學習23-25
  • 2.4.1 機器學習概念23-24
  • 2.4.2 監(jiān)督學習24-25
  • 2.4.3 無監(jiān)督學習25
  • 2.5 聚類及譜聚類算法研究現(xiàn)狀25-26
  • 2.6 本章小結(jié)26-27
  • 3 社交網(wǎng)絡(luò)整體特征及信息傳播分析27-46
  • 3.1 社交網(wǎng)絡(luò)整體特性及相關(guān)概念27-29
  • 3.2 社交網(wǎng)絡(luò)信息及經(jīng)典信息傳播模型29-33
  • 3.2.1 微博信息特性29-31
  • 3.2.2 經(jīng)典信息傳播模型31-33
  • 3.3 信息傳播動力學模型改進33-40
  • 3.3.1 微博平臺簡介34-35
  • 3.3.2 單信息傳播模型改進分析35-37
  • 3.3.3 單信息傳播模型改進37
  • 3.3.4 改進后的信息傳播動力學SEIR模型37-39
  • 3.3.5 改進后SEIR模型參數(shù)計算39-40
  • 3.4 社交網(wǎng)絡(luò)信息特性可視化分析40-45
  • 3.5 本章小結(jié)45-46
  • 4 微博平臺用戶特征分析46-57
  • 4.1 微博用戶行為特征研究46-47
  • 4.2 微博用戶行為動力學模型47-53
  • 4.2.1 任務(wù)隊列模型47-48
  • 4.2.2 興趣驅(qū)動模型48-49
  • 4.2.3 基于社會交互的模型49-50
  • 4.2.4 興趣驅(qū)動的用戶交互模型50-53
  • 4.3 用戶微博文本特征53-54
  • 4.3.1 詞向量54
  • 4.3.2 詞向量的訓練54
  • 4.4 微博用戶關(guān)系特征54-56
  • 4.5 本章小結(jié)56-57
  • 5. 基于相似性的用戶譜聚類分析57-70
  • 5.1 譜聚類57-59
  • 5.2 微博實證研究數(shù)據(jù)采集和預(yù)處理59-60
  • 5.3 用戶相似矩陣構(gòu)造60-63
  • 5.3.1 微博用戶文本LDA主題生成60-62
  • 5.3.2 相似性度量62-63
  • 5.4 基于相似度矩陣的譜聚類實現(xiàn)63-67
  • 5.5 用戶譜聚類效果分析67-68
  • 5.6 譜聚類意義探討68-69
  • 5.7 本章小結(jié)69-70
  • 6 總結(jié)與展望70-72
  • 參考文獻72-75
  • 索引75-77
  • 作者簡歷77-79
  • 學位論文數(shù)據(jù)集7

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 李林容;;社交網(wǎng)絡(luò)的特性及其發(fā)展趨勢[J];新聞界;2010年05期

2 陳琛;沙昊;;社交網(wǎng)絡(luò)的開放融合圖譜[J];通信世界;2010年48期

3 楊宇良;;網(wǎng)絡(luò)讓我們更遠還是更近[J];互聯(lián)網(wǎng)天地;2011年01期

4 陳昱;;社交網(wǎng)絡(luò)革命與國家安全關(guān)系[J];情報雜志;2011年S2期

5 勞倫·考克斯;;請在工作時更新你的狀態(tài)[J];科技創(chuàng)業(yè);2011年05期

6 斯蒂芬·卡斯;;在線社區(qū)能否解決隱私問題[J];科技創(chuàng)業(yè);2011年08期

7 陳云鵬;;電子商務(wù)引領(lǐng)社交網(wǎng)絡(luò)走進2.0時代[J];上海信息化;2012年01期

8 馬文剛;;智慧的物聯(lián)社交網(wǎng)絡(luò)[J];上海信息化;2012年03期

9 朱乾龍;張倩;杜娟;;我國社交網(wǎng)絡(luò)繁榮背后面臨深層次問題困擾[J];世界電信;2012年06期

10 劉華;;社交網(wǎng)絡(luò)的融合之路[J];軟件工程師;2012年07期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶的人格預(yù)測與關(guān)系強度研究[A];第七屆(2012)中國管理學年會商務(wù)智能分會場論文集(選編)[C];2012年

2 宮廣宇;李開軍;;對社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學科研究生學術(shù)論壇獲獎?wù)撐腫C];2010年

3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學生焦慮緩解[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術(shù)會議論文集[C];2013年

4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年

5 杜p,

本文編號:1083810


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1083810.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fa658***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com