天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于連接強(qiáng)度的用戶社區(qū)劃分算法及應(yīng)用研究

發(fā)布時(shí)間:2017-08-04 20:28

  本文關(guān)鍵詞:基于連接強(qiáng)度的用戶社區(qū)劃分算法及應(yīng)用研究


  更多相關(guān)文章: 數(shù)據(jù)挖掘 聚類(lèi)分析 社區(qū)劃分 興趣相似度 連接關(guān)注度


【摘要】:近年來(lái),社交網(wǎng)絡(luò)進(jìn)入了井噴式的發(fā)展,正在悄然改變著人們的生活方式和社交習(xí)慣。社交網(wǎng)絡(luò)是一個(gè)可供消息快速流通的重要媒介,人們可以通過(guò)社交網(wǎng)絡(luò)獲取一些重要的即時(shí)信息。面對(duì)社交網(wǎng)絡(luò)中的海量信息,如何使用有效的挖掘技術(shù)發(fā)現(xiàn)龐大數(shù)據(jù)背后隱藏的潛在有用知識(shí),對(duì)處于信息時(shí)代的我們有至關(guān)重要的意義。研究發(fā)現(xiàn),復(fù)雜的社交網(wǎng)絡(luò)中存在類(lèi)似于真實(shí)社會(huì)的社區(qū)結(jié)構(gòu),準(zhǔn)確高效地識(shí)別這些社區(qū)結(jié)構(gòu)已成為了社交網(wǎng)絡(luò)近年來(lái)的一個(gè)研究熱點(diǎn)。傳統(tǒng)的社交網(wǎng)絡(luò)社區(qū)識(shí)別算法主要分為以節(jié)點(diǎn)屬性進(jìn)行劃分和節(jié)點(diǎn)間連接強(qiáng)度進(jìn)行劃分兩大類(lèi)。前者將個(gè)體節(jié)點(diǎn)看成毫無(wú)關(guān)聯(lián)的孤立點(diǎn),忽略了信息傳播過(guò)程中個(gè)體與周?chē)?jié)點(diǎn)的連接關(guān)系;后者忽略了節(jié)點(diǎn)的內(nèi)在屬性,劃分出的社區(qū)用戶相似度不高。針對(duì)上述情況,本文研究了幾種比較經(jīng)典的社交網(wǎng)絡(luò)社區(qū)劃分算法,分析了這些算法的思想和不足,結(jié)合Net Scan算法提出了一種基于連接強(qiáng)度的興趣相似用戶社區(qū)劃分算法,并在開(kāi)源數(shù)據(jù)挖掘平臺(tái)Weka實(shí)現(xiàn)了微博用戶社區(qū)劃分實(shí)驗(yàn)。本文所做工作如下:1.對(duì)微博用戶關(guān)系進(jìn)行分類(lèi),提出單向用戶行為和雙向用戶行為的概念,并應(yīng)用于節(jié)點(diǎn)連接度計(jì)算;2.改進(jìn)Page Rank模型,提出適用于微博網(wǎng)絡(luò)結(jié)構(gòu)的Indirect Link Rank模型,用以計(jì)算間接連接節(jié)點(diǎn)的連接強(qiáng)度;3.基于Net Scan算法同時(shí)考慮節(jié)點(diǎn)屬性和節(jié)點(diǎn)間連接關(guān)系的思想,改進(jìn)其只考慮連接關(guān)系的存在性而未解決連接屬性利用的不足,提出了基于連接強(qiáng)度的興趣相似社區(qū)劃分算法LBI,用節(jié)點(diǎn)間的連接強(qiáng)度代替Net Scan算法中以節(jié)點(diǎn)的屬性距離為半徑的自動(dòng)搜索方式,節(jié)點(diǎn)屬性則用于度量節(jié)點(diǎn)間內(nèi)在的興趣相似性,劃分出以最強(qiáng)連接和相似興趣聚集的用戶社區(qū)。4.擴(kuò)展Weka過(guò)濾器,使之能對(duì)中文文本進(jìn)行過(guò)濾、分詞、距離度量,實(shí)現(xiàn)微博數(shù)據(jù)預(yù)處理;設(shè)計(jì)的LBI聚類(lèi)器實(shí)現(xiàn)了微博用戶的社區(qū)劃分。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 聚類(lèi)分析 社區(qū)劃分 興趣相似度 連接關(guān)注度
【學(xué)位授予單位】:蘭州理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:O157.5;TP311.13
【目錄】:
  • 摘要7-8
  • Abstract8-12
  • 第1章 緒論12-16
  • 1.1 研究背景與意義12-13
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀13-14
  • 1.3 論文的主要研究?jī)?nèi)容14-15
  • 1.4 論文的組織結(jié)構(gòu)與安排15-16
  • 第2章 預(yù)備知識(shí)與相關(guān)算法16-24
  • 2.1 數(shù)據(jù)挖掘概述16-21
  • 2.1.1 數(shù)據(jù)挖掘的方法和過(guò)程16-18
  • 2.1.2 聚類(lèi)概述18-20
  • 2.1.3 經(jīng)典聚類(lèi)算法—K-Means算法20-21
  • 2.2 社交網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法21-23
  • 2.2.1 社區(qū)發(fā)現(xiàn)算法概述21-22
  • 2.2.2 Net SCAN算法介紹22-23
  • 2.3 本章小結(jié)23-24
  • 第3章 基于連接強(qiáng)度的興趣相似用戶社區(qū)聚類(lèi)算法24-32
  • 3.1 模型和相關(guān)定義24-27
  • 3.1.1 有向信息圖模型24
  • 3.1.2 微博數(shù)據(jù)分類(lèi)24
  • 3.1.3 連接關(guān)注度24-26
  • 3.1.4 節(jié)點(diǎn)中心度26-27
  • 3.2 輪廓系數(shù)27
  • 3.3 基于連接強(qiáng)度的相似用戶社區(qū)劃分算法27-31
  • 3.3.1 微博關(guān)系數(shù)據(jù)分析及中心節(jié)點(diǎn)的選取27-30
  • 3.3.2 節(jié)點(diǎn)劃分及社區(qū)合并30-31
  • 3.4 本章小結(jié)31-32
  • 第4章 Weka數(shù)據(jù)挖掘平臺(tái)介紹及實(shí)驗(yàn)環(huán)境搭建32-39
  • 4.1 數(shù)據(jù)挖掘平臺(tái)概述32-33
  • 4.2 Weka數(shù)據(jù)挖掘平臺(tái)33-38
  • 4.2.1 Weka圖像界面33-36
  • 4.2.2 Weka訪問(wèn)數(shù)據(jù)庫(kù)36-38
  • 4.3 Weka在My Eclipse中的部署38
  • 4.4 本章小結(jié)38-39
  • 第5章 基于Weka平臺(tái)擴(kuò)展和數(shù)據(jù)預(yù)處理39-52
  • 5.1 Weka數(shù)據(jù)預(yù)處理技術(shù)39
  • 5.2 Weka過(guò)濾器擴(kuò)展39-51
  • 5.2.1 Weka過(guò)濾器分析39-42
  • 5.2.2 Weka過(guò)濾器的工作原理42-45
  • 5.2.3 Weka過(guò)濾器的擴(kuò)展方法45-46
  • 5.2.4 根據(jù)實(shí)驗(yàn)數(shù)據(jù)預(yù)處理要求擴(kuò)展Weka過(guò)濾器46-51
  • 5.3 本章小結(jié)51-52
  • 第6章 實(shí)驗(yàn)及結(jié)果分析52-64
  • 6.1 用戶興趣相似性計(jì)算52-57
  • 6.1.1 Weka集成中文分詞器IKAnalyzer52-53
  • 6.1.2 IK分詞器提取博文主題詞53-56
  • 6.1.3 戶興趣相似性度量56-57
  • 6.2 連接關(guān)系處理及參數(shù)選擇57-59
  • 6.2.1 建立連接數(shù)據(jù)關(guān)系57-58
  • 6.2.2 連接參數(shù)選取58-59
  • 6.2.3 初始化連接強(qiáng)度59
  • 6.3 實(shí)驗(yàn)及結(jié)果分析59-63
  • 6.3.1 實(shí)驗(yàn)數(shù)據(jù)介紹59-60
  • 6.3.2 K、L選擇及實(shí)驗(yàn)分析60-63
  • 6.4 本章小結(jié)63-64
  • 總結(jié)與展望64-65
  • 參考文獻(xiàn)65-69
  • 致謝69-70
  • 附錄A 攻讀學(xué)位期間所發(fā)表論文70

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 王夢(mèng)雪;;數(shù)據(jù)挖掘綜述[J];軟件導(dǎo)刊;2013年10期

2 李孝偉;陳福才;劉力雄;;一種融合節(jié)點(diǎn)與鏈接屬性的社交網(wǎng)絡(luò)社區(qū)劃分算法[J];計(jì)算機(jī)應(yīng)用研究;2013年05期

3 苗苗苗;王玉英;;基于矩陣壓縮的Apriori算法改進(jìn)的研究[J];計(jì)算機(jī)工程與應(yīng)用;2013年01期

4 郝文寧;馮波;陳剛;靳大尉;趙水寧;;基于領(lǐng)域本體的文檔向量空間模型構(gòu)建[J];計(jì)算機(jī)應(yīng)用研究;2013年03期

5 黃宇達(dá);范太華;;決策樹(shù)ID3算法的分析與優(yōu)化[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年08期

6 周濤;陸惠玲;;數(shù)據(jù)挖掘中聚類(lèi)算法研究進(jìn)展[J];計(jì)算機(jī)工程與應(yīng)用;2012年12期

7 林友芳;王天宇;唐銳;周元煒;黃厚寬;;一種有效的社會(huì)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)模型和算法[J];計(jì)算機(jī)研究與發(fā)展;2012年02期

8 常鵬;馬輝;;高效的短文本主題詞抽取方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年20期

9 李良;米智偉;向新;;基于FP-Growth的戰(zhàn)略績(jī)效關(guān)聯(lián)分析算法研究[J];微計(jì)算機(jī)應(yīng)用;2011年02期

10 夏寧霞;蘇一丹;覃希;;一種高效的K-medoids聚類(lèi)算法[J];計(jì)算機(jī)應(yīng)用研究;2010年12期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 王明星;數(shù)據(jù)挖掘算法優(yōu)化研究與應(yīng)用[D];安徽大學(xué);2014年

2 宮愛(ài)愛(ài);企業(yè)級(jí)云應(yīng)用開(kāi)發(fā)平臺(tái)的研究[D];中國(guó)海洋大學(xué);2013年

3 黃翼彪;開(kāi)源中文分詞器的比較研究[D];鄭州大學(xué);2013年

4 鄒琴;動(dòng)態(tài)社交網(wǎng)絡(luò)中社區(qū)劃分算法研究[D];華中科技大學(xué);2012年

5 陳希;基于R語(yǔ)言數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)客戶細(xì)分研究[D];北京郵電大學(xué);2011年

6 包穎;基于劃分的聚類(lèi)算法研究與應(yīng)用[D];大連理工大學(xué);2008年

7 馬飛;數(shù)據(jù)挖掘中的聚類(lèi)算法研究[D];南京理工大學(xué);2008年

8 蘇振魁;基于馬爾科夫模型的文本相似度研究[D];大連理工大學(xué);2007年

9 王鑫;數(shù)據(jù)挖掘中聚類(lèi)分析算法的研究[D];山東師范大學(xué);2006年

10 李艷環(huán);人工神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘中的應(yīng)用[D];重慶大學(xué);2004年

,

本文編號(hào):621554

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/621554.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶57c71***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com