基于標(biāo)簽傳播的社區(qū)發(fā)現(xiàn)算法的研究
本文關(guān)鍵詞:基于標(biāo)簽傳播的社區(qū)發(fā)現(xiàn)算法的研究
更多相關(guān)文章: 社區(qū)發(fā)現(xiàn) 標(biāo)簽傳播算法 節(jié)點(diǎn)相似度 關(guān)鍵節(jié)點(diǎn)
【摘要】:過去的十年時(shí)間見證了互聯(lián)網(wǎng)的快速發(fā)展和改變,許多的社交網(wǎng)絡(luò)媒體,包括博客、論壇、微博等一些社交媒體如雨后春筍般的出現(xiàn),這些社交網(wǎng)絡(luò)媒體把人們聚集在了一起并賦予了相互協(xié)作和相互交流新的形式。從數(shù)據(jù)挖掘的觀點(diǎn)來看,社交網(wǎng)絡(luò)由數(shù)量龐大的用戶以及用戶之間的聯(lián)系聚集到一起形成了一張巨大的由許多個(gè)社區(qū)構(gòu)成的網(wǎng)絡(luò)。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,社區(qū)發(fā)現(xiàn)技術(shù)正在迅速向前邁進(jìn)。在現(xiàn)實(shí)生活中,社區(qū)發(fā)現(xiàn)技術(shù)也得到了廣泛的應(yīng)用,例如,網(wǎng)上商店根據(jù)用戶的購物行為以及購物后的評(píng)論互動(dòng)的這些集體智慧來更加精確有效的推薦商品;政治運(yùn)動(dòng)也可以從社交網(wǎng)絡(luò)媒體所帶來的新的參與方式和協(xié)作方式中獲得利益;再比如微博中的某一個(gè)用戶散布了一個(gè)謠言,最后謠言信息在微博上病毒式地?cái)U(kuò)散,怎樣根據(jù)這樣一個(gè)信息的動(dòng)態(tài)傳遞而在最快時(shí)間內(nèi)找到造謠者或者怎樣利用社交網(wǎng)絡(luò)結(jié)構(gòu)更好的抑制謠言的傳播?這些實(shí)實(shí)在在的場景都需要社交網(wǎng)絡(luò)方面的知識(shí)來進(jìn)行社區(qū)發(fā)現(xiàn)。本文首先對(duì)社區(qū)發(fā)現(xiàn)技術(shù)以及相關(guān)理論進(jìn)行了介紹,主要包括數(shù)據(jù)抓取技術(shù)中的爬蟲技術(shù)、一些早期的比較經(jīng)典的社區(qū)發(fā)現(xiàn)算法以及有關(guān)于社區(qū)質(zhì)量評(píng)價(jià)的一些方法,并對(duì)原始的標(biāo)簽傳播算法進(jìn)行了比較透徹的研究,標(biāo)簽傳播算法與其它一些社區(qū)發(fā)現(xiàn)算法相比,具有計(jì)算簡單和容易實(shí)現(xiàn)的優(yōu)點(diǎn)以致于標(biāo)簽傳播算法被廣泛的利用。但是基本的標(biāo)簽傳播算法存在穩(wěn)定性低的問題,為了解決這種由隨機(jī)選擇最大數(shù)目標(biāo)簽的節(jié)點(diǎn)而引起的不穩(wěn)定性的問題,這篇文章提出了基于節(jié)點(diǎn)相似度的標(biāo)簽傳播算法和基于關(guān)鍵節(jié)點(diǎn)的標(biāo)簽傳播算法,并將基于節(jié)點(diǎn)相似度的標(biāo)簽傳播算法和基于關(guān)鍵節(jié)點(diǎn)的標(biāo)簽傳播算法對(duì)dolphins、lesmis、polbooks、football以及所采集的豆瓣數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),通過實(shí)驗(yàn)結(jié)果,我們驗(yàn)證了基于節(jié)點(diǎn)相似度的標(biāo)簽傳播算法和基于關(guān)鍵節(jié)點(diǎn)的標(biāo)簽傳播算法對(duì)于基本的標(biāo)簽傳播算法中的穩(wěn)定性不足的問題有所改進(jìn)。
【關(guān)鍵詞】:社區(qū)發(fā)現(xiàn) 標(biāo)簽傳播算法 節(jié)點(diǎn)相似度 關(guān)鍵節(jié)點(diǎn)
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.09;TP311.13
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 符號(hào)對(duì)照表10-11
- 縮略語對(duì)照表11-14
- 第一章 緒論14-20
- 1.1 研究背景14-15
- 1.2 研究意義15-16
- 1.3 研究現(xiàn)狀16-17
- 1.4 本文的組織結(jié)構(gòu)17-20
- 第二章 復(fù)雜網(wǎng)絡(luò)處理相關(guān)技術(shù)及理論20-32
- 2.1 爬蟲技術(shù)20-22
- 2.1.1 防止被Ban處理20-21
- 2.1.2 模擬登錄和Cookie處理21-22
- 2.1.3 驗(yàn)證碼處理22
- 2.1.4 數(shù)據(jù)抽取技術(shù)22
- 2.1.5 其他爬蟲擴(kuò)展技術(shù)22
- 2.2 社區(qū)定義22-24
- 2.2.1 社交網(wǎng)絡(luò)特點(diǎn)23-24
- 2.3 圖論基礎(chǔ)知識(shí)24-25
- 2.4 傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法25-27
- 2.4.1 GN算法25-26
- 2.4.2 FN算法26
- 2.4.3 KL算法26-27
- 2.5 標(biāo)簽傳播算法27-29
- 2.6 社區(qū)質(zhì)量評(píng)價(jià)29-31
- 2.6.1 模塊度29-30
- 2.6.2 聚密度30
- 2.6.3 聚類系數(shù)30-31
- 2.6.4 互信息31
- 2.7 本章小結(jié)31-32
- 第三章 改進(jìn)的標(biāo)簽傳播算法32-44
- 3.1 原始的標(biāo)簽傳播算法存在的問題32-33
- 3.2 基于節(jié)點(diǎn)相似度的標(biāo)簽傳播算法33-36
- 3.2.1 節(jié)點(diǎn)相似度33-34
- 3.2.2 算法實(shí)現(xiàn)34-35
- 3.2.3 算法分析35-36
- 3.3 基于關(guān)鍵節(jié)點(diǎn)的標(biāo)簽傳播算法36-43
- 3.3.1 PageRank排序算法36-37
- 3.3.2 簡單PageRank計(jì)算37-39
- 3.3.3 LeaderRank排序算法39-40
- 3.3.4 簡單LeaderRank計(jì)算40
- 3.3.5 關(guān)鍵的K個(gè)節(jié)點(diǎn)的選擇40-42
- 3.3.6 標(biāo)簽傳播的改進(jìn)42-43
- 3.4 本章小結(jié)43-44
- 第四章 實(shí)驗(yàn)及結(jié)果分析44-62
- 4.1 實(shí)驗(yàn)相關(guān)數(shù)據(jù)集44-46
- 4.1.1 真實(shí)網(wǎng)絡(luò)數(shù)據(jù)集44-45
- 4.1.2 人工抓取數(shù)據(jù)集45-46
- 4.2 NSLPA結(jié)果分析46-52
- 4.2.1 對(duì)dolphins數(shù)據(jù)集進(jìn)行測試46
- 4.2.2 對(duì)dolphins數(shù)據(jù)集模塊度評(píng)價(jià)46-47
- 4.2.3 對(duì)dolphins數(shù)據(jù)集聚密度評(píng)價(jià)47-49
- 4.2.4 對(duì)football、lesmis、polbooks數(shù)據(jù)集進(jìn)行測試49-51
- 4.2.5 NSLPA對(duì)豆瓣數(shù)據(jù)集測試和評(píng)價(jià)51-52
- 4.3 KNLPA結(jié)果分析52-60
- 4.3.1 對(duì)dolphins等數(shù)據(jù)集的測試53-60
- 4.4 本章小結(jié)60-62
- 第五章 工作總結(jié)與展望62-64
- 5.1 主要工作62-63
- 5.2 工作展望63-64
- 參考文獻(xiàn)64-66
- 致謝66-68
- 作者簡介68
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 王娜;李霞;徐紅英;;社會(huì)網(wǎng)絡(luò)分析之社區(qū)發(fā)現(xiàn)研究[J];深圳大學(xué)學(xué)報(bào)(理工版);2014年01期
2 康旭彬;賈彩燕;;一種改進(jìn)的標(biāo)簽傳播快速社區(qū)發(fā)現(xiàn)方法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
3 金弟;楊博;劉杰;劉大有;何東曉;;復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)探測——基于隨機(jī)游走的蟻群算法[J];軟件學(xué)報(bào);2012年03期
4 淦文燕;赫南;李德毅;王建民;;一種基于拓?fù)鋭莸木W(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法[J];軟件學(xué)報(bào);2009年08期
5 譚躍進(jìn);吳俊;鄧宏鐘;;復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要度評(píng)估的節(jié)點(diǎn)收縮方法[J];系統(tǒng)工程理論與實(shí)踐;2006年11期
,本文編號(hào):722205
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/722205.html