基于矩陣分解的重疊社區(qū)探測研究
本文關(guān)鍵詞:基于矩陣分解的重疊社區(qū)探測研究,由筆耕文化傳播整理發(fā)布。
【摘要】:復(fù)雜網(wǎng)絡(luò)是對現(xiàn)實世界系統(tǒng)的抽象。現(xiàn)實世界的個體被抽象為復(fù)雜網(wǎng)絡(luò)的節(jié)點,個體之間的聯(lián)系被抽象為按某種規(guī)則連接的邊。經(jīng)過大量實驗證明,復(fù)雜網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)不同,具有小世界性、無標(biāo)度性和結(jié)構(gòu)性。復(fù)雜網(wǎng)絡(luò)的節(jié)點成簇狀分布,每一個簇成為一個社區(qū)。社區(qū)是由具有相同背景或者相似屬性的節(jié)點組成。社區(qū)結(jié)構(gòu)普遍存在于現(xiàn)實世界的復(fù)雜網(wǎng)絡(luò)中,例如科學(xué)家協(xié)作網(wǎng)、交通網(wǎng)絡(luò)、社交網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)和蛋白質(zhì)網(wǎng)絡(luò)等等。社區(qū)結(jié)構(gòu)是復(fù)雜網(wǎng)絡(luò)的重要拓?fù)鋵傩?研究社區(qū)結(jié)構(gòu)有助于揭示復(fù)雜網(wǎng)絡(luò)潛在的信息,因此吸引了各個領(lǐng)域的越來越多的學(xué)者專家的研究,成為新的研究熱點。目前社區(qū)發(fā)現(xiàn)研究取得了豐碩的成果,據(jù)不完全統(tǒng)計將近一百多種社區(qū)發(fā)現(xiàn)算法被提出。根據(jù)社區(qū)是否重疊社區(qū)發(fā)現(xiàn)算法可以分為重疊社區(qū)發(fā)現(xiàn)算法和非重疊社區(qū)發(fā)現(xiàn)算法。非重疊社區(qū)發(fā)現(xiàn)算法中一個節(jié)點屬于僅能夠?qū)儆谝粋社區(qū)。在真實的復(fù)雜網(wǎng)絡(luò)中普遍存在一個節(jié)點被多個社區(qū)共享現(xiàn)象,即社區(qū)之間存在重疊,例如在蛋白質(zhì)網(wǎng)絡(luò)中,一種蛋白質(zhì)能夠承擔(dān)多種功能;在社交網(wǎng)絡(luò)中,一個人可以屬于學(xué)校、同事、朋友、家人等多個社區(qū)。由于重疊社區(qū)更貼近真實的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),因此重疊社區(qū)發(fā)現(xiàn)成為復(fù)雜網(wǎng)絡(luò)領(lǐng)域新的研究熱點。自2005年P(guān)alla等人在PANS會議上首次提出了社區(qū)重疊現(xiàn)象,重疊社區(qū)發(fā)現(xiàn)研究成果如雨后春筍般涌現(xiàn)。重疊社區(qū)發(fā)現(xiàn)算法按照網(wǎng)絡(luò)劃分結(jié)果可以分為模糊重疊社區(qū)發(fā)現(xiàn)算法和非模糊重疊發(fā)現(xiàn)算法。非模糊重疊發(fā)現(xiàn)算法,例如CPM算法、LC算法等,能夠明確劃分網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),但不能評估節(jié)點與社區(qū)的隸屬強(qiáng)度。模糊重疊社區(qū)發(fā)現(xiàn)算法,例如FCM(fuzzy c-means)算法、SPAEM算法等,能夠提供評估節(jié)點與社區(qū)的隸屬強(qiáng)度,卻不能夠明確劃分社區(qū)結(jié)構(gòu)。2013年,Zhongyuan Zhang等人提出了SBMF模型,該模型能夠結(jié)合兩類算法的優(yōu)點,彌補(bǔ)兩類算法的不足。SBMF模型不僅能夠明確劃分網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),還能提供節(jié)點與社區(qū)的隸屬強(qiáng)度。并且,SBMF模型還能判別重疊節(jié)點和離群節(jié)點。但是,SBMF模型沒有考慮重疊節(jié)點與多個社區(qū)相連,使得重疊節(jié)點與各個社區(qū)的隸屬強(qiáng)度降低,導(dǎo)致潛在的重疊節(jié)點被誤劃分成為離群節(jié)點。為彌補(bǔ)SBMF模型這一缺陷,我們提出了基于遺傳算法的拓展矩陣分解模型(ESBMF)。改進(jìn)的ESBMF模型,采用遺傳算法計算節(jié)點與社區(qū)的隸屬強(qiáng)度的最優(yōu)修正值,來明確網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)。評價社區(qū)劃分結(jié)果的優(yōu)劣是社區(qū)發(fā)現(xiàn)的重要步驟。本文采用拓展模塊度EQ作為評價指標(biāo)。EQ主要用來衡量社區(qū)結(jié)構(gòu)模塊性高低,EQ值越大社區(qū)結(jié)構(gòu)模塊性越高。為衡量ESBMF模型的性能,本文采用四個經(jīng)典真實數(shù)據(jù)集作為實驗數(shù)據(jù)集,包括空手道社交網(wǎng)絡(luò)數(shù)據(jù)集、海豚網(wǎng)絡(luò)數(shù)據(jù)集、美國政治圖書數(shù)據(jù)集和美國橄欖球聯(lián)盟數(shù)據(jù)集,并與經(jīng)典的LC算法和SBMF模型進(jìn)行比較,實驗結(jié)果證明,ESBMF模型劃分的網(wǎng)絡(luò)結(jié)構(gòu)與真實的網(wǎng)絡(luò)結(jié)構(gòu)更貼近,模塊性更高。
【關(guān)鍵詞】:重疊社區(qū)發(fā)現(xiàn) 矩陣分解 評價指標(biāo) 遺傳算法
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:O157.5;TP18
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-16
- 1.1 研究背景及研究意義10-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.3 本文工作14-15
- 1.4 內(nèi)容結(jié)構(gòu)與安排15-16
- 第2章 社區(qū)發(fā)現(xiàn)算法概述16-26
- 2.1 相關(guān)知識介紹16-19
- 2.1.1 介數(shù)16
- 2.1.2 平均路徑長度16-17
- 2.1.3 聚集系數(shù)17
- 2.1.4 Q模塊度17-18
- 2.1.5 分割密度18-19
- 2.2 非重疊社區(qū)發(fā)現(xiàn)算法19-23
- 2.2.1 基于優(yōu)化的非重疊社區(qū)發(fā)現(xiàn)算法19-22
- 2.2.2 基于優(yōu)化的社區(qū)發(fā)現(xiàn)算法22-23
- 2.3 重疊社區(qū)發(fā)現(xiàn)算法23-25
- 2.3.1 派系過濾算法23-24
- 2.3.2 連接聚類算法24
- 2.3.3 基于局部信息擴(kuò)散算法24-25
- 2.4 本章小結(jié)25-26
- 第3章 非負(fù)矩陣分解模型26-31
- 3.1 SNMF算法26-28
- 3.1.1 非負(fù)矩陣分解算法思想26-27
- 3.1.2 SNMF算法27-28
- 3.2 SBMF算法28-29
- 3.3 改進(jìn)的PD評價指標(biāo)29-30
- 3.4 本章小結(jié)30-31
- 第4章 基于遺傳算法的矩陣分解模型31-37
- 4.1 遺傳算法31-34
- 4.2 改進(jìn)的SBMF模型34-35
- 4.3 拓展模塊度35-36
- 4.4 本章小結(jié)36-37
- 第5章 實驗結(jié)果分析37-46
- 5.1 實驗數(shù)據(jù)集37-38
- 5.2 實驗評估指標(biāo)38
- 5.3 實驗結(jié)果38-45
- 5.3.1 空手道數(shù)據(jù)集39-40
- 5.3.2 海豚社會網(wǎng)絡(luò)數(shù)據(jù)集40-42
- 5.3.3 美國政治圖書數(shù)據(jù)集42-43
- 5.3.4 美國橄欖球聯(lián)盟數(shù)據(jù)集43-45
- 5.4 本章小結(jié)45-46
- 第6章 總結(jié)與展望46-47
- 6.1 總結(jié)46
- 6.2 展望46-47
- 參考文獻(xiàn)47-50
- 作者簡介及科研成果50-51
- 致謝51
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 智源;行飛;;復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)問題綜述[J];陰山學(xué)刊(自然科學(xué));2011年03期
2 王林;戴冠中;趙煥成;;一種新的評價社區(qū)結(jié)構(gòu)的模塊度研究[J];計算機(jī)工程;2010年14期
3 韓瑞凱;孟嗣儀;劉云;郭英慧;張彥超;;基于興趣相似度的社區(qū)結(jié)構(gòu)發(fā)現(xiàn)算法研究[J];鐵路計算機(jī)應(yīng)用;2010年10期
4 劉旭;易東云;;基于保守合并策略的復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)發(fā)現(xiàn)[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2011年04期
5 黃發(fā)良;肖南峰;;用于網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)的粗糙譜聚類算法[J];小型微型計算機(jī)系統(tǒng);2012年02期
6 馬瑞新;鄧貴仕;王曉;;啟發(fā)式動態(tài)社區(qū)挖掘算法研究與實現(xiàn)[J];大連理工大學(xué)學(xué)報;2012年02期
7 梁沙沙;;復(fù)雜網(wǎng)絡(luò)重疊社區(qū)結(jié)構(gòu)發(fā)現(xiàn)算法研究[J];陰山學(xué)刊(自然科學(xué));2013年02期
8 劉大有;金弟;何東曉;黃晶;楊建寧;楊博;;復(fù)雜網(wǎng)絡(luò)社區(qū)挖掘綜述[J];計算機(jī)研究與發(fā)展;2013年10期
9 時京晶;;三種經(jīng)典復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)劃分算法研究[J];電腦與信息技術(shù);2011年04期
10 黃發(fā)良;肖南峰;;基于線圖與PSO的網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)[J];自動化學(xué)報;2011年09期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 刁元波;李夢龍;文志寧;印家健;鄭波;;人類細(xì)胞信號網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)分析[A];第九屆全國計算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2007年
2 劉欣;李德毅;李兵;王樹良;陶志偉;;復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究[A];2006全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會議論文集[C];2006年
3 單波;姜守旭;張碩;高宏;李建中;;IC:動態(tài)社會關(guān)系網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的增量識別算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 記者 熊明 實習(xí)生 李瑞瑩;度假區(qū)不斷創(chuàng)新社區(qū)結(jié)構(gòu)[N];云南日報;2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 閔磊;復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法研究[D];華中師范大學(xué);2015年
2 蔡清;基于群體智能優(yōu)化的大數(shù)據(jù)復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)分析[D];西安電子科技大學(xué);2015年
3 杜楠;復(fù)雜網(wǎng)絡(luò)中社區(qū)結(jié)構(gòu)發(fā)現(xiàn)算法研究及建模[D];北京郵電大學(xué);2009年
4 李一嘯;基于復(fù)雜網(wǎng)絡(luò)和演化博弈理論的社會[D];浙江大學(xué);2010年
5 韓院彬;Web服務(wù)網(wǎng)絡(luò)分析和社區(qū)發(fā)現(xiàn)研究[D];天津大學(xué);2014年
6 謝輝;基于復(fù)雜網(wǎng)絡(luò)的若干動態(tài)機(jī)制研究[D];西安電子科技大學(xué);2013年
7 任薇;基于微博的社會網(wǎng)絡(luò)特征研究[D];西南大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王童童;社區(qū)框架與隱藏社區(qū)的挖掘[D];山東建筑大學(xué);2015年
2 賀成龍;復(fù)雜網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)算法研究[D];解放軍信息工程大學(xué);2015年
3 賈娜;基于矩陣分解的重疊社區(qū)探測研究[D];吉林大學(xué);2016年
4 戴飛飛;基于進(jìn)化算法的復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)發(fā)現(xiàn)[D];電子科技大學(xué);2008年
5 王熙;復(fù)雜網(wǎng)絡(luò)中的層次重疊社區(qū)發(fā)現(xiàn)及可視化[D];北京交通大學(xué);2010年
6 徐李恒;復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法研究[D];太原理工大學(xué);2011年
7 李兆南;基于距離相似度的復(fù)雜網(wǎng)絡(luò)社區(qū)挖掘方法[D];吉林大學(xué);2011年
8 商源純;復(fù)雜網(wǎng)絡(luò)中的重疊社區(qū)發(fā)現(xiàn)算法研究[D];北京交通大學(xué);2011年
9 吳婷婷;基于極大度數(shù)節(jié)點的復(fù)雜網(wǎng)絡(luò)社區(qū)層次結(jié)構(gòu)發(fā)現(xiàn)研究[D];華南理工大學(xué);2011年
10 王亮;基于局部聚類的復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法研究[D];大連理工大學(xué);2011年
本文關(guān)鍵詞:基于矩陣分解的重疊社區(qū)探測研究,,由筆耕文化傳播整理發(fā)布。
本文編號:353760
本文鏈接:http://sikaile.net/kejilunwen/yysx/353760.html