復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法研究
本文關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:將實(shí)體視為節(jié)點(diǎn),實(shí)體之間的關(guān)系視為邊,現(xiàn)實(shí)世界中的很多系統(tǒng)就可通過網(wǎng)絡(luò)的形式來呈現(xiàn),如學(xué)術(shù)論文及它們的引用關(guān)系可構(gòu)成引文網(wǎng)絡(luò),網(wǎng)頁及連接網(wǎng)頁的超鏈接可形成萬維網(wǎng)等。在這些系統(tǒng)(或網(wǎng)絡(luò))中,實(shí)體之間的關(guān)系通常較為復(fù)雜,表現(xiàn)出如小世界、無標(biāo)度、自組織以及社區(qū)結(jié)構(gòu)特性等簡(jiǎn)單網(wǎng)絡(luò)所不具備的諸多性質(zhì),因此它們也被稱為復(fù)雜網(wǎng)絡(luò)。在復(fù)雜網(wǎng)絡(luò)中,具有“與內(nèi)部節(jié)點(diǎn)連接較為緊密,與外部節(jié)點(diǎn)連接較為稀疏”特征的節(jié)點(diǎn)的集合被稱為社區(qū)。社區(qū)發(fā)現(xiàn)是復(fù)雜網(wǎng)絡(luò)領(lǐng)域的一個(gè)研究熱點(diǎn),具有廣泛的應(yīng)用價(jià)值。例如,社區(qū)發(fā)現(xiàn)可對(duì)“引文網(wǎng)絡(luò)中關(guān)聯(lián)較緊密論文構(gòu)成的社區(qū)”進(jìn)行挖掘從而實(shí)現(xiàn)同領(lǐng)域論文的推薦,對(duì)萬維網(wǎng)中的網(wǎng)頁進(jìn)行社區(qū)挖掘則可對(duì)相似主題的網(wǎng)頁進(jìn)行聚類進(jìn)而實(shí)現(xiàn)熱點(diǎn)事件的跟蹤等。目前,國內(nèi)外針對(duì)社區(qū)發(fā)現(xiàn)已經(jīng)做了一些研究,提出了很多算法,如基于介數(shù)分割的算法、基于模塊度優(yōu)化的算法、基于譜分析的算法等。這些算法對(duì)社區(qū)發(fā)現(xiàn)研究的發(fā)展具有十分重要的意義,但它們?nèi)源嬖谥T如時(shí)間復(fù)雜度高或分辨率限制等問題?紤]到社區(qū)發(fā)現(xiàn)在實(shí)際應(yīng)用中的重要性以及已有算法的不足,本文對(duì)其進(jìn)行了深入研究。主要研究?jī)?nèi)容包括:一、對(duì)社區(qū)結(jié)構(gòu)的增強(qiáng)機(jī)制進(jìn)行了研究,提出了基于信息傳播相似性的增強(qiáng)方法。社區(qū)結(jié)構(gòu)增強(qiáng)的目的是將社區(qū)的輪廓進(jìn)行一個(gè)初步呈現(xiàn),為后續(xù)社區(qū)發(fā)現(xiàn)提供良好的數(shù)據(jù)基礎(chǔ),進(jìn)而提升其準(zhǔn)確性。文獻(xiàn)中已有算法大多通過計(jì)算連邊兩端節(jié)點(diǎn)的相似性,并將該相似性值作為連邊權(quán)值來實(shí)現(xiàn)社區(qū)結(jié)構(gòu)的增強(qiáng)。但是傳統(tǒng)的節(jié)點(diǎn)相似性計(jì)算方法僅考慮了共同鄰居的個(gè)數(shù),而未考慮鄰居之間的連接關(guān)系。為了充分考慮連接關(guān)系對(duì)節(jié)點(diǎn)相似性的影響,本文引入了信息傳播機(jī)制的思想,設(shè)計(jì)了一種基于分層結(jié)構(gòu)的傳播擴(kuò)散模型對(duì)傳播影響力進(jìn)行了評(píng)估,并將信息傳播的相似性測(cè)量值作為連邊權(quán)值對(duì)社區(qū)結(jié)構(gòu)進(jìn)行了增強(qiáng)。實(shí)驗(yàn)表明,與傳統(tǒng)方法相比,本文給出的社區(qū)結(jié)構(gòu)增強(qiáng)方法能夠更為有效地對(duì)社區(qū)輪廓進(jìn)行呈現(xiàn)。二、在全局社區(qū)發(fā)現(xiàn)方面,針對(duì)模塊度優(yōu)化類社區(qū)發(fā)現(xiàn)算法中固有的分辨率限制問題,提出了一種通過調(diào)節(jié)增強(qiáng)程度來實(shí)現(xiàn)分辨率控制的方法。該方法首先對(duì)連邊增強(qiáng)程度的差異性分量進(jìn)行抽取,然后通過設(shè)定的增強(qiáng)因子將該分量與連邊的原始權(quán)值進(jìn)行混合,實(shí)現(xiàn)了可調(diào)節(jié)的社區(qū)結(jié)構(gòu)增強(qiáng)。在利用加權(quán)模塊度方法進(jìn)行優(yōu)化求解中,不同的增強(qiáng)因子對(duì)應(yīng)著社區(qū)輪廓的不同凸顯程度,因而社區(qū)的識(shí)別粒度也相應(yīng)不同,從而實(shí)現(xiàn)了分辨率的可控性。實(shí)驗(yàn)表明,該方法可在一定程度上對(duì)分辨率限制問題進(jìn)行緩解。此外,還提出了社區(qū)核心與連邊增強(qiáng)權(quán)值相對(duì)應(yīng)的假設(shè),基于該假設(shè),對(duì)社區(qū)中具有較高內(nèi)聚性的凝聚子群進(jìn)行了提取,并通過對(duì)凝聚子群進(jìn)行基于模塊度的局部?jī)?yōu)化和合并操作實(shí)現(xiàn)了社區(qū)結(jié)構(gòu)的挖掘。實(shí)驗(yàn)表明基于凝聚子群擴(kuò)展的社區(qū)發(fā)現(xiàn)算法具有較高的準(zhǔn)確性。三、在局部社區(qū)發(fā)現(xiàn)方面,提出了基于弱化干擾節(jié)點(diǎn)的社區(qū)發(fā)現(xiàn)算法和基于凝聚核心擴(kuò)展的社區(qū)發(fā)現(xiàn)算法。在基于弱化干擾節(jié)點(diǎn)的方法中,利用CnllLocal算法可能遺漏源節(jié)點(diǎn)的特點(diǎn),將不包含源節(jié)點(diǎn)的鄰居社區(qū)在社區(qū)發(fā)現(xiàn)過程中所起的干擾作用進(jìn)行了弱化,提高了找到源節(jié)點(diǎn)實(shí)際隸屬社區(qū)的可能性。在基于凝聚核心擴(kuò)展的方法中,利用社區(qū)核心與連邊增強(qiáng)權(quán)值相對(duì)應(yīng)的假設(shè),首先找到凝聚子群的核心,然后利用該核心取代源節(jié)點(diǎn)進(jìn)行局部社區(qū)的擴(kuò)展。實(shí)驗(yàn)表明,無論源節(jié)點(diǎn)處于社區(qū)核心還是邊緣,該算法的效果都優(yōu)于Bagraw、Clauset、CnllLocal等經(jīng)典算法。本文的創(chuàng)新點(diǎn)主要在于:一、提出了基于信息傳播相似性的社區(qū)結(jié)構(gòu)增強(qiáng)方法,該方法充分考慮了節(jié)點(diǎn)之間的連接關(guān)系對(duì)節(jié)點(diǎn)相似性的影響,使社區(qū)結(jié)構(gòu)增強(qiáng)的結(jié)果更具合理性。二、提出了通過調(diào)節(jié)社區(qū)結(jié)構(gòu)增強(qiáng)程度來實(shí)現(xiàn)分辨率控制的方法,該方法能有效緩解分辨率限制問題。三、提出了連邊增強(qiáng)權(quán)值(經(jīng)過社區(qū)結(jié)構(gòu)增強(qiáng)后的連邊權(quán)值)與連邊的社區(qū)核心性相對(duì)應(yīng)的思想,基于該思想能實(shí)現(xiàn)對(duì)凝聚子群以及社區(qū)核心的抽取,從而提高全局以及局部社區(qū)發(fā)現(xiàn)的準(zhǔn)確性。本文以復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)高效算法為主要目標(biāo),開展了社區(qū)結(jié)構(gòu)增強(qiáng)、全局社區(qū)發(fā)現(xiàn)以及局部社區(qū)發(fā)現(xiàn)的相關(guān)算法研究,進(jìn)一步發(fā)展了社區(qū)發(fā)現(xiàn)算法。計(jì)算實(shí)驗(yàn)表明,本文提出的社區(qū)發(fā)現(xiàn)算法具有準(zhǔn)確性較高、時(shí)間復(fù)雜度較低的優(yōu)勢(shì),為包括在線教育在內(nèi)的眾多領(lǐng)域中涉及到關(guān)系聚類的社區(qū)發(fā)現(xiàn)應(yīng)用提供了理論基礎(chǔ)。
【關(guān)鍵詞】:社區(qū)發(fā)現(xiàn) 傳播相似性 核心逼近 凝聚子群
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:O157.5
【目錄】:
- 摘要5-7
- ABSTRACT7-13
- 第一章 緒論13-21
- 1.1 研究背景與意義13-15
- 1.2 國內(nèi)外研究現(xiàn)狀15-19
- 1.2.1 學(xué)習(xí)社區(qū)研究現(xiàn)狀15-16
- 1.2.2 復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究現(xiàn)狀16-19
- 1.3 主要研究?jī)?nèi)容19
- 1.4 論文的組織結(jié)構(gòu)19-21
- 第二章 復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)相關(guān)內(nèi)容21-32
- 2.1 復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)21-25
- 2.1.1 復(fù)雜網(wǎng)絡(luò)及社區(qū)結(jié)構(gòu)21-23
- 2.1.2 教育領(lǐng)域的網(wǎng)絡(luò)模型建立23-25
- 2.2 評(píng)估標(biāo)準(zhǔn)25-26
- 2.2.1 模塊度標(biāo)準(zhǔn)25-26
- 2.2.2 NMI標(biāo)準(zhǔn)26
- 2.3 社區(qū)發(fā)現(xiàn)相關(guān)概念26-29
- 2.3.1 模塊度優(yōu)化26-27
- 2.3.2 標(biāo)簽傳播思想27-28
- 2.3.3 社區(qū)結(jié)構(gòu)增強(qiáng)28-29
- 2.4 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)29-30
- 2.4.1 實(shí)驗(yàn)環(huán)境29-30
- 2.4.2 真實(shí)數(shù)據(jù)集30
- 2.4.3 仿真數(shù)據(jù)集30
- 2.5 本章小結(jié)30-32
- 第三章 基于信息傳播相似性的社區(qū)結(jié)構(gòu)增強(qiáng)方法32-57
- 3.1 引言32-33
- 3.2 社區(qū)結(jié)構(gòu)增強(qiáng)與社區(qū)發(fā)現(xiàn)的關(guān)系33
- 3.3 節(jié)點(diǎn)傳播影響力覆蓋范圍的計(jì)算33-42
- 3.3.1 傳播影響力范圍分析34
- 3.3.2 SIR傳播仿真模型分析34-35
- 3.3.3 傳播概率擴(kuò)散原理分析35-39
- 3.3.4 分層信息傳播估計(jì)法39-42
- 3.4 傳播相似性計(jì)算42-47
- 3.5 社區(qū)結(jié)構(gòu)的增強(qiáng)47-50
- 3.6 實(shí)驗(yàn)與分析50-56
- 3.6.1 信息傳播率對(duì)社區(qū)結(jié)構(gòu)增強(qiáng)程度的影響50-52
- 3.6.2 增強(qiáng)效果及社區(qū)劃分結(jié)果與增強(qiáng)因子的關(guān)系52-56
- 3.7 本章小結(jié)56-57
- 第四章 基于凝聚子群擴(kuò)展的社區(qū)發(fā)現(xiàn)算法57-89
- 4.1 引言57-58
- 4.2 基于社區(qū)結(jié)構(gòu)增強(qiáng)的分辨率調(diào)節(jié)58-64
- 4.2.1 分辨率限制問題58-60
- 4.2.2 利用社區(qū)結(jié)構(gòu)的增強(qiáng)對(duì)分辨率問題進(jìn)行緩解60-64
- 4.3 基于山體結(jié)構(gòu)抽取原理的凝聚子群發(fā)現(xiàn)64-76
- 4.3.1 凝聚子群特性分析64-68
- 4.3.2 凝聚子群的抽取68-75
- 4.3.3 凝聚子群中重疊元素的劃分75-76
- 4.4 基于局部?jī)?yōu)化的社區(qū)發(fā)現(xiàn)76-85
- 4.4.1 基于模塊度的局部?jī)?yōu)化76-82
- 4.4.2 子社區(qū)合并策略82-85
- 4.5 實(shí)驗(yàn)與分析85-87
- 4.6 本章小結(jié)87-89
- 第五章 局部社區(qū)社區(qū)發(fā)現(xiàn)算法89-105
- 5.1 引言89
- 5.2 基于弱化干擾節(jié)點(diǎn)的局部社區(qū)發(fā)現(xiàn)算法89-96
- 5.2.1 已有算法的不足及弱化干擾節(jié)點(diǎn)算法的可行性分析90-92
- 5.2.2 算法描述92-93
- 5.2.3 實(shí)驗(yàn)與分析93-96
- 5.3 基于凝聚核心擴(kuò)展的局部社區(qū)發(fā)現(xiàn)算法96-104
- 5.3.1 算法描述97-98
- 5.3.2 實(shí)驗(yàn)與分析98-104
- 5.4 本章小結(jié)104-105
- 第六章 總結(jié)及展望105-108
- 6.1 本文工作總結(jié)105-106
- 6.2 下一步工作展望106-108
- 參考文獻(xiàn)108-115
- 在校期間發(fā)表的論文、科研成果等115-116
- 致謝116
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 陳向東;方群;唐輝云;;Blog虛擬學(xué)習(xí)社區(qū)的社會(huì)網(wǎng)絡(luò)研究——以“東行記”為例[J];電化教育研究;2008年01期
2 王洋;狄增如;樊瑛;;二分網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)的比較性定義[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2009年04期
3 王永固;張慶;;MOOC:特征與學(xué)習(xí)機(jī)制[J];教育研究;2014年09期
4 王陸;;虛擬學(xué)習(xí)社區(qū)社會(huì)網(wǎng)絡(luò)中的凝聚子群[J];中國電化教育;2009年08期
5 王陸;;虛擬學(xué)習(xí)社區(qū)社會(huì)網(wǎng)絡(luò)位置分析與助學(xué)者群體的發(fā)現(xiàn)[J];中國電化教育;2010年03期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王陸;虛擬學(xué)習(xí)社區(qū)的社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)研究[D];西北師范大學(xué);2009年
本文關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):286060
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/286060.html