基于標簽傳播的社區(qū)發(fā)現(xiàn)算法研究及其并行化
發(fā)布時間:2021-09-02 16:31
隨著社交網(wǎng)絡(luò)的不斷發(fā)展,社區(qū)發(fā)現(xiàn)已經(jīng)成為復(fù)雜網(wǎng)絡(luò)領(lǐng)域的一個重要的研究熱點。若干個社區(qū)組成了一個完整的網(wǎng)絡(luò),在社區(qū)的內(nèi)部,節(jié)點之間的連接相對緊密,而社區(qū)與社區(qū)之間節(jié)點間的連接則相對松散。標簽傳播算法LPA(Label Propagation Algorithm)是社區(qū)發(fā)現(xiàn)算法中比較優(yōu)秀的算法。它的線性的時間復(fù)雜度是它的一大優(yōu)勢。雖然LPA有很多的優(yōu)點,但是缺點也是非常明顯的。由于標簽的隨機選擇,LPA不能保證每次結(jié)果的一致性;此外,在多次迭代之后,可能會出現(xiàn)大的社區(qū)將小社區(qū)吞并的現(xiàn)象。結(jié)合以上內(nèi)容,本文在LPA的基礎(chǔ)上改進擴展出了兩個算法,具體的研究成果如下所示:(1)LPA的優(yōu)化改進LPA算法不包含任何參數(shù),主要對標簽傳播及更新進行優(yōu)化。在基于概率和相似度的標簽傳播算法 PSLPA(Probability and Similarity based Label Propagation Algorithm)中,結(jié)合節(jié)點間的概率以及相似度,并在標簽傳播的過程中使用了自適應(yīng)標簽選擇的方式對節(jié)點標簽進行更新。在基于節(jié)點權(quán)重和隨機游走的標簽傳播算法WRWILPA(Weightand Random ...
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1標簽震蕩7K意圖??除此之外,簽播法可能出現(xiàn)“”區(qū),當一區(qū)簽己經(jīng)
(c)?2-shell中的節(jié)點?(d)?3-shel丨中的節(jié)點??圖3-1?—個可分解為3個shell的網(wǎng)絡(luò)示意圖??對于圖3-1?(a)中的網(wǎng)絡(luò)圖,各個節(jié)點所屬的shell以及其iteration值如表3-1所?表分解后節(jié)點所屬shell及itemtiyn值?節(jié)點?iteration?值???一?1-shell? ̄9,10,11,12,13,15,17,18,19,20"?1?一?1-shell?14,16?2??一?2-shell?5,6,7,8?—?1? ̄?3-shell?1,2,3,4?1?.2基于概率和相似度的標簽傳播方法??在傳統(tǒng)的標簽傳播算法中,鄰居節(jié)點之間并沒有什么差異性,都是被同等對待。實際情況不是這樣,不同的鄰居節(jié)點可能對該節(jié)點有不同的影響力,所以為每一賦予一個權(quán)重是很合理的選擇。PSLPA根據(jù)以下的步驟來進行節(jié)點標簽的選擇以
火q)和火《7.)分別表示節(jié)點q和%的度,iNTh)表示節(jié)點n,.的所有鄰居節(jié)點集??合,使用/CA^)表示節(jié)點q的鄰居索引,從式子中可以看出/av(?f)e[o,i]。??將圖3.2作為例子,從圖中可以看出節(jié)點1,9,?14,?17是度為1的葉子節(jié)點,節(jié)點1??只有一個鄰居節(jié)點,為節(jié)點6,所以火遍歷圖中的17個節(jié)點,可??以得到節(jié)點10及其所有鄰居的度之和為最大的23,所以^〇\^)=5/23?=?0.22,即節(jié)點??1的鄰居索引值為0.22;依次計算其余葉子節(jié)點,可以得到JCAT(%)-4/23?=?0.17,??7〇\^4)=7/23?=?0.30,?7〇\^7)=2/23?=?0.09。從結(jié)果中可以清楚的看到,鄰居索引/CAT??值可以有效的區(qū)分擁有相同度的節(jié)點。??定義2.給定一個社交網(wǎng)絡(luò)G(V,E),通過K-Shell分解方法,每個節(jié)點都被賦予一個??馬值。對于每一輪K-Shell分解,假設(shè)迭代次數(shù)為/?,并且節(jié)點q是在第n次迭代中刪??除的,這里因此位置索引可以計算為表3-1列出了整個K-Shell分解??的過程。結(jié)合公式(1)
【參考文獻】:
期刊論文
[1]基于夾角余弦的證據(jù)組合方法[J]. 胡嘉驥,李新德,王豐羽. 模式識別與人工智能. 2015(09)
[2]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,萬懷宇School of Computer and Information Technology,Beijing Jiaotong University,田盛豐. Journal of Computer Science & Technology. 2012(03)
碩士論文
[1]基于SCAN算法的社區(qū)發(fā)現(xiàn)算法研究[D]. 王耀.南京信息工程大學(xué) 2016
本文編號:3379346
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1標簽震蕩7K意圖??除此之外,簽播法可能出現(xiàn)“”區(qū),當一區(qū)簽己經(jīng)
(c)?2-shell中的節(jié)點?(d)?3-shel丨中的節(jié)點??圖3-1?—個可分解為3個shell的網(wǎng)絡(luò)示意圖??對于圖3-1?(a)中的網(wǎng)絡(luò)圖,各個節(jié)點所屬的shell以及其iteration值如表3-1所?表分解后節(jié)點所屬shell及itemtiyn值?節(jié)點?iteration?值???一?1-shell? ̄9,10,11,12,13,15,17,18,19,20"?1?一?1-shell?14,16?2??一?2-shell?5,6,7,8?—?1? ̄?3-shell?1,2,3,4?1?.2基于概率和相似度的標簽傳播方法??在傳統(tǒng)的標簽傳播算法中,鄰居節(jié)點之間并沒有什么差異性,都是被同等對待。實際情況不是這樣,不同的鄰居節(jié)點可能對該節(jié)點有不同的影響力,所以為每一賦予一個權(quán)重是很合理的選擇。PSLPA根據(jù)以下的步驟來進行節(jié)點標簽的選擇以
火q)和火《7.)分別表示節(jié)點q和%的度,iNTh)表示節(jié)點n,.的所有鄰居節(jié)點集??合,使用/CA^)表示節(jié)點q的鄰居索引,從式子中可以看出/av(?f)e[o,i]。??將圖3.2作為例子,從圖中可以看出節(jié)點1,9,?14,?17是度為1的葉子節(jié)點,節(jié)點1??只有一個鄰居節(jié)點,為節(jié)點6,所以火遍歷圖中的17個節(jié)點,可??以得到節(jié)點10及其所有鄰居的度之和為最大的23,所以^〇\^)=5/23?=?0.22,即節(jié)點??1的鄰居索引值為0.22;依次計算其余葉子節(jié)點,可以得到JCAT(%)-4/23?=?0.17,??7〇\^4)=7/23?=?0.30,?7〇\^7)=2/23?=?0.09。從結(jié)果中可以清楚的看到,鄰居索引/CAT??值可以有效的區(qū)分擁有相同度的節(jié)點。??定義2.給定一個社交網(wǎng)絡(luò)G(V,E),通過K-Shell分解方法,每個節(jié)點都被賦予一個??馬值。對于每一輪K-Shell分解,假設(shè)迭代次數(shù)為/?,并且節(jié)點q是在第n次迭代中刪??除的,這里因此位置索引可以計算為表3-1列出了整個K-Shell分解??的過程。結(jié)合公式(1)
【參考文獻】:
期刊論文
[1]基于夾角余弦的證據(jù)組合方法[J]. 胡嘉驥,李新德,王豐羽. 模式識別與人工智能. 2015(09)
[2]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,萬懷宇School of Computer and Information Technology,Beijing Jiaotong University,田盛豐. Journal of Computer Science & Technology. 2012(03)
碩士論文
[1]基于SCAN算法的社區(qū)發(fā)現(xiàn)算法研究[D]. 王耀.南京信息工程大學(xué) 2016
本文編號:3379346
本文鏈接:http://sikaile.net/kejilunwen/yysx/3379346.html
最近更新
教材專著