基于改進相似度的社會網絡鏈接預測研究
發(fā)布時間:2017-12-02 00:21
本文關鍵詞:基于改進相似度的社會網絡鏈接預測研究
更多相關文章: 鏈接預測 相似度 樸素貝葉斯 TAN 加權網絡
【摘要】:鏈接預測是社會網絡分析領域的熱點問題,它通過對網絡已知結構分析,預測兩個不相連節(jié)點發(fā)生鏈接的可能性。目前,絕大多數的鏈接預測模型都是基于網絡特征構建,該類模型通過挖掘拓撲結構特征,計算節(jié)點間的相似度,判斷鏈接是否存在,其中具有代表性的有基于共鄰節(jié)點信息方法,如CN(Common Neighbors)、AA(Admic Adar)、RA(Resource Allocation)等。但是該類算法主要利用共鄰節(jié)點及節(jié)點度的網絡結構信息,不能全面反映社會網絡的復雜結構。此外,基于樸素貝葉斯(Local Na?ve Bayesian,簡稱LNB)模型構建的鏈接預測算法具有較好的預測效果。但是該算法有兩個不足:(1)基于獨立性假設而建立,而這一假設在實際中往往是不成立的;(2)基于無權網絡,忽略社會網絡邊權這一屬性。根據以上三個問題,文章開展了對社會網絡鏈接預測算法的研究,主要工作和創(chuàng)新點如下:首先,為了更深入地挖掘網絡內部結構屬性,文章第三章在經典算法CN基礎上加入了社區(qū)劃分的概念構建相似度算法,將網絡節(jié)點劃分到不同的社區(qū),差分化處理共鄰節(jié)點的角色以及貢獻。同時,推廣該算法到Jaccard之中,并在人工數據集、真實數據集的實驗分析中表明:改進算法優(yōu)于經典算法。然后,針對LNB模型的缺陷一,本文第四章中引入了一種樹狀貝葉斯分類模型(Tree Augmented Na?ve,簡稱TAN),放松了貝葉斯分類器中的獨立性假設,同時結合信息熵概念,在CN算法基礎上獲取了共鄰節(jié)點對的聯(lián)合貢獻,提出了算法TAN_CN。接著,又將TAN模型拓展到AA、RA中構建算法TAN_AA、TAN_RA。在不同的真實數據集中進行實驗,與經典算法、LNB模型下算法相比得出:TAN模型下算法更優(yōu)。最后,針對LNB模型的缺陷二,第五章將鏈接預測問題的研究由無權網絡拓展到了加權網絡,并提出了基于WLNB(Weighted_LNB)模型的CN、AA、RA算法。該算法在計算預測節(jié)點對共鄰節(jié)點的貢獻時,引入了加權凝聚系數,反映了共鄰節(jié)點的邊權結構屬性對相似度的影響,其精度也得到了提高。本章最后將該算法運用到了無權網絡中,實現(xiàn)了加權算法在加權、無權網絡的自由切換。
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.02
【參考文獻】
中國期刊全文數據庫 前5條
1 東昱曉;柯慶;吳斌;;基于節(jié)點相似性的鏈接預測[J];計算機科學;2011年07期
2 楊s,
本文編號:1242991
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1242991.html
最近更新
教材專著