天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于屬性網(wǎng)絡(luò)表示學習的鏈接預測算法

發(fā)布時間:2021-04-02 15:48
  網(wǎng)絡(luò)鏈接預測是指通過網(wǎng)絡(luò)結(jié)構(gòu)信息及節(jié)點屬性信息等網(wǎng)絡(luò)歷史信息預測2個節(jié)點之間產(chǎn)生新的鏈接關(guān)系的可能性。網(wǎng)絡(luò)鏈接預測是網(wǎng)絡(luò)分析的基礎(chǔ)任務(wù),在異常檢測、推薦系統(tǒng)等方面有重要應(yīng)用。網(wǎng)絡(luò)表示學習旨在通過無監(jiān)督方法,將符號化的數(shù)據(jù)編碼到低維、稠密的向量空間中,從而更好地應(yīng)用于機器學習任務(wù)中。由于真實網(wǎng)絡(luò)數(shù)據(jù)極其稀疏,現(xiàn)有的模型在鏈接預測的表現(xiàn)上存在一定的提升空間。針對該問題,文章提出一種基于網(wǎng)絡(luò)表示學習的屬性網(wǎng)絡(luò)鏈接預測算法(attributed network embedding based link prediction,ANE-LP)。首先有效提取網(wǎng)絡(luò)結(jié)構(gòu)信息和節(jié)點屬性信息,并且通過深度網(wǎng)絡(luò)結(jié)構(gòu)將網(wǎng)絡(luò)中各節(jié)點表征到低維、稠密向量空間;然后通過相似度度量模型重新定義出鄰居節(jié)點間的關(guān)系;最后在2個真實數(shù)據(jù)集上進行實驗驗證。實驗結(jié)果表明,基于網(wǎng)絡(luò)特征學習的鏈接預測算法與其他方法相比更優(yōu)越。 

【文章來源】:合肥工業(yè)大學學報(自然科學版). 2020,43(11)北大核心

【文章頁數(shù)】:5 頁

【部分圖文】:

基于屬性網(wǎng)絡(luò)表示學習的鏈接預測算法


ANE-LP模型

鏈接圖,屬性信息,鏈接,簡化模型


屬性網(wǎng)絡(luò)表示學習模型如圖1所示。屬性網(wǎng)絡(luò)是由大量節(jié)點、節(jié)點屬性以及節(jié)點之間復雜鏈接關(guān)系共同構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu),如圖1左側(cè)所示。網(wǎng)絡(luò)特征學習是將網(wǎng)絡(luò)中每一個節(jié)點都映射到一個低維向量空間,并且在此空間內(nèi)保持原有圖的結(jié)構(gòu)信息或?qū)傩孕畔。有鏈接關(guān)系和屬性相似的點映射到特征向量空間中距離較近,如圖1所示。相反,如果2個節(jié)點之間不存在關(guān)系,那么對應(yīng)的特征向量相似度較低。關(guān)系越緊密的節(jié)點對存在鏈接關(guān)系的概率越大,在特征空間中距離越近,因此網(wǎng)絡(luò)特征學習可以有效地應(yīng)用于鏈接預測任務(wù)中。近年來,網(wǎng)絡(luò)表示學習引起了大量研究者的關(guān)注。文獻[6]提出了DeepWalk算法,先采用截斷隨機游走模型將圖結(jié)構(gòu)采樣成線性節(jié)點序列,然后利用skip-gram模型從大量的線性節(jié)點序列中學習網(wǎng)絡(luò)節(jié)點的特征向量表示;文獻[7]提出的(large-scale informotion netwrok embedding,LINE)算法,設(shè)計了一個新的優(yōu)化目標函數(shù),可以很好地學習出圖結(jié)構(gòu)中的一階信息和二階信息。近年來,考慮到網(wǎng)絡(luò)中的節(jié)點本身包含豐富的屬性信息,文獻[8]提出了TADW(text-associated DeepWalk),該框架基于矩陣分解將文本信息以一個子矩陣方式加入,學習到更為豐富的網(wǎng)絡(luò)節(jié)點特征向量。近年來,深度學習在圖像處理、視頻處理以及自然語言處理方向上取得了很好的效果,也吸引了許多學者將其用于網(wǎng)絡(luò)節(jié)點特征向量的學習;谏疃葘W習的模型SDNE(structural deep network embedding)[9],通過取自編碼模型的中間層作為節(jié)點二階相似性的向量表示,通過平衡有連邊的點的向量距離來考慮節(jié)點的一階相似性。SDNE良好的實驗效果驗證了深度學習模型在學習網(wǎng)絡(luò)節(jié)點特征向量時的強大能力。然而,上述模型并沒有具體研究如何將學習出的節(jié)點特征向量有效應(yīng)用于鏈接預測任務(wù)中。

精確度,數(shù)據(jù)集,模型,鏈接


對比方法選擇LINE模型[7] 、DeepWalk模型[6]、AutoRec模型[5]。LINE和DeepWalk模型是經(jīng)典網(wǎng)絡(luò)表示學習模型。通過與經(jīng)典網(wǎng)絡(luò)表示學習模型對比可以發(fā)現(xiàn),ANE-LP模型比傳統(tǒng)網(wǎng)絡(luò)表示在鏈接預測方面的效果更好。AutoRec模型[5]是一種多層網(wǎng)絡(luò)鏈接預測模型,它利用稀疏數(shù)據(jù)深入挖掘用戶信息,實現(xiàn)更好的鏈接預測。通過與基于深度學習的鏈接預測模型對比,可以發(fā)現(xiàn)網(wǎng)絡(luò)表示學習在鏈接預測任務(wù)中的有效作用。實驗過程中取數(shù)據(jù)集中80%的點作為訓練集、10%的點作為測試集、10%的點作為驗證集。采用精確度、NDCG(normalized discounted cumulative Gain)[19]2個指標來評估ANE-LP模型及對比模型在鏈接預測任務(wù)中的效果。在不同的K值情形下,ANE-LP模型與其他模型的對比結(jié)果如圖3所示。實驗表明,在不同的K值情形下,相對于其他模型,ANE-LP模型在精確度和NDCG評價指標下均取得了最優(yōu)效果。其中DeepWalk和LINE表現(xiàn)效果均優(yōu)于AutoRec,且DeepWalk效果又比LINE略好。由于DeepWalk和LINE均是基于網(wǎng)絡(luò)表示模型實現(xiàn)鏈接預測的,可以有效針對網(wǎng)絡(luò)數(shù)據(jù)稀疏的特點。另外,考慮用戶之間潛在聯(lián)系使得模型表示能力更強,可以更好地學習用戶特征向量。DeepWalk、LINE相比于ANE-LP,沒有考慮用戶的個性化信息。綜上所述,融合了用戶個性化信息的模型能夠取得更優(yōu)的預測效果。

【參考文獻】:
期刊論文
[1]基于網(wǎng)絡(luò)表示學習與隨機游走的鏈路預測算法[J]. 劉思,劉海,陳啟買,賀超波.  計算機應(yīng)用. 2017(08)
[2]網(wǎng)絡(luò)表示學習[J]. 陳維政,張巖,李曉明.  大數(shù)據(jù). 2015(03)
[3]復雜網(wǎng)絡(luò)鏈路預測[J]. 呂琳媛.  電子科技大學學報. 2010(05)



本文編號:3115524

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3115524.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a7823***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com