融合結點屬性與結構的電商網(wǎng)絡社區(qū)檢測算法
發(fā)布時間:2022-01-27 10:46
針對密度峰值算法在社區(qū)劃分應用中因截斷距離的選取以及僅考慮社區(qū)網(wǎng)絡拓撲結構而帶來的不準確等問題,提出一種融合結點屬性和網(wǎng)絡拓撲結構的密度峰值社區(qū)檢測算法。以用戶網(wǎng)絡拓撲結構計算用戶結點的直接鄰居與間接鄰居的度表示結點的局部密度;以用戶對商品的評論信息的主題屬性為用戶結點的屬性,結合網(wǎng)絡拓撲結構計算用戶間的相似度,從而得到用戶間的相對距離;選出關鍵點作為社區(qū)的中心結點,完成社區(qū)劃分。實驗表明:所提出的算法準確度與歸一化信息指標均優(yōu)于基線模型算法,提高了電商網(wǎng)絡中社區(qū)檢測算法準確度,實現(xiàn)了高效的社區(qū)劃分。
【文章來源】:西安工程大學學報. 2020,34(05)
【文章頁數(shù)】:6 頁
【部分圖文】:
淘寶數(shù)據(jù)集上的聚類結果
拼多多數(shù)據(jù)集上的聚類結果
圖 3 歸一化信息評估結果從圖3和圖4可以看出,相比較KDED算法及改進的K-means算法,ANDPC算法在2個數(shù)據(jù)集上都取得了最好的結果。相比于基線模型分別提高了0.02及0.03以上;相比KDED方法得到了較好的歸一化信息值和準確度值。這是因為ANDPC算法利用了用戶關于核心用戶的不同鄰居位置,并結合用戶主題屬性計算結點間的相似性,從而可以更明確用戶之間的關系且提高了邊緣結點與聚類中心結點的聯(lián)系。KDED算法由于在最后進行結點分配時存在一定的模糊性,故結果較差;改進的K-means算法則由于參數(shù)的選擇問題,給聚類效果帶來了一定的負面影響,產(chǎn)生了較差的聚類效果。模塊度評估的實驗如表1所示。
【參考文獻】:
期刊論文
[1]復雜網(wǎng)絡社區(qū)發(fā)現(xiàn)研究進展[J]. 趙衛(wèi)績,張鳳斌,劉井蓮. 計算機科學. 2020(02)
[2]基于節(jié)點屬性的社區(qū)發(fā)現(xiàn)博弈算法[J]. 張賢坤,任靜,劉淵博,蘇靜. 計算機應用研究. 2020(01)
[3]密度峰值聚類的自適應社區(qū)發(fā)現(xiàn)算法[J]. 金志剛,徐珮軒. 哈爾濱工業(yè)大學學報. 2018(05)
[4]復雜網(wǎng)絡半監(jiān)督的社區(qū)發(fā)現(xiàn)算法研究[J]. 王靜紅,于雅智. 計算機應用研究. 2018(06)
碩士論文
[1]社會化電商平臺中基于用戶關系的推薦算法研究[D]. 王佳琦.北京郵電大學 2019
本文編號:3612338
【文章來源】:西安工程大學學報. 2020,34(05)
【文章頁數(shù)】:6 頁
【部分圖文】:
淘寶數(shù)據(jù)集上的聚類結果
拼多多數(shù)據(jù)集上的聚類結果
圖 3 歸一化信息評估結果從圖3和圖4可以看出,相比較KDED算法及改進的K-means算法,ANDPC算法在2個數(shù)據(jù)集上都取得了最好的結果。相比于基線模型分別提高了0.02及0.03以上;相比KDED方法得到了較好的歸一化信息值和準確度值。這是因為ANDPC算法利用了用戶關于核心用戶的不同鄰居位置,并結合用戶主題屬性計算結點間的相似性,從而可以更明確用戶之間的關系且提高了邊緣結點與聚類中心結點的聯(lián)系。KDED算法由于在最后進行結點分配時存在一定的模糊性,故結果較差;改進的K-means算法則由于參數(shù)的選擇問題,給聚類效果帶來了一定的負面影響,產(chǎn)生了較差的聚類效果。模塊度評估的實驗如表1所示。
【參考文獻】:
期刊論文
[1]復雜網(wǎng)絡社區(qū)發(fā)現(xiàn)研究進展[J]. 趙衛(wèi)績,張鳳斌,劉井蓮. 計算機科學. 2020(02)
[2]基于節(jié)點屬性的社區(qū)發(fā)現(xiàn)博弈算法[J]. 張賢坤,任靜,劉淵博,蘇靜. 計算機應用研究. 2020(01)
[3]密度峰值聚類的自適應社區(qū)發(fā)現(xiàn)算法[J]. 金志剛,徐珮軒. 哈爾濱工業(yè)大學學報. 2018(05)
[4]復雜網(wǎng)絡半監(jiān)督的社區(qū)發(fā)現(xiàn)算法研究[J]. 王靜紅,于雅智. 計算機應用研究. 2018(06)
碩士論文
[1]社會化電商平臺中基于用戶關系的推薦算法研究[D]. 王佳琦.北京郵電大學 2019
本文編號:3612338
本文鏈接:http://sikaile.net/kejilunwen/yysx/3612338.html
最近更新
教材專著