基于多源異構數(shù)據(jù)融合的社交網(wǎng)絡鏈路數(shù)據(jù)預測研究
發(fā)布時間:2022-12-10 17:39
近年來,隨著社交網(wǎng)絡服務和其他網(wǎng)絡應用的迅速增長,社交網(wǎng)絡數(shù)據(jù)出現(xiàn)以指數(shù)級增長的態(tài)勢,這些數(shù)據(jù)開始互相關聯(lián),并出現(xiàn)交集。由于這些數(shù)據(jù)在一定程度上保存了用戶的潛在行為模式,因此,如何從海量的社交網(wǎng)絡數(shù)據(jù)中挖掘出用戶的潛在關聯(lián)來實現(xiàn)社交網(wǎng)絡服務質(zhì)量的提升,成為許多社交網(wǎng)站及相關企業(yè)亟待解決的問題,同樣在學術界也引起了一股研究熱潮。鏈路預測采用補全社交關系網(wǎng)絡的方式,來挖掘出大數(shù)據(jù)中的潛在商業(yè)價值。鏈路預測是指通過已知的網(wǎng)絡節(jié)點以及網(wǎng)絡結構等信息預測出網(wǎng)絡中尚未產(chǎn)生鏈路的兩個節(jié)點之間產(chǎn)生鏈路的可能性。由于鏈路預測所面對的數(shù)據(jù)具有多維度和全面性的特點,因此數(shù)據(jù)之間常常存在著意想不到的關聯(lián)性。但傳統(tǒng)的鏈路預測沒有對這些多維度的數(shù)據(jù)進行深挖,忽略了數(shù)據(jù)的關聯(lián)性。本文對這些多維度數(shù)據(jù)進行層層探索,創(chuàng)建新的鏈路預測模型,實現(xiàn)更準更高效的預測結果。針對傳統(tǒng)鏈路預測存在的局限性,本文通過神經(jīng)網(wǎng)絡構建了基于多源異構數(shù)據(jù)融合的鏈路預測混合模型,主要研究內(nèi)容如下:1.本文提出了一種基于多源異構數(shù)據(jù)的鏈路預測混合模型。該模型利用基于地理位置的社交網(wǎng)絡數(shù)據(jù)集中的用戶關系拓撲圖和用戶簽到記錄這兩種異構數(shù)據(jù)對用戶行為模...
【文章頁數(shù)】:83 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內(nèi)外研究歷史與現(xiàn)狀
1.3 本文的主要內(nèi)容與創(chuàng)新
1.4 本論文的結構安排
第二章 相關工作及技術框架
2.1 相關工作
2.1.1 基于用戶關系拓撲圖的鏈路預測問題
2.1.2 基于用戶簽到記錄的鏈路預測問題
2.1.3 基于多種數(shù)據(jù)源信息融合的鏈路預測問題
2.2 技術框架
2.2.1 局部敏感哈希
2.2.2 神經(jīng)網(wǎng)絡
2.2.3 網(wǎng)絡表示學習
2.2.4 矩陣分解
2.3 本章小結
第三章 基于多源異構數(shù)據(jù)的鏈路預測混合模型
3.1 MHLP的整體框架及工作流程
3.2 MHLP的基本定義
3.3 數(shù)據(jù)清洗基本方案
3.3.1 確定簽到范圍
3.3.2 選擇簽到時間
3.3.3 刪除冗余數(shù)據(jù)
3.3.4 用戶一致性
3.4 連通子圖獲取方案及算法
3.5 訪問偏好建模
3.6 社交表示建模
3.7 本章小結
第四章 基于錨鏈接方法和LSH技術的鏈路預測混合模型
4.1 基于錨鏈接方法的鏈路預測混合模型
4.1.1 ALLP的整體框架及工作流程
4.1.2 ALLP的基本定義
4.1.3 ALLP的建模方案及算法
4.2 基于LSH技術的鏈路預測混合模型
4.2.1 LSHLP的整體框架及工作流程
4.2.2 LSHLP的基本定義
4.2.3 LSHLP的建模方案及算法
4.3 本章小結
第五章 實驗配置及相關性能結果
5.1 實驗數(shù)據(jù)集
5.2 實驗設置
5.2.1 實驗參數(shù)設置
5.2.2 基準模型及預測評估指標
5.2.3 F1的兩種實現(xiàn)策略
5.3 實驗發(fā)現(xiàn)
5.3.1 t-SNE降維投影分析
5.3.2 模型準確度評估
5.3.3 模型性能評估
5.4 本章小結
第六章 全文總結與未來展望
6.1 全文總結
6.2 未來展望
致謝
參考文獻
攻讀碩士學位期間取得的成果
【參考文獻】:
期刊論文
[1]網(wǎng)絡表示學習綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學:信息科學. 2017(08)
本文編號:3717218
【文章頁數(shù)】:83 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內(nèi)外研究歷史與現(xiàn)狀
1.3 本文的主要內(nèi)容與創(chuàng)新
1.4 本論文的結構安排
第二章 相關工作及技術框架
2.1 相關工作
2.1.1 基于用戶關系拓撲圖的鏈路預測問題
2.1.2 基于用戶簽到記錄的鏈路預測問題
2.1.3 基于多種數(shù)據(jù)源信息融合的鏈路預測問題
2.2 技術框架
2.2.1 局部敏感哈希
2.2.2 神經(jīng)網(wǎng)絡
2.2.3 網(wǎng)絡表示學習
2.2.4 矩陣分解
2.3 本章小結
第三章 基于多源異構數(shù)據(jù)的鏈路預測混合模型
3.1 MHLP的整體框架及工作流程
3.2 MHLP的基本定義
3.3 數(shù)據(jù)清洗基本方案
3.3.1 確定簽到范圍
3.3.2 選擇簽到時間
3.3.3 刪除冗余數(shù)據(jù)
3.3.4 用戶一致性
3.4 連通子圖獲取方案及算法
3.5 訪問偏好建模
3.6 社交表示建模
3.7 本章小結
第四章 基于錨鏈接方法和LSH技術的鏈路預測混合模型
4.1 基于錨鏈接方法的鏈路預測混合模型
4.1.1 ALLP的整體框架及工作流程
4.1.2 ALLP的基本定義
4.1.3 ALLP的建模方案及算法
4.2 基于LSH技術的鏈路預測混合模型
4.2.1 LSHLP的整體框架及工作流程
4.2.2 LSHLP的基本定義
4.2.3 LSHLP的建模方案及算法
4.3 本章小結
第五章 實驗配置及相關性能結果
5.1 實驗數(shù)據(jù)集
5.2 實驗設置
5.2.1 實驗參數(shù)設置
5.2.2 基準模型及預測評估指標
5.2.3 F1的兩種實現(xiàn)策略
5.3 實驗發(fā)現(xiàn)
5.3.1 t-SNE降維投影分析
5.3.2 模型準確度評估
5.3.3 模型性能評估
5.4 本章小結
第六章 全文總結與未來展望
6.1 全文總結
6.2 未來展望
致謝
參考文獻
攻讀碩士學位期間取得的成果
【參考文獻】:
期刊論文
[1]網(wǎng)絡表示學習綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學:信息科學. 2017(08)
本文編號:3717218
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3717218.html
最近更新
教材專著