異質信息網絡中基于表征學習的推薦算法研究
發(fā)布時間:2021-07-05 22:13
隨著互聯網上信息和內容的爆炸式增長,我們進入了一個“信息過載”的時代。人們難以迅速有效地找到自己所需的內容或項目,因此推薦系統(tǒng)應運而生,通過對用戶偏好和項目特征的建模幫助人們挖掘他們可能感興趣的內容或項目。早期的推薦系統(tǒng)僅考慮了用戶的歷史行為,可能導致用戶和項目建模產生偏差,影響推薦效果。近年來,很多研究利用用戶和項目的輔助信息來提高推薦算法的性能。在現實的推薦系統(tǒng)中,用戶、項目及其輔助信息可以看做不同類型的對象,這些對象間存在不同類型的關系(如用戶對項目的購買關系,項目與其屬性的所屬關系),這些多種類型的對象和關系就形成了一個異質信息網絡;诋愘|信息網絡的推薦算法由于能夠自然且有效地對復雜信息進行建模,引起了人們的注意;诋愘|信息網絡的算法多數首先利用多條元路徑從不同的角度抽取異質網絡上用戶和項目間的豐富語義信息,然后進行推薦。雖然已有方法取得了一定的效果提升,但大多數方法存在以下問題之一:1)他們在每條元路徑上獨立的抽取信息并對用戶和項目進行建模,當某些元路徑上的數據比較稀疏或噪音較大時,信息抽取存在誤差;2)在探索異質信息網絡的過程中,對用戶和項目的建模目標僅是挖掘網絡上的結...
【文章來源】:北京大學北京市 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:55 頁
【學位級別】:碩士
【部分圖文】:
神經網絡圖示
北京大學碩士學位論文不同的元路徑下的相似性不同。基于元路徑,Sun (Sun et al., 201im 方法,可以衡量兩個相同類型節(jié)點在對稱元路徑上的相似性。性的限制,Lao 和 Cohen (Lao et al., 2010a, 2010b)提出了限定路徑)方法來衡量不同類型節(jié)點在非對稱元路徑上的相似性。為了衡量點間的相似性關系,Shi (Shi et al., 2014)提出了 HeteSim 方法并給。在 HeteSim 的基礎上,為了降低時間和空間復雜度,Meng (M利用給定元路徑及其逆向路徑下的兩個隨機游走過程衡量節(jié)點間徑同樣也存在問題。以圖 2.2 情況為例,元路徑“用戶→評價→可以捕捉用戶 1 和用戶 2 間的語義關系,因為他們都給阿凡達寫”的標簽。但是如果想捕捉兩個用戶都給電影打了相同的標簽的同評分的關系,元路徑就無能為力。近兩年,Fang 和 Huang(Fang al., 2016)提出了使用元結構(或元圖)來表示異質信息網絡中的節(jié)路徑不能表示的復雜語義關系。
圖 2.3 異質信息網絡中基于分解的表征學習方法基于分解的方法采用“分而治之”的思想,基于元路徑、元結構等方法,將網絡分解成幾個簡單的網絡結構(如同質信息網絡),再分別進行網絡表征將不同簡單網絡上的表征融合起來,如圖 2.3 所示,其中使用鄰接矩陣表示網絡, 表示在基于第 條元路徑分解得到的同質信息網絡上進行學習,得到入表示, 表示融合后節(jié)點最終的嵌入表示。同質信息網絡的表征學習領域已有較多工作。DeepWalk (Perozzi et al., 2014) 的隨機游走與 Skip-Gram (Mikolov et al., 2013) 結合起來,學習節(jié)點的嵌入表DeepWalk 的基礎上,node2vec(Grover et al., 2016)改進了隨機游走的策略,以到局部和宏觀的信息。Line (Tang et al., 2015) 認為兩個節(jié)點的相似性可以從和上下文相似性兩個角度進行考量,并基于這兩種相似性分別學習節(jié)點的表將這兩類嵌入表示融合起來。除了采用網絡表征學習的方法,一種比較簡單的方法是采用矩陣分解的方法路徑分解得到的多個同質網絡可以表示成鄰接矩陣,因此可以在鄰接矩陣上
【參考文獻】:
期刊論文
[1]一種基于元路徑的異質信息網絡鏈路預測模型[J]. 黃立威,李德毅,馬于濤,鄭思儀,張海粟,付鷹. 計算機學報. 2014(04)
[2]互聯網推薦系統(tǒng)比較研究[J]. 許海玲,吳瀟,李曉東,閻保平. 軟件學報. 2009(02)
本文編號:3266920
【文章來源】:北京大學北京市 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:55 頁
【學位級別】:碩士
【部分圖文】:
神經網絡圖示
北京大學碩士學位論文不同的元路徑下的相似性不同。基于元路徑,Sun (Sun et al., 201im 方法,可以衡量兩個相同類型節(jié)點在對稱元路徑上的相似性。性的限制,Lao 和 Cohen (Lao et al., 2010a, 2010b)提出了限定路徑)方法來衡量不同類型節(jié)點在非對稱元路徑上的相似性。為了衡量點間的相似性關系,Shi (Shi et al., 2014)提出了 HeteSim 方法并給。在 HeteSim 的基礎上,為了降低時間和空間復雜度,Meng (M利用給定元路徑及其逆向路徑下的兩個隨機游走過程衡量節(jié)點間徑同樣也存在問題。以圖 2.2 情況為例,元路徑“用戶→評價→可以捕捉用戶 1 和用戶 2 間的語義關系,因為他們都給阿凡達寫”的標簽。但是如果想捕捉兩個用戶都給電影打了相同的標簽的同評分的關系,元路徑就無能為力。近兩年,Fang 和 Huang(Fang al., 2016)提出了使用元結構(或元圖)來表示異質信息網絡中的節(jié)路徑不能表示的復雜語義關系。
圖 2.3 異質信息網絡中基于分解的表征學習方法基于分解的方法采用“分而治之”的思想,基于元路徑、元結構等方法,將網絡分解成幾個簡單的網絡結構(如同質信息網絡),再分別進行網絡表征將不同簡單網絡上的表征融合起來,如圖 2.3 所示,其中使用鄰接矩陣表示網絡, 表示在基于第 條元路徑分解得到的同質信息網絡上進行學習,得到入表示, 表示融合后節(jié)點最終的嵌入表示。同質信息網絡的表征學習領域已有較多工作。DeepWalk (Perozzi et al., 2014) 的隨機游走與 Skip-Gram (Mikolov et al., 2013) 結合起來,學習節(jié)點的嵌入表DeepWalk 的基礎上,node2vec(Grover et al., 2016)改進了隨機游走的策略,以到局部和宏觀的信息。Line (Tang et al., 2015) 認為兩個節(jié)點的相似性可以從和上下文相似性兩個角度進行考量,并基于這兩種相似性分別學習節(jié)點的表將這兩類嵌入表示融合起來。除了采用網絡表征學習的方法,一種比較簡單的方法是采用矩陣分解的方法路徑分解得到的多個同質網絡可以表示成鄰接矩陣,因此可以在鄰接矩陣上
【參考文獻】:
期刊論文
[1]一種基于元路徑的異質信息網絡鏈路預測模型[J]. 黃立威,李德毅,馬于濤,鄭思儀,張海粟,付鷹. 計算機學報. 2014(04)
[2]互聯網推薦系統(tǒng)比較研究[J]. 許海玲,吳瀟,李曉東,閻保平. 軟件學報. 2009(02)
本文編號:3266920
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3266920.html