基于異構(gòu)網(wǎng)絡(luò)聯(lián)合嵌入的用戶對齊技術(shù)研究
發(fā)布時間:2021-11-25 02:51
隨著互聯(lián)網(wǎng)的迅速發(fā)展,在人們的日常生活中,社交網(wǎng)絡(luò)的重要程度也越來越高。人們通常會注冊多個不同的社交網(wǎng)絡(luò)賬號以享受不同的社交網(wǎng)絡(luò)的功能。用戶對齊是指將多個社交網(wǎng)絡(luò)中屬于現(xiàn)實世界中同一自然人的不同賬號進行對齊,從而將用戶散布在多個網(wǎng)絡(luò)中的碎片化信息進行整合,對網(wǎng)絡(luò)安全、社交網(wǎng)絡(luò)數(shù)據(jù)挖掘和商品推薦等領(lǐng)域都具有重要意義,F(xiàn)階段關(guān)于用戶對齊問題還存在缺陷:第一,很多用戶對齊研究都將社交網(wǎng)絡(luò)單獨嵌入到向量空間中,損失了網(wǎng)絡(luò)信息,無法有效挖掘網(wǎng)絡(luò)間隱藏信息。第二,在用戶屬性的利用上,大多數(shù)用戶對齊任務采用向量拼接的方式,無法有效地將網(wǎng)絡(luò)結(jié)構(gòu)與屬性相結(jié)合。針對上述問題,本文采用異構(gòu)網(wǎng)絡(luò)聯(lián)合嵌入的方式,開展了用戶對齊方法的研究。主要研究如下:1.提出了基于知識圖聯(lián)合嵌入的用戶對齊算法。首先,利用種子錨用戶對集合增加正例數(shù)量,并使得種子錨用戶對在嵌入空間中的距離更近;其次,提出了Near_K負采樣方法,保證負例質(zhì)量進而提升嵌入空間質(zhì)量;緊接著,提出了結(jié)構(gòu)相似度,充分考慮用戶在網(wǎng)絡(luò)結(jié)構(gòu)上的相似性,并結(jié)合余弦相似度共同度量用戶相似性;最后,采用基于自適應閾值的貪心匹配方法尋找潛在錨用戶對,并將每輪迭代中新找...
【文章來源】:重慶郵電大學重慶市
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
跨網(wǎng)絡(luò)用戶對齊示例圖[26]
重慶郵電大學碩士學位論文第2章相關(guān)理論基礎(chǔ)11合嵌入的方式對兩個社交網(wǎng)絡(luò)同時嵌入到統(tǒng)一的低維向量空間中。如圖2.2所示,圖2.2網(wǎng)絡(luò)聯(lián)合嵌入示例圖是網(wǎng)絡(luò)聯(lián)合嵌入的示例圖,通過部分已知的對齊的種子錨用戶對,將兩個網(wǎng)絡(luò)嵌入到統(tǒng)一的低維向量空間中。以種子錨用戶對為橋梁,通過聯(lián)合嵌入后,在嵌入空間中,錨用戶對之間的距離很近,而非錨用戶對的距離很遠。2.3基于知識圖嵌入的實體對齊技術(shù)2.3.1知識圖譜Google公司于2012年提出了一種基于圖的數(shù)據(jù)結(jié)構(gòu),即知識圖譜(KnowledgeGraph)。在知識圖譜中,圖中的節(jié)點稱為實體,邊稱為關(guān)系,且每個節(jié)點或每條邊均可以有一種或多種屬性。實體通常指的是現(xiàn)實世界中的存在的事物如地點、物品、人等等,關(guān)系則表示圖譜中各個事物之間具有的某種聯(lián)系。社交網(wǎng)絡(luò)就是一個典型的知識圖譜,圖2.3就是一個社交網(wǎng)絡(luò)知識圖譜的示例圖。圖中的藍色和黃色節(jié)點均表示實體,而各實體之間的邊就是關(guān)系。知識圖譜在具有關(guān)聯(lián)信息的查詢時有更好的效果,主要歸功于其能夠從語義層面理解查詢意圖。如今知識圖譜的查詢已經(jīng)被應用于各大類搜索引擎,例如在Google搜索引擎的搜索框中輸入科比·布萊恩特時,結(jié)果頁面右側(cè)就會顯示科比·布萊恩特的各類信息如出生年月、出生地、職業(yè)、配偶等。
重慶郵電大學碩士學位論文第2章相關(guān)理論基礎(chǔ)14復雜度低,且在實際的任務中取得了不俗成績。但是TransE也存在處理一對多、多對多和多對一的關(guān)系時顯得力不從心。圖2.4TransE模型[32]2.TransHTransE對復雜關(guān)系的應對存在效果不佳的問題,因此Wang等人在2014年提出了TransH模型[34]。圖2.5是TransH的示意圖,其核心思想是在不同的關(guān)系中,都有一個不同的超平面rW和關(guān)系向量rl。TransH這么做的目的是為了使得在不同的關(guān)系中同一實體所代表的含義可以不同,而同一關(guān)系中的不同實體所代表的含義可以相同。對一個三元組h,r,t,TransH首先將頭尾實體所對應的向量沿關(guān)系r所在超平面的法線rw方向投影,即:rThhrhrllwlw(2.4)rTttrtrllwlw(2.5)與TransE類似,TransH也定義了如下?lián)p失函數(shù)來優(yōu)化向量空間:12/(,)||||rrrhrtLLfhtlll(2.6)圖2.5TransH模型[32]
【參考文獻】:
期刊論文
[1]圖卷積神經(jīng)網(wǎng)絡(luò)綜述[J]. 徐冰冰,岑科廷,黃俊杰,沈華偉,程學旗. 計算機學報. 2020(05)
[2]表示學習知識圖譜的實體對齊算法[J]. 朱繼召,喬建忠,林樹寬. 東北大學學報(自然科學版). 2018(11)
[3]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
[4]基于用戶名特征的用戶身份同一性判定方法[J]. 劉東,吳泉源,韓偉紅,周斌. 計算機學報. 2015(10)
碩士論文
[1]基于網(wǎng)絡(luò)表征學習的異構(gòu)社交網(wǎng)絡(luò)對齊研究[D]. 王寧.太原理工大學 2018
本文編號:3517259
【文章來源】:重慶郵電大學重慶市
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
跨網(wǎng)絡(luò)用戶對齊示例圖[26]
重慶郵電大學碩士學位論文第2章相關(guān)理論基礎(chǔ)11合嵌入的方式對兩個社交網(wǎng)絡(luò)同時嵌入到統(tǒng)一的低維向量空間中。如圖2.2所示,圖2.2網(wǎng)絡(luò)聯(lián)合嵌入示例圖是網(wǎng)絡(luò)聯(lián)合嵌入的示例圖,通過部分已知的對齊的種子錨用戶對,將兩個網(wǎng)絡(luò)嵌入到統(tǒng)一的低維向量空間中。以種子錨用戶對為橋梁,通過聯(lián)合嵌入后,在嵌入空間中,錨用戶對之間的距離很近,而非錨用戶對的距離很遠。2.3基于知識圖嵌入的實體對齊技術(shù)2.3.1知識圖譜Google公司于2012年提出了一種基于圖的數(shù)據(jù)結(jié)構(gòu),即知識圖譜(KnowledgeGraph)。在知識圖譜中,圖中的節(jié)點稱為實體,邊稱為關(guān)系,且每個節(jié)點或每條邊均可以有一種或多種屬性。實體通常指的是現(xiàn)實世界中的存在的事物如地點、物品、人等等,關(guān)系則表示圖譜中各個事物之間具有的某種聯(lián)系。社交網(wǎng)絡(luò)就是一個典型的知識圖譜,圖2.3就是一個社交網(wǎng)絡(luò)知識圖譜的示例圖。圖中的藍色和黃色節(jié)點均表示實體,而各實體之間的邊就是關(guān)系。知識圖譜在具有關(guān)聯(lián)信息的查詢時有更好的效果,主要歸功于其能夠從語義層面理解查詢意圖。如今知識圖譜的查詢已經(jīng)被應用于各大類搜索引擎,例如在Google搜索引擎的搜索框中輸入科比·布萊恩特時,結(jié)果頁面右側(cè)就會顯示科比·布萊恩特的各類信息如出生年月、出生地、職業(yè)、配偶等。
重慶郵電大學碩士學位論文第2章相關(guān)理論基礎(chǔ)14復雜度低,且在實際的任務中取得了不俗成績。但是TransE也存在處理一對多、多對多和多對一的關(guān)系時顯得力不從心。圖2.4TransE模型[32]2.TransHTransE對復雜關(guān)系的應對存在效果不佳的問題,因此Wang等人在2014年提出了TransH模型[34]。圖2.5是TransH的示意圖,其核心思想是在不同的關(guān)系中,都有一個不同的超平面rW和關(guān)系向量rl。TransH這么做的目的是為了使得在不同的關(guān)系中同一實體所代表的含義可以不同,而同一關(guān)系中的不同實體所代表的含義可以相同。對一個三元組h,r,t,TransH首先將頭尾實體所對應的向量沿關(guān)系r所在超平面的法線rw方向投影,即:rThhrhrllwlw(2.4)rTttrtrllwlw(2.5)與TransE類似,TransH也定義了如下?lián)p失函數(shù)來優(yōu)化向量空間:12/(,)||||rrrhrtLLfhtlll(2.6)圖2.5TransH模型[32]
【參考文獻】:
期刊論文
[1]圖卷積神經(jīng)網(wǎng)絡(luò)綜述[J]. 徐冰冰,岑科廷,黃俊杰,沈華偉,程學旗. 計算機學報. 2020(05)
[2]表示學習知識圖譜的實體對齊算法[J]. 朱繼召,喬建忠,林樹寬. 東北大學學報(自然科學版). 2018(11)
[3]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
[4]基于用戶名特征的用戶身份同一性判定方法[J]. 劉東,吳泉源,韓偉紅,周斌. 計算機學報. 2015(10)
碩士論文
[1]基于網(wǎng)絡(luò)表征學習的異構(gòu)社交網(wǎng)絡(luò)對齊研究[D]. 王寧.太原理工大學 2018
本文編號:3517259
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3517259.html
最近更新
教材專著