在線社交網(wǎng)絡(luò)用戶身份匹配算法研究
發(fā)布時間:2020-05-28 11:31
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的日益發(fā)展,在線社交網(wǎng)絡(luò)吸引了越來越多的注冊用戶,同時也呈現(xiàn)出多樣化的趨勢。在線社交網(wǎng)絡(luò)的多樣化在極大豐富了用戶網(wǎng)絡(luò)生活的同時,也使用戶的身份信息碎片化。在線社交網(wǎng)絡(luò)用戶身份匹配就是將屬于現(xiàn)實生活中同一個用戶的多個社交網(wǎng)絡(luò)賬號進行匹配,從而實現(xiàn)多個在線社交網(wǎng)絡(luò)的用戶信息整合的一種技術(shù),在商品推薦、用戶信息關(guān)聯(lián)以及網(wǎng)絡(luò)安全領(lǐng)域有著十分重要的意義。當(dāng)前,在線社交網(wǎng)絡(luò)用戶身份匹配的相關(guān)研究已經(jīng)取得很大進展,但仍然存在以下不足:(1)當(dāng)前基于網(wǎng)絡(luò)結(jié)構(gòu)信息的用戶身份匹配算法難以表達網(wǎng)絡(luò)中的高階結(jié)構(gòu)信息,同時缺少對其他維度信息的利用導(dǎo)致準確率不高。(2)當(dāng)前基于用戶檔案信息的用戶身份匹配算法在融合多屬性信息時,往往由于采用主觀賦值客觀修正的權(quán)值分配方法導(dǎo)致算法魯棒性不強,并且沒有考慮各屬性之間的隱含關(guān)系。(3)基于用戶時空軌跡信息的用戶身份匹配算法對位置訪問順序特征的提取能力較弱,難以準確描述時空軌跡特征。針對以上問題,本文分別基于在線社交網(wǎng)絡(luò)中的網(wǎng)絡(luò)結(jié)構(gòu)信息、用戶檔案信息和用戶時空軌跡數(shù)據(jù)提出了三種用戶身份匹配算法。主要內(nèi)容包括:(1)提出一種基于網(wǎng)絡(luò)表示學(xué)習(xí)的用戶身份匹配算法,以網(wǎng)絡(luò)結(jié)構(gòu)信息為主,同時結(jié)合用戶名屬性信息進行用戶身份匹配。由于網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)能夠以較低的計算復(fù)雜度表達網(wǎng)絡(luò)的高階結(jié)構(gòu)信息,可以彌補傳統(tǒng)算法計算復(fù)雜度高、難以勝任高階節(jié)點信息計算的缺陷,因此算法引入網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)。在此基礎(chǔ)上融合用戶名屬性信息,得到結(jié)合了網(wǎng)絡(luò)結(jié)構(gòu)信息和用戶名信息的賬號向量表示,并通過計算向量相似度判定匹配賬號。在兩組真實社交網(wǎng)絡(luò)數(shù)據(jù)集上的實驗結(jié)果表明,算法的綜合性能與基準算法相比有所提升。(2)提出一種基于模糊積分理論的檔案信息融合用戶身份匹配算法。從用戶檔案信息出發(fā),解決用戶身份匹配問題。模糊積分理論提供一種檔案信息融合的方法,為屬性合理分配權(quán)值,可以在一定程度上解決現(xiàn)有算法在屬性權(quán)值分配時魯棒性不強的問題。算法引入模糊測度理論和離散Choquet積分,首先為用戶檔案信息中的不同屬性分配不同的相似度計算策略;其次利用粒子群優(yōu)化算法為用戶檔案信息中的每種屬性計算模糊測度并作為屬性權(quán)值;最后利用Choquet積分計算賬號之間的相似度并以此判定匹配賬號。在三組真實社交網(wǎng)絡(luò)數(shù)據(jù)集中的實驗結(jié)果表明,相比傳統(tǒng)算法,本算法綜合性能指標提升了3.89%-25.6%,驗證了算法的有效性。(3)提出一種基于時空軌跡順序特征表示的用戶身份匹配算法。從用戶行為信息中的時空軌跡數(shù)據(jù)出發(fā),解決用戶身份匹配問題。算法引入循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用來解決傳統(tǒng)時空軌跡匹配算法對位置訪問順序特征提取能力較弱的問題。首先對軌跡數(shù)據(jù)進行預(yù)處理,將坐標數(shù)據(jù)轉(zhuǎn)化為網(wǎng)格,同時將軌跡按時間粒度進行分割;其次利用word2vec算法挖掘軌跡點蘊含的語義信息;然后引入Bi-GRU模型提取軌跡序列中蘊含的位置訪問順序特征,計算出軌跡特征向量;最后通過計算軌跡向量相似度判定匹配賬號。在兩組以位置分享為主要功能的社交網(wǎng)絡(luò)中進行的實驗表明,該算法能提取軌跡順序特征,有效提升算法的綜合性能。
【圖文】:
圖 2.1 對有向圖社交網(wǎng)絡(luò)的簡化舉例:指在線社交網(wǎng)絡(luò)賬號在現(xiàn)實生活中的所有且一個真實用戶在每個社交網(wǎng)絡(luò)中最多擁有 ):是從賬號到真實用戶的映射,即 i u表:指跨網(wǎng)絡(luò)的兩個賬號都對應(yīng)同一個真實用不同的在線社交網(wǎng)絡(luò)的賬號。 ):指算法運行前,數(shù)據(jù)集中已知匹配的合,即 = X Yi j u , u , ,,其中Xiu 和Yju 是網(wǎng)絡(luò)用戶身份匹配):輸入在線社交網(wǎng)絡(luò)X 用戶身份匹配算法得到的所有匹配賬號的更1Xu3Xu5Yu3YuX Y YpYT
圖 2.1 對有向圖社交網(wǎng)絡(luò)的簡化舉例用戶):指在線社交網(wǎng)絡(luò)賬號在現(xiàn)實生活中的所有戶,并且一個真實用戶在每個社交網(wǎng)絡(luò)中最多擁有映射 ):是從賬號到真實用戶的映射,即 i u表匹配):指跨網(wǎng)絡(luò)的兩個賬號都對應(yīng)同一個真實用屬于不同的在線社交網(wǎng)絡(luò)的賬號。賬號集 ):指算法運行前,數(shù)據(jù)集中已知匹配的賬號集合,即 = X Yi j u , u , ,其中Xiu 和Yju 是匹社交網(wǎng)絡(luò)用戶身份匹配):輸入在線社交網(wǎng)絡(luò)X 了通過用戶身份匹配算法得到的所有匹配賬號的更X Y
【學(xué)位授予單位】:戰(zhàn)略支援部隊信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.08
本文編號:2685177
【圖文】:
圖 2.1 對有向圖社交網(wǎng)絡(luò)的簡化舉例:指在線社交網(wǎng)絡(luò)賬號在現(xiàn)實生活中的所有且一個真實用戶在每個社交網(wǎng)絡(luò)中最多擁有 ):是從賬號到真實用戶的映射,即 i u表:指跨網(wǎng)絡(luò)的兩個賬號都對應(yīng)同一個真實用不同的在線社交網(wǎng)絡(luò)的賬號。 ):指算法運行前,數(shù)據(jù)集中已知匹配的合,即 = X Yi j u , u , ,,其中Xiu 和Yju 是網(wǎng)絡(luò)用戶身份匹配):輸入在線社交網(wǎng)絡(luò)X 用戶身份匹配算法得到的所有匹配賬號的更1Xu3Xu5Yu3YuX Y YpYT
圖 2.1 對有向圖社交網(wǎng)絡(luò)的簡化舉例用戶):指在線社交網(wǎng)絡(luò)賬號在現(xiàn)實生活中的所有戶,并且一個真實用戶在每個社交網(wǎng)絡(luò)中最多擁有映射 ):是從賬號到真實用戶的映射,即 i u表匹配):指跨網(wǎng)絡(luò)的兩個賬號都對應(yīng)同一個真實用屬于不同的在線社交網(wǎng)絡(luò)的賬號。賬號集 ):指算法運行前,數(shù)據(jù)集中已知匹配的賬號集合,即 = X Yi j u , u , ,其中Xiu 和Yju 是匹社交網(wǎng)絡(luò)用戶身份匹配):輸入在線社交網(wǎng)絡(luò)X 了通過用戶身份匹配算法得到的所有匹配賬號的更X Y
【學(xué)位授予單位】:戰(zhàn)略支援部隊信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.08
【參考文獻】
相關(guān)碩士學(xué)位論文 前1條
1 孟波;多社交網(wǎng)絡(luò)用戶身份識別算法研究[D];大連理工大學(xué);2015年
本文編號:2685177
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2685177.html
最近更新
教材專著