跨社交網(wǎng)絡(luò)用戶身份識別算法研究
發(fā)布時間:2020-07-09 20:40
【摘要】:近年來,各種社交網(wǎng)絡(luò)如雨后春筍般應(yīng)運(yùn)而生,如微博、豆瓣、知乎等,并逐漸成為人們生活中不可或缺的組成部分?缟缃痪W(wǎng)絡(luò)用戶身份識別算法研究作為在線社交網(wǎng)絡(luò)研究的重要組成部分,在網(wǎng)絡(luò)空間安全、個性化服務(wù)推薦和社交網(wǎng)絡(luò)數(shù)據(jù)挖掘等領(lǐng)域具有重要的意義。目前,跨社交網(wǎng)絡(luò)用戶身份識別算法研究已經(jīng)取得相當(dāng)大的進(jìn)展,各種身份識別算法相繼被提出,但是相關(guān)研究中仍然存在標(biāo)簽的非一致性、匹配結(jié)果的不穩(wěn)定性和檔案特征提取的片面性等問題。本文針對這些問題提出兩種用戶身份識別算法。首先,為了解決標(biāo)簽非一致性問題,提出了一種基于用戶標(biāo)簽語義相似性的用戶身份識別算法。首先,該算法使用用戶名相似度作為標(biāo)準(zhǔn)來挑選候選匹配賬號;其次,使用基于標(biāo)簽語義的相似度計算兩個賬號標(biāo)簽之間的相似度特征,并針對標(biāo)簽缺失的情況使用主題生成模型從用戶發(fā)布的文本信息中提取主題關(guān)鍵字作為用戶標(biāo)簽;最后,該算法通過計算兩個賬戶的標(biāo)簽相似度是否大于某個閾值來確定兩個賬戶的匹配。與傳統(tǒng)基于標(biāo)簽的用戶身份識別算法的對比實(shí)驗(yàn)表明,平均倒數(shù)排名提高了 15%,準(zhǔn)確率、精確率、召回率和Fl-score分別提高了 22%、15.7%、24%和20.5%。其次,為了解決匹配結(jié)果的不穩(wěn)定性和檔案特征提取的片面性,提出了一種基于穩(wěn)定婚姻匹配的用戶身份識別算法。首先,使用用戶名和好友鏈接結(jié)合的方式選擇候選賬號;其次,對用戶檔案的屬性項(xiàng)提取字符、語義以及屬性間的相似性特征;最后,使用雙向匹配算法實(shí)現(xiàn)賬號的匹配。與前人提出相關(guān)算法的對比實(shí)驗(yàn)表明,在精確率、召回率和F1-score分別提高了2%、28%和18.8%。最后,本文對跨社交網(wǎng)絡(luò)用戶身份識別算法做了總結(jié),分析了文中提出的跨社交網(wǎng)絡(luò)見戶身份識別算法的優(yōu)缺點(diǎn),并對該領(lǐng)域的發(fā)展方向進(jìn)行了展望。
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.3
【圖文】:
擁有5.54個賬號,并長期經(jīng)常使用的賬號數(shù)為2.82個。在大數(shù)據(jù)時代,人們現(xiàn)在普遍認(rèn)逡逑識到打通數(shù)據(jù)間的“孤島”,實(shí)現(xiàn)數(shù)據(jù)的融合,從而提高工作效率和服務(wù)質(zhì)量,產(chǎn)生更加逡逑巨大的財富和價值。如圖1.1所示,識別出互聯(lián)網(wǎng)用戶在不同社交網(wǎng)絡(luò)中的多重身份,在逡逑不同的社交網(wǎng)站之間建立起孤島之間的“橋梁”,就可以將孤立在各個社交網(wǎng)絡(luò)中的“數(shù)逡逑據(jù)碎片”鏈接起來,實(shí)現(xiàn)多個社交網(wǎng)絡(luò)的融合,從而更大限度的收集用戶信息,對用戶逡逑海量社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行充分挖掘,構(gòu)建出用戶完整的社交網(wǎng)絡(luò)圖。逡逑凡逡逑力口邐,李一李一^趙'邐白逡逑燕邐\嚴(yán)邐嚴(yán)Z邐陸逡逑圖1.1跨社交網(wǎng)絡(luò)用戶身份識別舉例逡逑1.1.2研究意義逡逑(1)網(wǎng)絡(luò)空間治安管理逡逑隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,社交網(wǎng)絡(luò)充斥著各種危險,人們對于網(wǎng)絡(luò)空間安全越逡逑來越重視[51。在社交網(wǎng)絡(luò)平臺上除了正常的用戶之外,一些不法分子也會潛伏在這些社逡逑交網(wǎng)絡(luò)平臺上。一些非法分子同時在不同的社交網(wǎng)絡(luò)中注冊多個身份賬號,針對各種社逡逑交網(wǎng)站提供的各類行為接口
定義2.4跨社交網(wǎng)絡(luò)連接.用■,吻表示社交網(wǎng)絡(luò)N現(xiàn)械撓沒矸菡撕佩義希ズ蛻緗煌紓牽倉械撓沒矸藎ナ粲諳呦巒桓鲇沒В,而咖E炁]彶,邋?邋?邋?,表示揩k義仙緗煌緦蛹。根据定义,该类连接关系具有对称性,壤_跡玻彼盡e義希瑰義
本文編號:2747953
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.3
【圖文】:
擁有5.54個賬號,并長期經(jīng)常使用的賬號數(shù)為2.82個。在大數(shù)據(jù)時代,人們現(xiàn)在普遍認(rèn)逡逑識到打通數(shù)據(jù)間的“孤島”,實(shí)現(xiàn)數(shù)據(jù)的融合,從而提高工作效率和服務(wù)質(zhì)量,產(chǎn)生更加逡逑巨大的財富和價值。如圖1.1所示,識別出互聯(lián)網(wǎng)用戶在不同社交網(wǎng)絡(luò)中的多重身份,在逡逑不同的社交網(wǎng)站之間建立起孤島之間的“橋梁”,就可以將孤立在各個社交網(wǎng)絡(luò)中的“數(shù)逡逑據(jù)碎片”鏈接起來,實(shí)現(xiàn)多個社交網(wǎng)絡(luò)的融合,從而更大限度的收集用戶信息,對用戶逡逑海量社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行充分挖掘,構(gòu)建出用戶完整的社交網(wǎng)絡(luò)圖。逡逑凡逡逑力口邐,李一李一^趙'邐白逡逑燕邐\嚴(yán)邐嚴(yán)Z邐陸逡逑圖1.1跨社交網(wǎng)絡(luò)用戶身份識別舉例逡逑1.1.2研究意義逡逑(1)網(wǎng)絡(luò)空間治安管理逡逑隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,社交網(wǎng)絡(luò)充斥著各種危險,人們對于網(wǎng)絡(luò)空間安全越逡逑來越重視[51。在社交網(wǎng)絡(luò)平臺上除了正常的用戶之外,一些不法分子也會潛伏在這些社逡逑交網(wǎng)絡(luò)平臺上。一些非法分子同時在不同的社交網(wǎng)絡(luò)中注冊多個身份賬號,針對各種社逡逑交網(wǎng)站提供的各類行為接口
定義2.4跨社交網(wǎng)絡(luò)連接.用■,吻表示社交網(wǎng)絡(luò)N現(xiàn)械撓沒矸菡撕佩義希ズ蛻緗煌紓牽倉械撓沒矸藎ナ粲諳呦巒桓鲇沒В,而咖E炁]彶,邋?邋?邋?,表示揩k義仙緗煌緦蛹。根据定义,该类连接关系具有对称性,壤_跡玻彼盡e義希瑰義
本文編號:2747953
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2747953.html
最近更新
教材專著