模式無關(guān)的社交網(wǎng)絡(luò)用戶識(shí)別算法
本文選題:用戶識(shí)別 切入點(diǎn):二部圖 出處:《西安交通大學(xué)學(xué)報(bào)》2013年12期
【摘要】:針對(duì)識(shí)別社交網(wǎng)絡(luò)用戶時(shí)存在的模式不一致問題,提出了基于分塊和二部圖的用戶識(shí)別算法。該算法通過將傳統(tǒng)分塊算法中的屬性值精確匹配擴(kuò)展為無模式信息下的屬性值近似匹配,避免了傳統(tǒng)用戶識(shí)別時(shí)所需的模式對(duì)齊;使用加權(quán)二部圖及Kuhn Munkres(KM)最大權(quán)匹配算法進(jìn)行源用戶檔案與待匹配用戶檔案間的相似度計(jì)算,解決了用戶檔案間屬性個(gè)數(shù)不同及語義語法異構(gòu)的問題。在社交網(wǎng)站Profilactic上采集了965個(gè)用戶的公開數(shù)據(jù),采用召回率、精確率和綜合指標(biāo)等評(píng)價(jià)指標(biāo)對(duì)算法進(jìn)行了實(shí)驗(yàn)評(píng)估。實(shí)驗(yàn)結(jié)果表明,所提算法能夠不依賴模式信息進(jìn)行實(shí)例級(jí)跨系統(tǒng)用戶識(shí)別,與基于屬性值精確匹配的算法相比,所提算法的召回率提高了6.2%~9.5%,綜合評(píng)價(jià)指標(biāo)提高了3%~4.2%。
[Abstract]:In order to solve the problem of pattern inconsistency in the identification of social network users, a user identification algorithm based on block and bipartite graph is proposed.By extending the exact matching of attribute values in the traditional block algorithm to approximate matching of attribute values without schema information, the proposed algorithm avoids the pattern alignment required by traditional user identification.By using weighted bipartite graph and Kuhn Munkres KM) maximum weight matching algorithm, the similarity between the source user file and the user file to be matched is calculated, which solves the problem of different number of attributes and heterogeneous semantic syntax among user files.The public data of 965 users were collected on the social network Profilactic. The algorithm was evaluated experimentally by using the evaluation indexes such as recall rate, precision rate and comprehensive index.The experimental results show that the proposed algorithm can recognize cross-system users without depending on the pattern information. Compared with the algorithm based on the exact matching of attribute values, the recall rate of the proposed algorithm is increased by 6.2and 9.5. the comprehensive evaluation index is increased by 34.2.
【作者單位】: 西安交通大學(xué)電子與信息工程學(xué)院;西安建筑科技大學(xué)信息與控制工程學(xué)院;陜西電力信通有限公司;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61272458) 陜西省自然科學(xué)基礎(chǔ)研究計(jì)劃資助項(xiàng)目(2013JM8021) 西安建筑科技大學(xué)青年基金資助項(xiàng)目(2013JK1189)
【分類號(hào)】:TP393.09
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫名松;王艷麗;唐亮;;一種改進(jìn)的Web日志數(shù)據(jù)預(yù)處理研究[J];自動(dòng)化技術(shù)與應(yīng)用;2008年03期
2 賈丙靜;吳長勤;王傳安;葛華;;Web日志預(yù)處理技術(shù)探析[J];電腦知識(shí)與技術(shù);2011年10期
3 包敬海;;金融危機(jī)下門戶網(wǎng)站個(gè)性化服務(wù)的研究[J];重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
4 靳風(fēng)榮,鄭雪峰;Web日志挖掘的預(yù)處理過程及算法[J];微型電腦應(yīng)用;2004年06期
5 鄒根;聞立杰;;基于支持向量機(jī)的Web日志用戶標(biāo)志修正算法[J];計(jì)算機(jī)集成制造系統(tǒng);2011年08期
6 劉洪濤,張平,黃智興,程靜,劉革平;用戶瀏覽行為數(shù)據(jù)采集方法綜述[J];西南科技大學(xué)學(xué)報(bào);2004年02期
7 王聽忠;王輝;武新梅;;基于協(xié)同推薦的web日志預(yù)處理過程[J];微計(jì)算機(jī)信息;2006年03期
8 李煊,莊鎮(zhèn)泉;Web訪問挖掘預(yù)處理的用戶識(shí)別算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年07期
9 胡海星;;搜尋恐怖分子題解——2002年第11期題解[J];程序員;2003年01期
10 盧喜利;周軍;周月鵬;;基于Cookie技術(shù)和啟發(fā)式規(guī)則的用戶識(shí)別算法[J];微計(jì)算機(jī)應(yīng)用;2009年11期
相關(guān)會(huì)議論文 前7條
1 童建剛;;計(jì)算機(jī)用戶識(shí)別技術(shù)[A];第三次全國計(jì)算機(jī)安全技術(shù)交流會(huì)論文集[C];1988年
2 沈衛(wèi)超;宋成久;;關(guān)于對(duì)抗拒絕服務(wù)攻擊的幾個(gè)方法[A];第十七次全國計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)暨電子政務(wù)安全研討會(huì)論文集[C];2002年
3 周有根;;計(jì)算機(jī)通信網(wǎng)的保密[A];第三次全國計(jì)算機(jī)安全技術(shù)交流會(huì)論文集[C];1988年
4 喬?hào)|海;;計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的安全保護(hù)[A];第二次計(jì)算機(jī)安全技術(shù)交流會(huì)論文集[C];1987年
5 劉凱鵬;方濱興;;一種基于社會(huì)性標(biāo)注的網(wǎng)頁排序算法[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
6 吳珊;楊樺;;基于日志挖掘的Web預(yù)取模型[A];2006年電氣工程教育專業(yè)委員會(huì)年會(huì)論文集[C];2006年
7 蔡猷花;張岐山;;Web日志挖掘及其在電子商務(wù)領(lǐng)域的應(yīng)用[A];第10屆計(jì)算機(jī)模擬與信息技術(shù)會(huì)議論文集[C];2005年
相關(guān)重要報(bào)紙文章 前9條
1 趙慧玲 吳江;VPN放心用[N];中國計(jì)算機(jī)報(bào);2001年
2 容旭;魔高一尺 道高一丈[N];中國電腦教育報(bào);2003年
3 李磬;移動(dòng)支付安全闖關(guān)[N];計(jì)算機(jī)世界;2005年
4 ;真金也要火煉[N];網(wǎng)絡(luò)世界;2006年
5 ;青島電信寬帶IP城域網(wǎng)(四)[N];通信產(chǎn)業(yè)報(bào);2002年
6 Jerry Iwanski邋 Route1公司首席技術(shù)官;智能卡結(jié)合PKI比限制訪問更安全[N];計(jì)算機(jī)世界;2007年
7 北電網(wǎng)絡(luò);青島電信寬帶IP城域網(wǎng)分析[N];計(jì)算機(jī)世界;2002年
8 斯倫貝謝技術(shù)(亞洲)有限公司 楊凱莉;SIM卡與WAP應(yīng)用的配合——WIM卡[N];中國電子報(bào);2000年
9 ;基于網(wǎng)絡(luò)的IP VPN的安全要求[N];人民郵電;2001年
相關(guān)博士學(xué)位論文 前1條
1 李超鋒;Web使用挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 王善民;電子商務(wù)網(wǎng)站用戶跟蹤與訪問數(shù)據(jù)分析研究[D];吉林大學(xué);2009年
2 陳曉萍;一種新的基于用戶識(shí)別的圖形口令機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
3 陳步橋;民航公眾信息服務(wù)平臺(tái)中基于BPEL的動(dòng)態(tài)服務(wù)組合研究與實(shí)現(xiàn)[D];南京航空航天大學(xué);2010年
4 苑昆峰;面向Web個(gè)性化服務(wù)的網(wǎng)頁分類技術(shù)[D];重慶大學(xué);2007年
5 馬相華;基于訪問日志的自適應(yīng)站點(diǎn)的研究[D];大連海事大學(xué);2008年
6 沈婧;綜合風(fēng)險(xiǎn)智能主題推送技術(shù)的研究與應(yīng)用[D];西北大學(xué);2008年
7 朱晉華;WEB日志用戶會(huì)話識(shí)別及聚類分析研究[D];太原理工大學(xué);2008年
8 劉麗娜;基于Web日志挖掘的推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];東北師范大學(xué);2008年
9 王蕾;基于Web日志挖掘的推薦系統(tǒng)研究[D];吉林大學(xué);2008年
10 韓云端;基于瀏覽者的網(wǎng)站結(jié)構(gòu)研究[D];山西財(cái)經(jīng)大學(xué);2006年
,本文編號(hào):1725676
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1725676.html