基于社交網(wǎng)絡(luò)節(jié)點(diǎn)特性的鏈路預(yù)測(cè)算法研究
本文選題:社交網(wǎng)絡(luò) 切入點(diǎn):鏈路預(yù)測(cè) 出處:《新疆大學(xué)》2017年碩士論文 論文類(lèi)型:學(xué)位論文
【摘要】:如今計(jì)算機(jī)技術(shù)飛速發(fā)展,網(wǎng)絡(luò)技術(shù)改變了人們的生活。各種社交網(wǎng)站的流行及智能終端的普及,使人們?cè)谔摂M的網(wǎng)絡(luò)中留下了海量的、真實(shí)的數(shù)據(jù),這為網(wǎng)絡(luò)分析研究提供了數(shù)據(jù)基礎(chǔ)。隨著社交網(wǎng)絡(luò)的不斷壯大,人們?cè)谙硎茇S富的數(shù)字生活帶來(lái)便捷的同時(shí)也感受到了信息膨脹帶來(lái)的煩惱,即人們無(wú)法在海量數(shù)據(jù)中快速有效地提取的最相關(guān)的信息價(jià)值。對(duì)網(wǎng)絡(luò)中可能存在或者已存在但未被發(fā)現(xiàn)的鏈接進(jìn)行預(yù)測(cè),有利于分析網(wǎng)絡(luò)數(shù)據(jù)的缺失、分析復(fù)雜網(wǎng)絡(luò)演化機(jī)制等問(wèn)題,該研究在社交網(wǎng)絡(luò)分析中具有重要意義。根據(jù)網(wǎng)絡(luò)中已有的鏈接信息預(yù)測(cè)將來(lái)可能產(chǎn)生的鏈接,是網(wǎng)絡(luò)分析的基本問(wèn)題,在商業(yè)社交應(yīng)用界也被廣泛需求。目前,主要有基于局部信息相似性、基于路徑和基于隨機(jī)游走三類(lèi)鏈路預(yù)測(cè)算法;诰植啃畔⑾嗨菩缘乃惴ㄟ\(yùn)算簡(jiǎn)單,算法復(fù)雜度低,預(yù)測(cè)精度也相對(duì)較低,是目前運(yùn)用最廣泛的鏈路預(yù)測(cè)方法;诼窂胶突陔S機(jī)游走的方法較復(fù)雜,算法的時(shí)間復(fù)雜度高,對(duì)實(shí)際社交網(wǎng)絡(luò)的應(yīng)用性低。現(xiàn)有的基于局部相似性的鏈路預(yù)測(cè)方法,多數(shù)僅使用節(jié)點(diǎn)度進(jìn)行預(yù)測(cè),沒(méi)有體現(xiàn)出重要節(jié)點(diǎn)度的作用,因此使算法的預(yù)測(cè)效果降低。提升鏈路預(yù)測(cè)精度是復(fù)雜網(wǎng)絡(luò)研究的基礎(chǔ)問(wèn)題之一。本文對(duì)社交網(wǎng)絡(luò)中鏈路預(yù)測(cè)問(wèn)題進(jìn)行了研究,主要工作和貢獻(xiàn)如下:1、一些具有重要作用的節(jié)點(diǎn)可能具有更大的影響力或者更強(qiáng)的信息傳播能力,現(xiàn)有的基于節(jié)點(diǎn)相似的鏈路預(yù)測(cè)指標(biāo)沒(méi)有充分利用網(wǎng)絡(luò)節(jié)點(diǎn)的重要性,針對(duì)該問(wèn)題提出基于節(jié)點(diǎn)重要性的鏈路預(yù)測(cè)算法,新的算法在共同鄰居、Adamic-Adar、Resource Allocation相似性算法的基礎(chǔ)上,充分利用了節(jié)點(diǎn)度中心性、接近中心性及介數(shù)中心性的信息,提出考慮節(jié)點(diǎn)重要性的CN、AA、RA鏈路預(yù)測(cè)相似性算法。改進(jìn)的算法在4個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行仿真實(shí)驗(yàn),以AUC值作為鏈路預(yù)測(cè)精度評(píng)價(jià)指標(biāo),實(shí)驗(yàn)結(jié)果表明,改進(jìn)的算法在4個(gè)數(shù)據(jù)集上的鏈路預(yù)測(cè)精度均高于對(duì)比算法,能夠?qū)?fù)雜網(wǎng)絡(luò)結(jié)構(gòu)產(chǎn)生更精確的分析預(yù)測(cè)。2、通過(guò)挖掘節(jié)點(diǎn)的鄰居節(jié)點(diǎn)間的深層次的相互作用,對(duì)共同鄰居節(jié)點(diǎn)所攜帶的網(wǎng)絡(luò)二級(jí)結(jié)構(gòu)拓?fù)湫畔⑦M(jìn)行過(guò)濾,提出節(jié)點(diǎn)聚類(lèi)能力的計(jì)算方法。3、現(xiàn)有的基于局部信息相似性的鏈路預(yù)測(cè)指標(biāo)沒(méi)有充分考慮節(jié)點(diǎn)的聚類(lèi)信息,在傳統(tǒng)網(wǎng)絡(luò)節(jié)點(diǎn)信息分類(lèi)的基礎(chǔ)上,通過(guò)網(wǎng)絡(luò)中更穩(wěn)定的三角形關(guān)系對(duì)二級(jí)拓?fù)浣Y(jié)構(gòu)信息進(jìn)行過(guò)濾,提出基于節(jié)點(diǎn)聚類(lèi)能力的鏈路預(yù)測(cè)方法。新的算法充分使用了共同鄰居節(jié)點(diǎn)的聚類(lèi)信息,使聚類(lèi)能力強(qiáng)的節(jié)點(diǎn)在鏈路預(yù)測(cè)過(guò)程中發(fā)揮更大的作用。改進(jìn)的算法在四類(lèi)真實(shí)數(shù)據(jù)集上以MATLAB為仿真工具進(jìn)行實(shí)驗(yàn),在各數(shù)據(jù)集上以AUC和Precision為指標(biāo),改進(jìn)的算法能夠產(chǎn)生更準(zhǔn)確的預(yù)測(cè)結(jié)果。
[Abstract]:Nowadays, with the rapid development of computer technology, network technology has changed people's lives. The popularity of various social networking sites and the popularity of intelligent terminals make people leave massive, real data in the virtual network. This provides a data base for network analysis research. As social networks continue to grow, people enjoy the convenience of a rich digital life and feel the annoyance of information inflation. That is, the most relevant information value that people can not extract quickly and effectively from the massive data. It is helpful to analyze the missing of network data by predicting the links that may exist or exist but are not found in the network. Analyzing the evolution mechanism of complex networks is of great significance in the analysis of social networks. It is the basic problem of network analysis to predict the possible links in the future according to the existing link information in the network. At present, there are three kinds of link prediction algorithms based on local information similarity, path and random walk. The algorithm based on local information similarity is simple, and the algorithm complexity is low. The prediction accuracy is also relatively low, which is the most widely used link prediction method. The method based on path and random walk is more complex, and the time complexity of the algorithm is high. Most of the existing link prediction methods based on local similarity only use node degree to predict, which does not reflect the function of important node degree. Therefore, the prediction effect of the algorithm is reduced. Improving the link prediction accuracy is one of the basic problems in the research of complex networks. In this paper, the link prediction problem in social networks is studied. The main work and contributions are as follows: 1. Some important nodes may have greater influence or greater ability to disseminate information. Existing link prediction indicators based on similar nodes do not take full advantage of the importance of network nodes. In order to solve this problem, a link prediction algorithm based on node importance is proposed. Based on the common neighbor Adamic-Adarresource Allocation similarity algorithm, the new algorithm makes full use of the information of node centrality, proximity centrality and intermediate centrality. A link prediction similarity algorithm considering node importance is proposed. The improved algorithm is simulated on four real data sets, and the AUC value is used as the evaluation index of link prediction accuracy. The experimental results show that, The improved algorithm has higher link prediction accuracy on the four data sets than the contrast algorithm, which can produce more accurate analysis and prediction of complex network structure. The network secondary structure topology information carried by the common neighbor node is filtered, and the calculation method of node clustering ability is proposed. The existing link prediction index based on the similarity of local information does not fully consider the clustering information of the node. On the basis of the traditional network node information classification, the secondary topology information is filtered through the more stable triangle relation in the network. A link prediction method based on node clustering ability is proposed. The new algorithm makes full use of the clustering information of common neighbor nodes. The improved algorithm is tested on four kinds of real data sets using MATLAB as simulation tool and AUC and Precision as indexes on each data set. The improved algorithm can produce more accurate prediction results.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP393.09
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭桂蓉,申強(qiáng);浮窗零階預(yù)測(cè)算法所獲壓縮比的統(tǒng)計(jì)計(jì)算[J];電子學(xué)報(bào);1986年01期
2 王萬(wàn)良;正交逼近預(yù)測(cè)算法及其在電腦充絨機(jī)中的應(yīng)用[J];信息與控制;1994年04期
3 李文澤;盛光磊;;一種基于粒子群的實(shí)際業(yè)務(wù)流預(yù)測(cè)算法[J];微電子學(xué)與計(jì)算機(jī);2014年01期
4 楊斷利;張立梅;籍穎;呂晶;;河北省風(fēng)能特征及其對(duì)風(fēng)速預(yù)測(cè)算法的改進(jìn)[J];科技傳播;2013年06期
5 朱斌;樊祥;馬東輝;程正東;;窗口大小和權(quán)值模板對(duì)固定權(quán)值背景預(yù)測(cè)算法的影響[J];紅外與激光工程;2006年S4期
6 王祖儷;程小平;;入侵響應(yīng)中基于事件相關(guān)性的攻擊預(yù)測(cè)算法[J];計(jì)算機(jī)科學(xué);2005年04期
7 徐慶飛;張新;李衛(wèi)民;;二維空間中目標(biāo)軌跡預(yù)測(cè)算法研究與分析[J];航空電子技術(shù);2012年01期
8 楊雙懋;郭偉;唐偉;;基于FARIMA-GARCH模型的網(wǎng)絡(luò)業(yè)務(wù)預(yù)測(cè)算法[J];通信學(xué)報(bào);2013年03期
9 李楚斐;譚長(zhǎng)庚;韓宇;;車(chē)輛網(wǎng)絡(luò)單跳鏈路斷開(kāi)時(shí)間預(yù)測(cè)算法[J];計(jì)算機(jī)工程;2012年02期
10 周璇;楊建成;;基于支持向量回歸機(jī)的空調(diào)逐時(shí)負(fù)荷滾動(dòng)預(yù)測(cè)算法[J];中南大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
相關(guān)會(huì)議論文 前10條
1 朱斌;樊祥;馬東輝;程正東;;窗口大小和權(quán)值模板對(duì)固定權(quán)值背景預(yù)測(cè)算法的影響[A];2006年全國(guó)光電技術(shù)學(xué)術(shù)交流會(huì)會(huì)議文集(D 光電信息處理技術(shù)專(zhuān)題)[C];2006年
2 王峰;姬冰輝;李斗;;一種基于混沌理論的自相似業(yè)務(wù)流預(yù)測(cè)算法研究[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(上)[C];2006年
3 錢(qián)正祥;徐華;張申浩;;數(shù)字信號(hào)序列的向量預(yù)測(cè)算法[A];第三屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2005年
4 郭景峰;代軍麗;馬鑫;王娟;;針對(duì)通信社會(huì)網(wǎng)絡(luò)的時(shí)間序列鏈接預(yù)測(cè)算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
5 張利萍;李宏光;;改進(jìn)的灰色預(yù)測(cè)算法在工業(yè)應(yīng)用中的評(píng)價(jià)[A];第二屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年
6 崔冬;;一種改進(jìn)的LRP信道預(yù)測(cè)算法[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
7 王佳;殷海兵;周冰倩;;一種適合硬件實(shí)現(xiàn)的低復(fù)雜度MAD預(yù)測(cè)算法[A];浙江省電子學(xué)會(huì)2011學(xué)術(shù)年會(huì)論文集[C];2011年
8 鄭銘浩;劉志紅;巫瑞波;徐峻;;P450各亞型代謝調(diào)控劑預(yù)測(cè)算法[A];中國(guó)化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第14分會(huì)場(chǎng)摘要集[C];2012年
9 張曉丹;王萍;;一種基于特征的H.264的子塊快速幀內(nèi)預(yù)測(cè)算法[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【oral】[C];2011年
10 劉志紅;鄭銘浩;嚴(yán)鑫;巫瑞波;徐峻;;基于結(jié)構(gòu)的化合物穩(wěn)定性預(yù)測(cè)算法[A];中國(guó)化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第14分會(huì)場(chǎng)摘要集[C];2012年
相關(guān)博士學(xué)位論文 前2條
1 馬玉韜;基于濾波理論和特征統(tǒng)計(jì)的蛋白質(zhì)編碼區(qū)預(yù)測(cè)算法研究[D];天津大學(xué);2013年
2 玄萍;MicroRNA識(shí)別及其與疾病關(guān)聯(lián)的預(yù)測(cè)算法研究[D];哈爾濱工業(yè)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 吳智勇;學(xué)術(shù)論文排序預(yù)測(cè)算法研究[D];內(nèi)蒙古大學(xué);2015年
2 張勇攀;針對(duì)殘缺IP網(wǎng)絡(luò)的鏈路預(yù)測(cè)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
3 應(yīng)超;博物館移動(dòng)導(dǎo)覽中的遠(yuǎn)程展示技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];浙江大學(xué);2015年
4 常艷華;基于數(shù)據(jù)驅(qū)動(dòng)模擬電路故障預(yù)測(cè)算法實(shí)現(xiàn)與軟件開(kāi)發(fā)[D];電子科技大學(xué);2015年
5 閆青;基于預(yù)測(cè)算法的快速多尺度金字塔時(shí)空特征點(diǎn)計(jì)算算法研究[D];青島科技大學(xué);2016年
6 錢(qián)呂見(jiàn);復(fù)雜網(wǎng)絡(luò)中基于角色傳遞性和對(duì)稱(chēng)性的鏈接預(yù)測(cè)算法研究[D];蘭州大學(xué);2016年
7 李小科;無(wú)模型自適應(yīng)預(yù)測(cè)算法及其在非線(xiàn)性過(guò)程控制中的應(yīng)用[D];蘭州大學(xué);2016年
8 周攀;基于姿態(tài)傳感器的人體步態(tài)預(yù)測(cè)算法設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2016年
9 周真爭(zhēng);基于社團(tuán)綜合屬性的鏈路預(yù)測(cè)算法研究[D];南京信息工程大學(xué);2016年
10 任程;DSP+FPGA平臺(tái)功耗管理的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2016年
,本文編號(hào):1630715
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1630715.html