基于超鏈接多樣性分析的新型網(wǎng)頁排名算法
本文關(guān)鍵詞:基于超鏈接多樣性分析的新型網(wǎng)頁排名算法,由筆耕文化傳播整理發(fā)布。
第37卷 第4期2014年4月
計(jì) 算 機(jī) 學(xué) 報(bào)
CHINESEJOURNALOFCOMPUTERS
Vol.37No.4
Ar.2014p
基于超鏈接多樣性分析的新型網(wǎng)頁排名算法
楊
博
,1)2)
陳賀昌
,1)2)
朱冠宇 趙學(xué)華
)30012 長春 1
3),1)2)
)30012 長春 1
2)()符號計(jì)算與知識工程教育部重點(diǎn)實(shí)驗(yàn)室(吉林大學(xué))30012 長春。
3)(吉林大學(xué)軟件學(xué)院
1)(吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院
摘 要 作為搜索引擎的核心部件,網(wǎng)頁排名算法決定了搜索到的相關(guān)結(jié)果以何種順序呈現(xiàn)給用戶,,其性能的優(yōu)劣將會直接影響搜索引擎的服務(wù)質(zhì)量和用戶的搜索體驗(yàn).在計(jì)算網(wǎng)頁的權(quán)威性時(shí),現(xiàn)有的基于鏈接的網(wǎng)頁排名算——另一種客觀評價(jià)網(wǎng)頁而忽略了超鏈接來源的多樣性—法和網(wǎng)頁作弊檢測算法僅關(guān)注網(wǎng)頁的超鏈接數(shù)量和質(zhì)量,
,權(quán)威性的重要信息.相比于真正的權(quán)威頁面(具有大量且來源廣泛的入鏈)通過作弊手段提升排名的網(wǎng)頁往往不具有入鏈來源多樣性的特征.基于以上思想,文中分別提出了超鏈接來源多樣性判斷方法、超鏈接權(quán)值調(diào)整方法,進(jìn)而提出了基于超鏈接來源多樣性分析的網(wǎng)頁排名算法D在多個(gè)基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:與現(xiàn)有最好rank.的同類算法相比,綜合尋找優(yōu)質(zhì)頁面和抑制網(wǎng)頁排名作弊兩方面,Drank算法表現(xiàn)出更好的性能.關(guān)鍵詞 搜索引擎;排名算法;作弊檢測;鏈接分析;概率計(jì)數(shù);社會計(jì)算;社交網(wǎng)絡(luò)/中圖法分類號TP393 。模希商枺保埃常罚玻矗樱校剩保埃保叮玻埃保矗埃埃福常
ANovelPaeRankinAlorithmBasedonAnalzinthe 。纾纾纾纭
DiversitofInboundHerlinks 。稹
1
YANGBo
1)(
),2)
1
N。龋澹茫瑁幔睢。茫龋牛
),2)
31
HU。牵酰幔睿酰龋粒希兀酰澹龋酰帷。冢佟。凇
)),2)
)ColleeoComuterScienceand。裕澹悖瑁睿铮欤铮剩椋欤椋睢。眨睿椋觯澹颍螅椋簦茫瑁幔睿悖瑁酰睢。保常埃埃保病 。纾妗。穑纾,y,g
2)(,M)KeLaboratoroSmbolicComutationand KnowledeEnineer(Jilin。眨睿椋觯澹颍螅椋簦椋睿椋螅簦颍铮牛洌酰悖幔簦椋铮,Chanchun。保常埃埃保病 。。妗。穑纾纾妗。纭
)3()ColleeoSotware,Jilin UniversitChanchun。保常埃埃保病。纾妗。妫,g
,Abstractsthecorecomonentofasearchenineaerankinalorithmdeterminesinwhat。痢 。穑纾穑纾纾纭
orderresentederformancethesearchresultsshouldbetousersanditswilldirectlinfluence 。穑穑
’ualitaesearchserviceanduserssearchexerience.Theexistinmethodsofrankinand 。瘢穑纾穑纾纭 ,samdetectionmerelconsiderthenumberandtheofinboundherlinkswhileinorinualit pyypggqy
,diversitanotherimortantcriteriontoobectivelevaluatetheauthoritofwebaes.their ypjyypg
,wComaredwithrealauthoritaeshichhasalarenumberinboundherlinksfromawide 。穑穑纾纾稹。觯幔颍椋澹簦铮妫螅铮酰颍悖澹螅簦瑁澹幔澹螅鳎瑁铮螅澹颍幔睿耄螅幔颍澹椋恚颍铮觯澹洌猓悖瑁澹幔簦椋睿恚澹簦瑁铮洌螅铮妫簦澹睿洌铮睿簦瑁幔觯澹簦瑁濉 。穑纾穑纾
,wcharacteristicofwidediversitoftheirinboundherlinks.Basedonaforementionedideae 。稹。幔恚澹簦瑁铮洌簦铮悖铮恚酰簦澹簦瑁澹洌椋觯澹颍螅椋簦铮妫椋睿猓铮酰睿洌瑁澹颍欤椋睿耄螅幔睿洌幔恚澹簦瑁铮洌簦铮酰幔睿簦椋簦幔簦椋觯澹欤颍铮铮螅濉 。穑穑瘢穑稹
,adustrooseaetheweihtsofherlinksbasedonitresectivel.Thenweanovelrank 。辏穑穑穑纾纾穑穑
,walorithm,calledDrankhichranksbasedonthediversitanalsisofinboundherlinks.aes 。纾穑纾稹。希酰颍澹澹颍椋恚澹睿簦幔欤颍澹螅酰欤簦螅幔幔椋睿螅簦螅澹觯澹颍幔欤猓澹睿悖瑁恚幔颍耄洌幔簦幔螅澹簦螅螅瑁铮鳎簦瑁幔簦模颍幔睿耄瑁幔螅簦瑁澹猓澹螅簟 。穑纾椋睿簦澹颍恚螅铮妫猓铮簦瑁妫椋睿洌椋睿瑁椋瑁幔睿洌螅酰颍澹螅螅椋睿鳎澹猓螅幔恚螅澹颍妫铮颍恚幔睿悖澹酰幔欤椋簦幔澹蟆 。瘛 。纾纾穑穑纾穑穑穑纭
;;;;;robabilisticKewordsearcheninerankinsamdetectionherlinkanalsiscountin。蟆 。纾纾穑穑穑纾
;socialcomutinsocialnetwork 。穑
;、收稿日期:最終修改稿收到日期:本課題得到新世紀(jì)優(yōu)秀人才支持計(jì)劃(國家自然科學(xué)基金2013062120140124.NCET110204)------()資助.楊 博,男,教授,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘、復(fù)雜網(wǎng)61133011,61373053,61300146,61170092,612023081974年生,
:絡(luò)和多A陳賀昌,男,碩士研究生,研究方向?yàn)閿?shù)據(jù)挖掘.朱冠宇,男,本科生,ent系統(tǒng).E-mail1987年生,1990年生,bolu.edu.cn.@gyj研究方向?yàn)榫W(wǎng)頁排名算法.趙學(xué)華,男,博士研究生,研究方向?yàn)閿?shù)據(jù)挖掘和復(fù)雜網(wǎng)絡(luò).1977年生,
本文關(guān)鍵詞:基于超鏈接多樣性分析的新型網(wǎng)頁排名算法,由筆耕文化傳播整理發(fā)布。
本文編號:181535
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/181535.html