基于鏈接分析的網(wǎng)絡(luò)搜索排名的反作弊研究
本文選題:排序算法 切入點:鏈接分析 出處:《系統(tǒng)管理學(xué)報》2013年01期 論文類型:期刊論文
【摘要】:針對網(wǎng)絡(luò)上大量充斥的搜索排名作弊行為,提出基于鏈接分析并具備反作弊功能的網(wǎng)絡(luò)排名算法。在初始黑名單條件下,根據(jù)頁面之間的鏈接關(guān)系,引入作弊傾向性和關(guān)聯(lián)性2個概念,來衡量一個頁面作弊的可能性。在此基礎(chǔ)上,構(gòu)造了懲罰因子,并對PageRank的值進行修正,實現(xiàn)新的排名順序。該算法能夠?qū)?quán)威性較高、作弊可能性較低的頁面呈現(xiàn)給用戶,提高用戶的搜索效率。以3 537 379個網(wǎng)頁8 456 740條鏈接為素材,對算法的反作弊性能進行實驗。結(jié)果顯示,與PageRank和TrustRank算法相比,該算法的反作弊性能有了明顯地提高。
[Abstract]:In view of the widespread cheating in search ranking on the network, this paper puts forward a network ranking algorithm based on link analysis and anti-cheating function. Under the condition of initial blacklist, according to the link relationship between pages, Two concepts of cheating tendency and relevance are introduced to measure the possibility of cheating on a page. On this basis, a penalty factor is constructed, and the value of PageRank is modified to achieve a new ranking order. Pages with low possibility of cheating are presented to users, and the search efficiency of users is improved. Taking 8,456,740 links of 3 537,379 web pages as material, the anti-cheating performance of the algorithm is tested. The results show that the algorithm is compared with PageRank and TrustRank algorithms. The anti-cheating performance of this algorithm has been improved obviously.
【作者單位】: 同濟大學(xué)經(jīng)濟與管理學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(70971099) 教育部人文社會科學(xué)資助項目(05JC870013) 上海市重點學(xué)科建設(shè)項目(B310)
【分類號】:TP393.092
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 何擁軍;龔發(fā)根;;基于用戶輔助估計的相關(guān)網(wǎng)頁搜索聚類[J];計算機技術(shù)與發(fā)展;2011年07期
2 楊石山;孫建軍;;中美高校圖書館網(wǎng)站鏈接結(jié)構(gòu)比較研究[J];情報科學(xué);2011年07期
3 楊超;李杰;李浩宇;;基于PageRank的頁面排序算法研究[J];電腦編程技巧與維護;2011年16期
4 朱怡安;雷萬保;;基于服務(wù)關(guān)聯(lián)模型的服務(wù)排序算法——ServiceRank[J];電子科技大學(xué)學(xué)報;2011年04期
5 詹圣君;邵雄凱;劉建舟;;一種考慮用戶行為的改進N—PageRank算法[J];計算機技術(shù)與發(fā)展;2011年08期
6 張敏;李鋒;;PageRank算法研究[J];微計算機信息;2011年08期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 吳煒;梁昆;李瑞軒;辜希武;盧正鼎;;一種基于主題相關(guān)度的網(wǎng)頁排序算法[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2008年
2 宋丹;林鴻飛;楊志豪;;一種利用鏈接分析的Web話題跟蹤方法[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
3 鄒綱;孟遙;于浩;西野文人;;一種基于網(wǎng)站主頁信息建立公司名稱知識庫的方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
4 劉凱鵬;方濱興;;一種基于社會性標注的網(wǎng)頁排序算法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
5 葛先軍;李志勇;宋巍巍;;基于網(wǎng)頁惡意腳本鏈接分析的木馬檢測技術(shù)[A];第五屆中國測試學(xué)術(shù)會議論文集[C];2008年
6 陳叢叢;石冰;陳健;;面向主題的查詢相關(guān)網(wǎng)頁排序算法[A];第三屆中國智能計算大會論文集[C];2009年
7 劉悅;王斌;楊志峰;張鑫;;Web關(guān)鍵資源發(fā)現(xiàn)中的鏈接分析技術(shù)[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
8 王玉婷;杜亞軍;涂騰濤;;基于Web鏈接的主題爬行蟲初始URL的研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
9 孔維澤;劉奕群;張敏;馬少平;;問答社區(qū)中回答質(zhì)量的評價方法研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
10 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學(xué)會2008年年會論文集[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 錢鵬;網(wǎng)盡Web頁中的好東東[N];電腦報;2004年
2 百度網(wǎng)絡(luò)技術(shù)公司 劉建國;從中國人網(wǎng)站看搜索引擎的ASP服務(wù)[N];中國計算機報;2000年
3 Websense中國區(qū)高級技術(shù)顧問 李智明;反垃圾郵件成為網(wǎng)絡(luò)安全重要一環(huán)[N];中國計算機報;2008年
4 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計算機報;2000年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 江開忠;上下文感知的Web搜索關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2008年
2 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
3 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
4 吳剛;RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D];清華大學(xué);2008年
5 劉玉婷;網(wǎng)頁排序中的隨機模型及算法[D];北京交通大學(xué);2009年
6 謝海濤;移動個性化信息服務(wù)系統(tǒng)的進化機制研究[D];北京郵電大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 高文梁;改進的基于歷史信息分析的網(wǎng)頁排序算法[D];大連理工大學(xué);2009年
2 彭聰;一種在移動網(wǎng)絡(luò)環(huán)境下的網(wǎng)頁排序算法的研究[D];湖南大學(xué);2010年
3 陳輝;金融領(lǐng)域的博客信息采集與排序算法研究[D];哈爾濱工業(yè)大學(xué);2009年
4 岳增慧;高校圖書館網(wǎng)絡(luò)空間鏈接特征研究[D];曲阜師范大學(xué);2011年
5 秦輝;基于重要性傳遞模型的Web頁面靜態(tài)排序算法[D];大連理工大學(xué);2007年
6 鄭州斌;基于內(nèi)容與鏈接分析的主題相關(guān)網(wǎng)站排序算法的研究[D];浙江大學(xué);2008年
7 張士軍;基于隨機游走的網(wǎng)頁協(xié)同排序算法研究[D];大連理工大學(xué);2010年
8 王昭華;基于鏈接分析的Blog網(wǎng)頁排序算法的研究[D];東北大學(xué);2009年
9 金奇;基于鏈接分析的中國體育類網(wǎng)站評估[D];復(fù)旦大學(xué);2012年
10 范鑫鑫;基于頁面相似度的鏈接分析算法研究[D];大連理工大學(xué);2008年
,本文編號:1620707
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1620707.html