基于用戶行為與頁面分析的改進(jìn)PageRank算法
本文關(guān)鍵詞:基于用戶行為與頁面分析的改進(jìn)PageRank算法
更多相關(guān)文章: 權(quán)威因子 時(shí)間因子 主題漂移 轉(zhuǎn)移概率 PR值
【摘要】:在經(jīng)典PageRank算法中,頁面的轉(zhuǎn)移概率平均分配到鏈出頁面,由于新網(wǎng)頁的鏈接較少,其PR值普遍較低。經(jīng)典PageRank算法通過鏈接計(jì)算PR值,未考慮到網(wǎng)頁的內(nèi)容,存在主題漂移現(xiàn)象。針對(duì)上述問題,引入網(wǎng)頁權(quán)威因子和時(shí)間因子,通過網(wǎng)頁按關(guān)鍵字檢索后被點(diǎn)擊的次數(shù)進(jìn)行統(tǒng)計(jì),根據(jù)其在初始排序結(jié)果中的位置對(duì)網(wǎng)頁的PR值進(jìn)行迭代修正,返回一個(gè)新的排序結(jié)果并分析網(wǎng)頁內(nèi)容,采用改進(jìn)的TD-IDF算法解決網(wǎng)頁相關(guān)性,避免主題漂移現(xiàn)象。仿真實(shí)驗(yàn)結(jié)果表明,改進(jìn)算法可以提高網(wǎng)頁排名的質(zhì)量,使相關(guān)度較高的網(wǎng)頁通過人們的自主選擇獲得不同程度的加權(quán),獲得加權(quán)的網(wǎng)頁在檢索結(jié)果中的排名得到提升,從而提高用戶需求網(wǎng)頁的查準(zhǔn)率。
【作者單位】: 蘭州理工大學(xué)計(jì)算機(jī)與通信學(xué)院;
【關(guān)鍵詞】: 權(quán)威因子 時(shí)間因子 主題漂移 轉(zhuǎn)移概率 PR值
【分類號(hào)】:TP393.092
【正文快照】: 1概述雖然搜索引擎的發(fā)展速度非常驚人,但信息量的增長(zhǎng)速度是呈幾何式的。人們習(xí)慣于依靠根據(jù)排名算法的搜索引擎找到有用的信息。然而經(jīng)典的PageRank[1]算法存在一些缺點(diǎn),網(wǎng)絡(luò)是動(dòng)態(tài)的,新的網(wǎng)頁應(yīng)及時(shí)更新,在實(shí)際訪問時(shí)PageRank算法忽略時(shí)間的因素,這是非常不合理的。人們總
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鐘靈;章云;曾啟杰;羅文良;;能見度與缺失分析的改進(jìn)PageRank算法[J];微計(jì)算機(jī)信息;2009年15期
2 LIU Gui-mei;;An adaptive improvement on PageRank algorithm[J];Applied Mathematics:A Journal of Chinese Universities(Series B);2013年01期
3 史銘茗;;加權(quán)PageRank算法研究綜述[J];軟件導(dǎo)刊;2013年02期
4 劉悅;程學(xué)旗;李國杰;;提高PageRank算法效率的方法初探[J];計(jì)算機(jī)科學(xué);2002年06期
5 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計(jì)算機(jī)應(yīng)用;2005年07期
6 戚華春,黃德才,鄭月鋒;具有時(shí)間反饋的PageRank改進(jìn)算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2005年03期
7 黃德才;戚華春;;PageRank算法研究[J];計(jì)算機(jī)工程;2006年04期
8 楊彬;康慕寧;;基于概念的權(quán)重PageRank改進(jìn)算法[J];情報(bào)雜志;2006年11期
9 張麗;;PageRank算法的改進(jìn)[J];科學(xué)技術(shù)與工程;2007年05期
10 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國控制與決策會(huì)議論文集(3)[C];2009年
2 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 藺繼國;徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個(gè)性化PageRank算法[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
4 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年
7 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評(píng)分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點(diǎn)重要性度量[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
9 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全國復(fù)雜系統(tǒng)研究論壇論文集(一)[C];2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 何逍;復(fù)雜網(wǎng)絡(luò)的可視化顯示[D];電子科技大學(xué);2015年
2 李金圻;基于Hadoop的微博輿情分析[D];北京郵電大學(xué);2015年
3 蔡建超;基于PageRank算法的搜索引擎優(yōu)化研究[D];江南大學(xué);2008年
4 邵晶晶;基于PageRank排序算法改進(jìn)的若干研究[D];華中師范大學(xué);2009年
5 王磊;PageRank的算法改進(jìn)[D];上海交通大學(xué);2009年
6 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年
7 姜sバ,
本文編號(hào):768195
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/768195.html