一種基于最近搜索周期被引用頻率的改進WPR算法
發(fā)布時間:2017-08-05 15:04
本文關鍵詞:一種基于最近搜索周期被引用頻率的改進WPR算法
更多相關文章: 主題特征 被引用頻率 偏重舊網(wǎng)頁 搜索周期 主題漂移
【摘要】:針對WPR(Weighted PageRank)算法存在的在網(wǎng)頁搜索方面的主題漂移和偏重舊網(wǎng)頁的現(xiàn)象,綜合網(wǎng)頁的主題特征和最近搜索周期網(wǎng)頁的被引用頻率兩個因素,提出了一種改進的算法WTFPR(Weighted Topic Frequency PageRank)。該算法通過內容分析,采用改進的TD-IDF算法來解決網(wǎng)頁相關性,改善主題漂移現(xiàn)象;通過網(wǎng)頁的最近搜索周期的被引用頻率來提高那些較新而且價值較高的網(wǎng)頁的PR值,從而改善偏重舊網(wǎng)頁的現(xiàn)象。仿真結果表明,改進后的算法與WPR算法相比獲得了更好的效果。
【作者單位】: 蘭州理工大學計算機與通信學院;
【關鍵詞】: 主題特征 被引用頻率 偏重舊網(wǎng)頁 搜索周期 主題漂移
【分類號】:TP393.092
【正文快照】: 1概述當今互聯(lián)網(wǎng)已經(jīng)成為現(xiàn)代共享信息的主要載體,無論網(wǎng)站網(wǎng)頁數(shù)量還是用戶數(shù)量都特別巨大,搜索引擎在搜索信息方面占據(jù)主要地位。從用戶行為上看,多數(shù)用戶在使用搜索引擎的搜索結果時,只會點擊搜索出來的前2頁中10到20個高相關度的搜索結果。因此如何將最能滿足用戶需求的頁,
本文編號:625479
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/625479.html
最近更新
教材專著