基于網(wǎng)頁(yè)內(nèi)容和時(shí)間反饋的網(wǎng)頁(yè)排序PageRank算法研究
發(fā)布時(shí)間:2022-01-23 01:48
隨著互聯(lián)網(wǎng)的飛速發(fā)展,搜索引擎已經(jīng)成為人們獲得信息的最重要手段之一。面對(duì)眾多雜亂無(wú)章的網(wǎng)頁(yè)信息,以及人們使用搜索引擎瀏覽網(wǎng)頁(yè)信息時(shí)大多數(shù)只關(guān)注前幾條或前幾頁(yè)的習(xí)慣,能否快速、準(zhǔn)確地從互聯(lián)網(wǎng)上獲取有價(jià)值的信息是評(píng)價(jià)一個(gè)搜索引擎好壞的關(guān)鍵,返回的網(wǎng)頁(yè)結(jié)果的先后順序也變得尤為重要。因此,搜索引擎的網(wǎng)頁(yè)排序算法也就成為人們關(guān)注的關(guān)鍵問(wèn)題之一。本文主要是以搜索引擎的網(wǎng)頁(yè)排序算法作為研究背景,分析現(xiàn)有的主流排序算法,深入剖析經(jīng)典的基于鏈接分析的HITS算法、PageRank算法以及現(xiàn)有的PageRank改進(jìn)算法,分析它們存在的優(yōu)缺點(diǎn);以此為基礎(chǔ)提出了一種基于網(wǎng)頁(yè)內(nèi)容和時(shí)間反饋的PageRank改進(jìn)算法。改進(jìn)算法主要是針對(duì)詞語(yǔ)出現(xiàn)在文檔的不同位置和詞語(yǔ)的不同長(zhǎng)度,所能代表的語(yǔ)義特征不同,在傳統(tǒng)TF-IDF公式基礎(chǔ)上,增加詞項(xiàng)位置權(quán)值和詞項(xiàng)長(zhǎng)度權(quán)值,進(jìn)而綜合求得詞項(xiàng)權(quán)值,再利用向量空間模型計(jì)算有鏈接關(guān)系的網(wǎng)頁(yè)間關(guān)于相同特征項(xiàng)的相似度權(quán)值;修正網(wǎng)頁(yè)的時(shí)間反饋因子,考慮用網(wǎng)頁(yè)被搜索引擎搜索到的周期數(shù)目來(lái)表示網(wǎng)頁(yè)存在的時(shí)間長(zhǎng)短。通過(guò)對(duì)這兩方面的改進(jìn)來(lái)度量網(wǎng)頁(yè)間PageRank值傳遞的大小。為了驗(yàn)證改進(jìn)算法的...
【文章來(lái)源】:重慶理工大學(xué)重慶市
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
系統(tǒng)體系結(jié)構(gòu)圖
網(wǎng)頁(yè)搜集模塊運(yùn)行效果
查詢(xún)模塊運(yùn)行效果
【參考文獻(xiàn)】:
期刊論文
[1]PageRank算法研究綜述[J]. 李稚楹,楊武,謝治軍. 計(jì)算機(jī)科學(xué). 2011(S1)
[2]PageRank算法的分析及其改進(jìn)[J]. 王德廣,周志剛,梁旭. 計(jì)算機(jī)工程. 2010(22)
[3]一種基于PageRank的頁(yè)面排序改進(jìn)算法[J]. 王冬,雷景生. 微電子學(xué)與計(jì)算機(jī). 2009(04)
[4]基于主題相似度模型的TS-PageRank算法[J]. 黃德才,戚華春,錢(qián)能. 小型微型計(jì)算機(jī)系統(tǒng). 2007(03)
[5]PageRank算法研究[J]. 黃德才,戚華春. 計(jì)算機(jī)工程. 2006(04)
[6]基于向量空間模型的網(wǎng)頁(yè)文本表示改進(jìn)算法[J]. 曾致遠(yuǎn),張莉. 計(jì)算機(jī)工程. 2006(03)
[7]搜索引擎技術(shù)研究與發(fā)展[J]. 印鑒,陳憶群,張鋼. 計(jì)算機(jī)工程. 2005(14)
[8]搜索引擎的排序技術(shù)研究[J]. 楊思洛. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2005(01)
[9]基于改進(jìn)向量空間模型的Web信息檢索技術(shù)研究[J]. 雷景生,林冬雪,符淺淺. 計(jì)算機(jī)工程. 2005(01)
[10]加速評(píng)估算法:一種提高Web結(jié)構(gòu)挖掘質(zhì)量的新方法[J]. 張嶺,馬范援. 計(jì)算機(jī)研究與發(fā)展. 2004(01)
碩士論文
[1]基于時(shí)態(tài)信息的主題搜索引擎的研究與實(shí)現(xiàn)[D]. 孫逸雪.中國(guó)科學(xué)技術(shù)大學(xué) 2009
[2]專(zhuān)業(yè)搜索引擎的排序算法研究[D]. 徐金雷.南京師范大學(xué) 2007
[3]搜索引擎排序算法的研究[D]. 陳潔惠.河海大學(xué) 2007
[4]基于知識(shí)庫(kù)的中文網(wǎng)絡(luò)檢索工具——經(jīng)濟(jì)信息智能搜索引擎研究[D]. 薛鵬軍.南京農(nóng)業(yè)大學(xué) 2001
本文編號(hào):3603344
【文章來(lái)源】:重慶理工大學(xué)重慶市
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
系統(tǒng)體系結(jié)構(gòu)圖
網(wǎng)頁(yè)搜集模塊運(yùn)行效果
查詢(xún)模塊運(yùn)行效果
【參考文獻(xiàn)】:
期刊論文
[1]PageRank算法研究綜述[J]. 李稚楹,楊武,謝治軍. 計(jì)算機(jī)科學(xué). 2011(S1)
[2]PageRank算法的分析及其改進(jìn)[J]. 王德廣,周志剛,梁旭. 計(jì)算機(jī)工程. 2010(22)
[3]一種基于PageRank的頁(yè)面排序改進(jìn)算法[J]. 王冬,雷景生. 微電子學(xué)與計(jì)算機(jī). 2009(04)
[4]基于主題相似度模型的TS-PageRank算法[J]. 黃德才,戚華春,錢(qián)能. 小型微型計(jì)算機(jī)系統(tǒng). 2007(03)
[5]PageRank算法研究[J]. 黃德才,戚華春. 計(jì)算機(jī)工程. 2006(04)
[6]基于向量空間模型的網(wǎng)頁(yè)文本表示改進(jìn)算法[J]. 曾致遠(yuǎn),張莉. 計(jì)算機(jī)工程. 2006(03)
[7]搜索引擎技術(shù)研究與發(fā)展[J]. 印鑒,陳憶群,張鋼. 計(jì)算機(jī)工程. 2005(14)
[8]搜索引擎的排序技術(shù)研究[J]. 楊思洛. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2005(01)
[9]基于改進(jìn)向量空間模型的Web信息檢索技術(shù)研究[J]. 雷景生,林冬雪,符淺淺. 計(jì)算機(jī)工程. 2005(01)
[10]加速評(píng)估算法:一種提高Web結(jié)構(gòu)挖掘質(zhì)量的新方法[J]. 張嶺,馬范援. 計(jì)算機(jī)研究與發(fā)展. 2004(01)
碩士論文
[1]基于時(shí)態(tài)信息的主題搜索引擎的研究與實(shí)現(xiàn)[D]. 孫逸雪.中國(guó)科學(xué)技術(shù)大學(xué) 2009
[2]專(zhuān)業(yè)搜索引擎的排序算法研究[D]. 徐金雷.南京師范大學(xué) 2007
[3]搜索引擎排序算法的研究[D]. 陳潔惠.河海大學(xué) 2007
[4]基于知識(shí)庫(kù)的中文網(wǎng)絡(luò)檢索工具——經(jīng)濟(jì)信息智能搜索引擎研究[D]. 薛鵬軍.南京農(nóng)業(yè)大學(xué) 2001
本文編號(hào):3603344
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3603344.html
最近更新
教材專(zhuān)著