基于轉(zhuǎn)移概率的PageRank算法研究
本文關(guān)鍵詞:基礎(chǔ)教育資源搜索引擎的排序算法研究,由筆耕文化傳播整理發(fā)布。
《暨南大學(xué)》 2009年
基于轉(zhuǎn)移概率的PageRank算法研究
張永強
【摘要】: PageRank算法是Google搜索引擎開發(fā)的用于評價網(wǎng)頁重要性的一種網(wǎng)頁級別排序算法。它用有向圖描述網(wǎng)頁及其超鏈接,把用戶瀏覽行為看成為一個Markov隨機沖浪模型,并定義極限狀態(tài)下各網(wǎng)頁被訪問的概率分布為PageRank值,此PageRank值給出了網(wǎng)頁重要性的排序。本文首先介紹了經(jīng)典的PageRank算法,然后對另一種基于轉(zhuǎn)移概率矩陣的PageRank算法進行了介紹、分析和改進。最后基于對前面兩種PageRank算法的比較分析,提出了一種新的基于轉(zhuǎn)移概率矩陣的網(wǎng)頁級別算法,即根據(jù)網(wǎng)頁的原PageRank值與自身出鏈的數(shù)目的比值在鏈入到該網(wǎng)頁的所有網(wǎng)頁的PageRank值與自身出鏈的數(shù)目的比值總和所占比例定義轉(zhuǎn)移概率。實驗分析表明,以此模型得出的網(wǎng)頁排序更具合理性。
【關(guān)鍵詞】:
【學(xué)位授予單位】:暨南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2009
【分類號】:O211.62
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 姜玥旭;PageRank算法的改進及在生物網(wǎng)絡(luò)數(shù)據(jù)上的應(yīng)用[D];吉林大學(xué);2012年
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 李凱,赫楓齡,左萬利;PageRank-Pro——一種改進的網(wǎng)頁排序算法[J];吉林大學(xué)學(xué)報(理學(xué)版);2003年02期
2 李吉平;吳陳;曾慶軍;;基于轉(zhuǎn)移概率的PageRank算法研究[J];科學(xué)技術(shù)與工程;2008年08期
3 曹軍;Google的PageRank技術(shù)剖析[J];情報雜志;2002年10期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 汪濤,樊孝忠,顧益軍,劉林;基于概念分析的主題爬蟲設(shè)計[J];北京理工大學(xué)學(xué)報;2004年10期
2 徐金雷;楊曉江;;基礎(chǔ)教育資源搜索引擎的排序算法研究[J];電化教育研究;2007年02期
3 鐘斌青;劉湘南;;基于空間化PageRank算法的人口流動空間集聚性分析[J];地理與地理信息科學(xué);2011年05期
4 王玉珍;;Google的PageRank技術(shù)分析[J];電腦學(xué)習(xí);2007年05期
5 付濤;;基于背景的Web廣泛主題發(fā)現(xiàn)方法[J];電腦學(xué)習(xí);2010年02期
6 肖錚;莊建;莊重;;基于鏈接結(jié)構(gòu)的PageRank排序算法研究[J];電腦知識與技術(shù);2009年20期
7 唐培和,楊新倫,劉浩;Google搜索引擎及其實現(xiàn)技術(shù)[J];廣西工學(xué)院學(xué)報;2004年02期
8 王鋼生;;中等職業(yè)學(xué)校校園網(wǎng)絡(luò)建設(shè)思路和實踐方案探討[J];電腦與電信;2007年05期
9 侯青;;超鏈接的方式給應(yīng)用程序傳遞參數(shù)方法的實現(xiàn)[J];信息技術(shù);2009年10期
10 劉林,汪濤,樊孝忠;主題爬蟲的解決方案[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2004年S1期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 陸勇;侯漢清;;基于詞典注釋的漢語同義詞自動識別[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 常春;Ontology在農(nóng)業(yè)信息管理中的構(gòu)建和轉(zhuǎn)化[D];中國農(nóng)業(yè)科學(xué)院;2004年
2 彭濤;面向?qū)I(yè)搜索引擎的主題爬行技術(shù)研究[D];吉林大學(xué);2007年
3 宗校軍;中文網(wǎng)頁定題采集及分類研究[D];華中科技大學(xué);2006年
4 張格偉;基于工藝知識網(wǎng)格的可重構(gòu)CAPP系統(tǒng)關(guān)鍵技術(shù)研究[D];南京航空航天大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 翁巖青;網(wǎng)頁抓取策略研究[D];哈爾濱工程大學(xué);2010年
2 汪永偉;搜索引擎中網(wǎng)頁排序算法的研究與實現(xiàn)[D];哈爾濱工程大學(xué);2010年
3 于飛;基于搜索引擎的個性化推薦研究[D];哈爾濱理工大學(xué);2010年
4 陳可欽;基于垂直搜索引擎的主題爬蟲算法的研究[D];中南林業(yè)科技大學(xué);2009年
5 陳瀟;油脂企業(yè)故障信息管理與診斷系統(tǒng)設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2009年
6 陳志剛;網(wǎng)絡(luò)Flash資源爬行器的設(shè)計與實現(xiàn)[D];山東師范大學(xué);2011年
7 姜博;基于聚焦爬蟲的web信息采集技術(shù)研究[D];北方工業(yè)大學(xué);2011年
8 曹仲偉;FTP搜索引擎的關(guān)鍵技術(shù)研究[D];湖北工業(yè)大學(xué);2011年
9 周源;基于本體的語義垂直搜索引擎研究[D];北京交通大學(xué);2011年
10 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
【同被引文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 孫宇;賈凌云;任軍;;蛋白質(zhì)相互作用的研究方法[J];分析化學(xué);2007年05期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 許南山;叢磊;;Pagerank二維線性收斂方法[J];計算機應(yīng)用;2006年06期
2 張麗;;PageRank算法的改進[J];科學(xué)技術(shù)與工程;2007年05期
3 夏莉,黃正洪;馬爾可夫鏈在人力資源預(yù)測中的應(yīng)用[J];統(tǒng)計與決策;2005年03期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 柳泉波;許駿;;基于鏈接分析的科學(xué)文獻個性化排序算法[J];中山大學(xué)學(xué)報(自然科學(xué)版);2008年06期
2 王向陽;馬軍;;一個基于PageRank的科技文獻質(zhì)量評價算法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2009年01期
3 楊海東,張莉;PageRank技術(shù)分析與搜索引擎檢索效率研究[J];淮陰師范學(xué)院學(xué)報(自然科學(xué)版);2003年03期
4 石晶,龔震宇,裘杭萍,張毓森;一種更穩(wěn)定的鏈接分析算法——子空間HITS算法[J];吉林大學(xué)學(xué)報(理學(xué)版);2003年01期
5 黎斌;鮮明;;web超鏈分析技術(shù)[J];科技信息(學(xué)術(shù)研究);2008年09期
6 石小康;;網(wǎng)絡(luò)計量學(xué)的研究現(xiàn)狀與發(fā)展[J];黑龍江科技信息;2009年25期
7 陳麗萍;;談基于鏈接分析的web社區(qū)發(fā)現(xiàn)技術(shù)[J];科技信息;2009年31期
8 張佳;梁少華;;Web結(jié)構(gòu)挖掘與其基于超鏈接結(jié)構(gòu)的算法[J];科技信息;2007年02期
9 潘大勝;;面向校園網(wǎng)搜索引擎的PageRank改進算法[J];湖南文理學(xué)院學(xué)報(自然科學(xué)版);2009年01期
10 張光年;李茂青;;基于PageRank算法的一種搜索引擎優(yōu)化方法及實現(xiàn)[J];科技信息;2007年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 藺繼國;徐錫山;;一種基于用戶點擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
2 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
3 楊磊;束罡;牛振東;;基于引力模型的鏈接分析(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
4 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁質(zhì)量的PageRank算法改進[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
5 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
6 劉兵;胡學(xué)鋼;;基于多鏈接分析的主題爬蟲設(shè)計實現(xiàn)[A];全國第20屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
7 宋丹;林鴻飛;楊志豪;;一種利用鏈接分析的Web話題跟蹤方法[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
8 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
9 鄒綱;孟遙;于浩;西野文人;;一種基于網(wǎng)站主頁信息建立公司名稱知識庫的方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
10 吳煒;梁昆;李瑞軒;辜希武;盧正鼎;;一種基于主題相關(guān)度的網(wǎng)頁排序算法[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者 馬文方;[N];中國計算機報;2008年
2 喻寧;[N];經(jīng)理日報;2004年
3 中國科學(xué)院計算技術(shù)研究所 王 斌;[N];計算機世界;2004年
4 文/大海;[N];計算機世界;2004年
5 本報記者 侯繼勇 劉涓涓 鄭小伶 亦有;[N];21世紀(jì)經(jīng)濟報道;2005年
6 希安;[N];經(jīng)濟日報;2004年
7 復(fù)旦大學(xué)國際政治系博士 沈逸;[N];東方早報;2010年
8 錢鵬;[N];電腦報;2004年
9 清華大學(xué)計算機系智能技術(shù)與系統(tǒng)國家重點實驗室 張敏 金奕江;[N];計算機世界;2003年
10 本報記者 王翌;[N];計算機世界;2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 段宇鋒;網(wǎng)絡(luò)鏈接分析與網(wǎng)站評價研究[D];武漢大學(xué);2004年
2 褚武英;三種石首魚緊密連鎖的α-和β-珠蛋白基因的克隆及其順式調(diào)控元件的分析[D];浙江大學(xué);2006年
3 王菁華;文本中知識的獲取[D];北京郵電大學(xué);2008年
4 劉洪波;INTERNET中的信息網(wǎng)絡(luò)提取分析及Rank相關(guān)研究[D];清華大學(xué);2007年
5 江開忠;上下文感知的Web搜索關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2008年
6 田俊華;基于本體知識庫的教學(xué)資源自動采集技術(shù)研究[D];南京師范大學(xué);2011年
7 宣云干;基于潛在語義分析的社會化標(biāo)注系統(tǒng)標(biāo)簽語義檢索研究[D];南京大學(xué);2011年
8 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
9 吳剛;RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D];清華大學(xué);2008年
10 徐秀娟;商務(wù)智能中的利潤挖掘研究[D];吉林大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張永強;基于轉(zhuǎn)移概率的PageRank算法研究[D];暨南大學(xué);2009年
2 劉先明;基于鏈接分析的PageRank排序算法的改進研究[D];湖北工業(yè)大學(xué);2010年
3 趙波;PageRank算法在非網(wǎng)頁檢索問題中的應(yīng)用[D];復(fù)旦大學(xué);2010年
4 袁方;基于改進PageRank算法的個性化搜索的研究[D];北京郵電大學(xué);2012年
5 縣小平;搜索引擎PageRank算法研究[D];西北大學(xué);2010年
6 高寶軍;Web結(jié)構(gòu)挖掘中PageRank算法優(yōu)化研究[D];蘭州大學(xué);2011年
7 郭坤銀;基于頁面分塊和鏈接分析的Web圖片檢索研究[D];重慶大學(xué);2009年
8 高文梁;改進的基于歷史信息分析的網(wǎng)頁排序算法[D];大連理工大學(xué);2009年
9 陳翰生;基于改進HITS算法及位置信息的關(guān)鍵網(wǎng)頁信息抽取方法[D];復(fù)旦大學(xué);2009年
10 楊鑫;基于鏈接分析的電信呼叫數(shù)據(jù)研究與應(yīng)用[D];北京郵電大學(xué);2009年
本文關(guān)鍵詞:基礎(chǔ)教育資源搜索引擎的排序算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號:205198
本文鏈接:http://sikaile.net/jichujiaoyulunwen/205198.html