基于谷歌搜索引擎產(chǎn)品的研究
本文關(guān)鍵詞:基于谷歌搜索引擎產(chǎn)品的研究
更多相關(guān)文章: 搜索引擎 PageRank TF-IDF
【摘要】:所有的搜索引擎產(chǎn)品,都可以歸結(jié)為下載、索引和排序三個步驟,即自動下載海量的網(wǎng)頁;建立快速有效的索引;對網(wǎng)頁進(jìn)行公平準(zhǔn)確的排序;ヂ(lián)網(wǎng)錯綜復(fù)雜,本質(zhì)是一張圖,每個頁面都是一個節(jié)點(diǎn),超鏈接是連接網(wǎng)頁的弧,而自動抓取網(wǎng)絡(luò)信息的程序就是爬蟲。索引是基于數(shù)據(jù)庫的,搜索引擎會自動將用戶的查詢語句轉(zhuǎn)換成布爾代數(shù)進(jìn)行處理。一個搜索引擎對網(wǎng)頁的排序很大程度上決定了搜索引擎的質(zhì)量。
【作者單位】: 山西大學(xué);
【分類號】:TP391.3
【正文快照】: 1下載——構(gòu)建網(wǎng)絡(luò)爬蟲1.1圖遍歷算法的取舍從理論上講,廣度優(yōu)先搜索(BFS)和深度優(yōu)先搜索(DFS)算法的時(shí)間復(fù)雜度都是O(n+e),不同的算法爬下整個靜態(tài)網(wǎng)頁的內(nèi)容所用的時(shí)間是相同的。但在現(xiàn)實(shí)生活中,時(shí)間有限,互聯(lián)網(wǎng)時(shí)刻變化。所以應(yīng)該考慮有限時(shí)間里盡可能多的爬下最重要的網(wǎng)頁
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李凱,赫楓齡,左萬利;PageRank-Pro——一種改進(jìn)的網(wǎng)頁排序算法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2003年02期
2 吳淑燕,許濤;PageRank算法的原理簡介[J];圖書情報(bào)工作;2003年02期
3 楊海東,張莉;PageRank技術(shù)分析與搜索引擎檢索效率研究[J];淮陰師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年03期
4 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計(jì)算機(jī)應(yīng)用;2005年07期
5 戚華春,黃德才,鄭月鋒;具有時(shí)間反饋的PageRank改進(jìn)算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2005年03期
6 張延紅;搜索引擎PageRank算法的改進(jìn)[J];浙江萬里學(xué)院學(xué)報(bào);2005年04期
7 黃德才;戚華春;;PageRank算法研究[J];計(jì)算機(jī)工程;2006年04期
8 楊彬;康慕寧;;基于概念的權(quán)重PageRank改進(jìn)算法[J];情報(bào)雜志;2006年11期
9 張麗;;PageRank算法的改進(jìn)[J];科學(xué)技術(shù)與工程;2007年05期
10 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國控制與決策會議論文集(3)[C];2009年
2 藺繼國;徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
3 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
4 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
5 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
6 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
7 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點(diǎn)重要性度量[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
9 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全國復(fù)雜系統(tǒng)研究論壇論文集(一)[C];2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 蔡建超;基于PageRank算法的搜索引擎優(yōu)化研究[D];江南大學(xué);2008年
2 邵晶晶;基于PageRank排序算法改進(jìn)的若干研究[D];華中師范大學(xué);2009年
3 劉文;主題相關(guān)的PageRank算法的改進(jìn)策略的研究和實(shí)現(xiàn)[D];中國海洋大學(xué);2009年
4 王磊;PageRank的算法改進(jìn)[D];上海交通大學(xué);2009年
5 趙波;PageRank算法在非網(wǎng)頁檢索問題中的應(yīng)用[D];復(fù)旦大學(xué);2010年
6 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年
7 馮振明;分塊式PageRank收斂算法及其改進(jìn)[D];河海大學(xué);2006年
8 劉先明;基于鏈接分析的PageRank排序算法的改進(jìn)研究[D];湖北工業(yè)大學(xué);2010年
9 郭慶寶;基于PageRank的搜索引擎優(yōu)化方法研究[D];山東師范大學(xué);2012年
10 姜sバ,
本文編號:1192771
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1192771.html