天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于谷歌搜索引擎產(chǎn)品的研究

發(fā)布時(shí)間:2017-11-16 15:16

  本文關(guān)鍵詞:基于谷歌搜索引擎產(chǎn)品的研究


  更多相關(guān)文章: 搜索引擎 PageRank TF-IDF


【摘要】:所有的搜索引擎產(chǎn)品,都可以歸結(jié)為下載、索引和排序三個步驟,即自動下載海量的網(wǎng)頁;建立快速有效的索引;對網(wǎng)頁進(jìn)行公平準(zhǔn)確的排序;ヂ(lián)網(wǎng)錯綜復(fù)雜,本質(zhì)是一張圖,每個頁面都是一個節(jié)點(diǎn),超鏈接是連接網(wǎng)頁的弧,而自動抓取網(wǎng)絡(luò)信息的程序就是爬蟲。索引是基于數(shù)據(jù)庫的,搜索引擎會自動將用戶的查詢語句轉(zhuǎn)換成布爾代數(shù)進(jìn)行處理。一個搜索引擎對網(wǎng)頁的排序很大程度上決定了搜索引擎的質(zhì)量。
【作者單位】: 山西大學(xué);
【分類號】:TP391.3
【正文快照】: 1下載——構(gòu)建網(wǎng)絡(luò)爬蟲1.1圖遍歷算法的取舍從理論上講,廣度優(yōu)先搜索(BFS)和深度優(yōu)先搜索(DFS)算法的時(shí)間復(fù)雜度都是O(n+e),不同的算法爬下整個靜態(tài)網(wǎng)頁的內(nèi)容所用的時(shí)間是相同的。但在現(xiàn)實(shí)生活中,時(shí)間有限,互聯(lián)網(wǎng)時(shí)刻變化。所以應(yīng)該考慮有限時(shí)間里盡可能多的爬下最重要的網(wǎng)頁

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 李凱,赫楓齡,左萬利;PageRank-Pro——一種改進(jìn)的網(wǎng)頁排序算法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2003年02期

2 吳淑燕,許濤;PageRank算法的原理簡介[J];圖書情報(bào)工作;2003年02期

3 楊海東,張莉;PageRank技術(shù)分析與搜索引擎檢索效率研究[J];淮陰師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年03期

4 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計(jì)算機(jī)應(yīng)用;2005年07期

5 戚華春,黃德才,鄭月鋒;具有時(shí)間反饋的PageRank改進(jìn)算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2005年03期

6 張延紅;搜索引擎PageRank算法的改進(jìn)[J];浙江萬里學(xué)院學(xué)報(bào);2005年04期

7 黃德才;戚華春;;PageRank算法研究[J];計(jì)算機(jī)工程;2006年04期

8 楊彬;康慕寧;;基于概念的權(quán)重PageRank改進(jìn)算法[J];情報(bào)雜志;2006年11期

9 張麗;;PageRank算法的改進(jìn)[J];科學(xué)技術(shù)與工程;2007年05期

10 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國控制與決策會議論文集(3)[C];2009年

2 藺繼國;徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年

3 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

4 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

5 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

6 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年

7 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點(diǎn)重要性度量[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年

8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

9 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全國復(fù)雜系統(tǒng)研究論壇論文集(一)[C];2005年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 蔡建超;基于PageRank算法的搜索引擎優(yōu)化研究[D];江南大學(xué);2008年

2 邵晶晶;基于PageRank排序算法改進(jìn)的若干研究[D];華中師范大學(xué);2009年

3 劉文;主題相關(guān)的PageRank算法的改進(jìn)策略的研究和實(shí)現(xiàn)[D];中國海洋大學(xué);2009年

4 王磊;PageRank的算法改進(jìn)[D];上海交通大學(xué);2009年

5 趙波;PageRank算法在非網(wǎng)頁檢索問題中的應(yīng)用[D];復(fù)旦大學(xué);2010年

6 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年

7 馮振明;分塊式PageRank收斂算法及其改進(jìn)[D];河海大學(xué);2006年

8 劉先明;基于鏈接分析的PageRank排序算法的改進(jìn)研究[D];湖北工業(yè)大學(xué);2010年

9 郭慶寶;基于PageRank的搜索引擎優(yōu)化方法研究[D];山東師范大學(xué);2012年

10 姜sバ,

本文編號:1192771


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1192771.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e5c5e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com