《情報學(xué)報》2002年02期
本文關(guān)鍵詞:搜索引擎中Robot搜索算法的優(yōu)化,,由筆耕文化傳播整理發(fā)布。
《情報學(xué)報》 2002年02期
投稿
搜索引擎中Robot搜索算法的優(yōu)化
【摘要】:目前的搜索引擎越來越暴露出不足之處 ,當(dāng)用戶使用搜索引擎時輸入特定關(guān)鍵詞之后 ,返回的查詢結(jié)果往往有數(shù)千甚至幾百萬之多 ,而且其中包含大量的重復(fù)信息與垃圾信息 ,用戶從中篩選出自己感興趣的網(wǎng)頁仍然需要耗費很長的時間。另外一種情況就是 ,Web上明明存在某些重要網(wǎng)頁 ,卻沒有被搜索引擎的robot發(fā)現(xiàn)。本文針對這種現(xiàn)象 ,重點討論搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索階段就能夠充分處理與Robot頻繁交互的URL列表。根據(jù)網(wǎng)頁的內(nèi)容、HTML結(jié)構(gòu)以及其中包含的超鏈信息計算網(wǎng)頁的PageRank ,使URL列表能夠根據(jù)重要性調(diào)整排列順序。初步的試驗結(jié)果表明 ,本文的優(yōu)化算法可以較大程度地改進(jìn)搜索引擎的整體性能
【作者單位】:
【關(guān)鍵詞】:
【分類號】:TP393.09
【正文快照】:
1 引 言隨著Internet上網(wǎng)站數(shù)目的迅速增長 ,網(wǎng)上的信息量以幾何級數(shù)劇增。近期的統(tǒng)計結(jié)果表明 ,因特網(wǎng)上可被索引的網(wǎng)頁已超過 10億。人們?yōu)榱擞行У乩脭?shù)量如此龐大的信息資源 ,離不開輔助工具的幫助。搜索引擎就是當(dāng)前解決這一問題的有效工具。統(tǒng)計資料表明
下載全文 更多同類文獻(xiàn)
PDF全文下載
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式,AdobeReader僅支持PDF格式
【引證文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 汪斌;張云偉;劉健;陳晶;;[J];安徽農(nóng)業(yè)科學(xué);2009年20期
2 查志琴;;[J];常州工學(xué)院學(xué)報;2007年04期
3 高波;;[J];常州工學(xué)院學(xué)報;2008年02期
4 高磊;徐東平;;[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年02期
5 蒯曉童,王銀娣;[J];地理空間信息;2004年04期
6 王曙光,張莉,張春元;[J];福建電腦;2004年11期
7 郭一平;王亮;;[J];高等工程教育研究;2006年S1期
8 郭一平;王亮;;[J];高校圖書情報論壇;2006年02期
9 郭一平;王亮;;[J];高校圖書情報論壇;2006年03期
10 吳楠;;[J];艦船電子工程;2008年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 楊衛(wèi)明;;[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 張宏斌;[D];華中科技大學(xué);2004年
2 杜亞軍;[D];西南交通大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 曹仲偉;[D];湖北工業(yè)大學(xué);2011年
2 趙思佳;[D];中南大學(xué);2010年
3 仇亞東;[D];南京農(nóng)業(yè)大學(xué);2010年
4 常曉燕;[D];西南交通大學(xué);2004年
5 區(qū)玉明;[D];廣西師范大學(xué);2004年
6 張敏;[D];山東科技大學(xué);2004年
7 王亮;[D];華中科技大學(xué);2004年
8 王軍;[D];華中科技大學(xué);2004年
9 曹紅;[D];北京林業(yè)大學(xué);2005年
10 蔡建超;[D];華中科技大學(xué);2006年
【同被引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李偉;黃穎;;[J];兵工自動化;2007年07期
2 雷鳴,王建勇,趙江華,單松巍,陳葆玨;[J];北京大學(xué)學(xué)報(自然科學(xué)版);2001年05期
3 李源,何清,史忠植;[J];北京科技大學(xué)學(xué)報;2001年06期
4 曹元大,賀海軍,涂哲明;[J];北京理工大學(xué)學(xué)報;2002年01期
5 何學(xué)鋒,彭超群,張曾榮;[J];編輯學(xué)報;2003年06期
6 李紅梅;丁振國;周水生;周利華;;[J];北京郵電大學(xué)學(xué)報;2008年05期
7 黃曉英;[J];圖書與情報;2002年02期
8 文庭孝;[J];圖書與情報;2005年05期
9 黃長征;[J];商業(yè)研究;2004年15期
10 楊樹林;;[J];北京印刷學(xué)院學(xué)報;2005年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 孫坦;[D];中國科學(xué)院文獻(xiàn)情報中心;2000年
2 陳定權(quán);[D];中國科學(xué)院研究生院(文獻(xiàn)情報中心);2003年
3 杜亞軍;[D];西南交通大學(xué);2005年
4 彭濤;[D];吉林大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳小寧;[D];暨南大學(xué);2001年
2 劉向輝;[D];昆明理工大學(xué);2001年
3 張儉恭;[D];中國科學(xué)院研究生院(文獻(xiàn)情報中心);2002年
4 李炎茗;[D];華中師范大學(xué);2002年
5 索金琳;[D];河海大學(xué);2002年
6 田萱;[D];山東師范大學(xué);2003年
7 侯震宇;[D];中國科學(xué)院研究生院(文獻(xiàn)情報中心);2003年
8 余晨;[D];中國科學(xué)院研究生院(軟件研究所);2002年
9 劉峰;[D];大連理工大學(xué);2004年
10 姚斌;[D];內(nèi)蒙古大學(xué);2004年
【二級引證文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 董素芬;滕桂法;高媛;;[J];安徽農(nóng)業(yè)科學(xué);2010年12期
2 張帆;林建;;[J];圖書與情報;2007年04期
3 王雅坤;成全;;[J];圖書與情報;2012年01期
4 鄭淼;;[J];常州工學(xué)院學(xué)報;2007年03期
5 劉智濃;張永利;;[J];電腦知識與技術(shù);2006年02期
6 鹿文超;;[J];電腦知識與技術(shù);2008年21期
7 王育琳;;[J];電腦知識與技術(shù);2011年33期
8 張黎爍;李鑫;徐猛;;[J];光盤技術(shù);2008年12期
9 劉文浩;謝韜;吳進(jìn);;[J];計算機光盤軟件與應(yīng)用;2012年08期
10 吳麗華;羅云鋒;符海艷;;[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年04期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 李慧敏;鄔群勇;王欽敏;;[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
2 吳珊;楊樺;;[A];2006年電氣工程教育專業(yè)委員會年會論文集[C];2006年
3 姚文琳;王莉;王璀民;;[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
4 蔡陽波;鄧一貴;王康;;[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
5 董靜;林鴻飛;楊志豪;;[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
6 維尼拉·木沙江;吐爾洪·吾司曼;;[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 李群;[D];北京林業(yè)大學(xué);2011年
2 王樹梅;[D];南京理工大學(xué);2007年
3 方輝;[D];四川大學(xué);2007年
4 劉煒;[D];太原理工大學(xué);2007年
5 劉東飛;[D];武漢理工大學(xué);2009年
6 王春元;[D];合肥工業(yè)大學(xué);2009年
7 黃河;[D];中國科學(xué)技術(shù)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岳廣飛;[D];山東科技大學(xué);2010年
2 李振;[D];鄭州大學(xué);2010年
3 毛敏芹;[D];華東師范大學(xué);2010年
4 王思麗;[D];西北民族大學(xué);2010年
5 王曉地;[D];華南理工大學(xué);2010年
6 趙洋;[D];長春工業(yè)大學(xué);2010年
7 郭海燕;[D];西安電子科技大學(xué);2009年
8 宋曉旭;[D];沈陽工業(yè)大學(xué);2011年
9 舒曉明;[D];沈陽工業(yè)大學(xué);2011年
10 曹仲偉;[D];湖北工業(yè)大學(xué);2011年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李丹;魯明羽;時麗莎;;[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2008年03期
2 宋聚平,王永成,滕偉,許歡慶;[J];情報學(xué)報;2002年02期
3 張毅;張冬梅;;[J];科技創(chuàng)新導(dǎo)報;2008年21期
4 潘大勝;;[J];湖南文理學(xué)院學(xué)報(自然科學(xué)版);2009年01期
5 蔡建超;蔡明;;[J];計算機應(yīng)用與軟件;2008年09期
6 王福海;;[J];科技信息;2011年15期
7 杜光芹;張化祥;;[J];信息技術(shù)與信息化;2006年04期
8 楊彬;康慕寧;;[J];情報雜志;2006年11期
9 林泓;劉朋;李晶晶;龍振海;;[J];武漢理工大學(xué)學(xué)報;2009年03期
10 謝麗賀;;[J];計算機與信息技術(shù);2011年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 楊磊;束罡;牛振東;;[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
2 劉松彬;都云程;施水才;;[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
3 彭軻;廖聞劍;;[A];中國通信學(xué)會第五屆學(xué)術(shù)年會論文集[C];2008年
4 李丹;;[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學(xué)術(shù)交流會議論文匯編[C];2003年
5 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年
6 維尼拉·木沙江;吐爾洪·吾司曼;;[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
7 藺繼國;徐錫山;;[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
8 湯薇;曾艷;;[A];廣西計算機學(xué)會2008年年會論文集[C];2008年
9 姚樹宇;趙少東;;[A];2005年全國開放式分布與并行計算學(xué)術(shù)會議論文集[C];2005年
10 倪俊峰;;[A];2005年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 李一鑫;[N];財經(jīng)時報;2007年
2 周文林;[N];經(jīng)濟參考報;2007年
3 惠正一;[N];第一財經(jīng)日報;2005年
4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;[N];中國計算機報;2005年
5 陳珊;[N];人民郵電;2005年
6 趙法忠;[N];中國經(jīng)營報;2005年
7 金朝力;[N];北京商報;2006年
8 本報記者 趙曉輝 孟昭麗;[N];中國證券報;2006年
9 孫琎;[N];第一財經(jīng)日報;2006年
10 姜蕊;[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王镠璞;[D];吉林大學(xué);2010年
2 岑榮偉;[D];清華大學(xué);2010年
3 李群;[D];北京林業(yè)大學(xué);2011年
4 蘇君華;[D];南京大學(xué);2011年
5 劉佐達(dá);[D];清華大學(xué);2011年
6 陳旭毅;[D];武漢大學(xué);2011年
7 郭眈;[D];北京交通大學(xué);2012年
8 李莎莎;[D];國防科學(xué)技術(shù)大學(xué);2011年
9 白玉琪;[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
10 徐晴陽;[D];吉林大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉青偉;[D];電子科技大學(xué);2010年
2 張巍;[D];四川大學(xué);2005年
3 縣小平;[D];西北大學(xué);2010年
4 蔡建超;[D];江南大學(xué);2008年
5 于愛軍;[D];吉林大學(xué);2004年
6 袁瑞紅;[D];南京理工大學(xué);2009年
7 尉建興;[D];太原理工大學(xué);2011年
8 王春花;[D];西北農(nóng)林科技大學(xué);2010年
9 李世明;[D];北京化工大學(xué);2005年
10 呂克強;[D];中國石油大學(xué);2008年
本文關(guān)鍵詞:搜索引擎中Robot搜索算法的優(yōu)化,由筆耕文化傳播整理發(fā)布。
本文編號:189549
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/189549.html