搜索引擎中Robot搜索算法的優(yōu)化
發(fā)布時間:2021-01-13 11:46
目前的搜索引擎越來越暴露出不足之處 ,當(dāng)用戶使用搜索引擎時輸入特定關(guān)鍵詞之后 ,返回的查詢結(jié)果往往有數(shù)千甚至幾百萬之多 ,而且其中包含大量的重復(fù)信息與垃圾信息 ,用戶從中篩選出自己感興趣的網(wǎng)頁仍然需要耗費很長的時間。另外一種情況就是 ,Web上明明存在某些重要網(wǎng)頁 ,卻沒有被搜索引擎的robot發(fā)現(xiàn)。本文針對這種現(xiàn)象 ,重點討論搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索階段就能夠充分處理與Robot頻繁交互的URL列表。根據(jù)網(wǎng)頁的內(nèi)容、HTML結(jié)構(gòu)以及其中包含的超鏈信息計算網(wǎng)頁的PageRank ,使URL列表能夠根據(jù)重要性調(diào)整排列順序。初步的試驗結(jié)果表明 ,本文的優(yōu)化算法可以較大程度地改進搜索引擎的整體性能
【文章來源】:情報學(xué)報. 2002,(02)北大核心CSSCI
【文章頁數(shù)】:4 頁
【部分圖文】:
URL的并行處理流程圖
【參考文獻】:
期刊論文
[1]搜索引擎優(yōu)化視角通信系統(tǒng)網(wǎng)址設(shè)計研究[J]. 暢玉潔. 電子元器件與信息技術(shù). 2020(02)
[2]基于共詞分析的國內(nèi)搜索引擎研究熱點分析[J]. 梁曉婷,劉麗華. 內(nèi)蒙古科技與經(jīng)濟. 2015(05)
[3]搜索引擎學(xué)術(shù)研究知識圖譜[J]. 劉陽,宋余慶. 圖書情報知識. 2010(06)
[4]基于Java的網(wǎng)絡(luò)制造資源主題信息采集模塊設(shè)計[J]. 謝大吉. 計算機工程與設(shè)計. 2010(19)
[5]一種面向農(nóng)業(yè)信息主題網(wǎng)絡(luò)爬蟲的設(shè)計[J]. 汪斌,張云偉,劉健,陳晶. 安徽農(nóng)業(yè)科學(xué). 2009(20)
[6]Robot算法分析[J]. 江禪志,王才元. 艦船電子工程. 2008(06)
[7]一種面向主題的搜索引擎的實現(xiàn)[J]. 高波. 常州工學(xué)院學(xué)報. 2008(02)
[8]Robot算法分析[J]. 吳楠. 艦船電子工程. 2008(01)
[9]基于行模式的網(wǎng)頁信息提取算法[J]. 查志琴. 常州工學(xué)院學(xué)報. 2007(04)
[10]啟發(fā)式算法在搜索引擎的應(yīng)用[J]. 高磊,徐東平. 電腦知識與技術(shù)(學(xué)術(shù)交流). 2007(02)
博士論文
[1]搜索引擎智能行為的研究及實現(xiàn)[D]. 杜亞軍.西南交通大學(xué) 2005
[2]信息獲取中的兩類不確定問題研究[D]. 張宏斌.華中科技大學(xué) 2004
碩士論文
[1]FTP搜索引擎的關(guān)鍵技術(shù)研究[D]. 曹仲偉.湖北工業(yè)大學(xué) 2011
[2]基于規(guī)則引擎的個性化網(wǎng)頁爬蟲研究[D]. 趙思佳.中南大學(xué) 2010
[3]法院內(nèi)網(wǎng)搜索引擎的設(shè)計與實現(xiàn)[D]. 王小君.內(nèi)蒙古大學(xué) 2010
[4]面向農(nóng)業(yè)領(lǐng)域的垂直搜索技術(shù)的研究[D]. 仇亞東.南京農(nóng)業(yè)大學(xué) 2010
[5]分布式信息檢索引擎的分析與實現(xiàn)[D]. 趙聯(lián)冠.華東師范大學(xué) 2010
[6]基于雙語翻譯搜索引擎的智能用戶接口的研究[D]. 盧葦.武漢理工大學(xué) 2009
[7]搜索引擎技術(shù)改進及其行業(yè)發(fā)展對策研究[D]. 閆冬.合肥工業(yè)大學(xué) 2009
[8]基于TSE的特定領(lǐng)域搜索引擎研究及實現(xiàn)[D]. 侯銳.東北師范大學(xué) 2008
[9]古建主題搜索引擎研究[D]. 白毅.北京化工大學(xué) 2008
[10]垂直搜索引擎系統(tǒng)的研究與設(shè)計[D]. 姚琪.上海交通大學(xué) 2008
本文編號:2974818
【文章來源】:情報學(xué)報. 2002,(02)北大核心CSSCI
【文章頁數(shù)】:4 頁
【部分圖文】:
URL的并行處理流程圖
【參考文獻】:
期刊論文
[1]搜索引擎優(yōu)化視角通信系統(tǒng)網(wǎng)址設(shè)計研究[J]. 暢玉潔. 電子元器件與信息技術(shù). 2020(02)
[2]基于共詞分析的國內(nèi)搜索引擎研究熱點分析[J]. 梁曉婷,劉麗華. 內(nèi)蒙古科技與經(jīng)濟. 2015(05)
[3]搜索引擎學(xué)術(shù)研究知識圖譜[J]. 劉陽,宋余慶. 圖書情報知識. 2010(06)
[4]基于Java的網(wǎng)絡(luò)制造資源主題信息采集模塊設(shè)計[J]. 謝大吉. 計算機工程與設(shè)計. 2010(19)
[5]一種面向農(nóng)業(yè)信息主題網(wǎng)絡(luò)爬蟲的設(shè)計[J]. 汪斌,張云偉,劉健,陳晶. 安徽農(nóng)業(yè)科學(xué). 2009(20)
[6]Robot算法分析[J]. 江禪志,王才元. 艦船電子工程. 2008(06)
[7]一種面向主題的搜索引擎的實現(xiàn)[J]. 高波. 常州工學(xué)院學(xué)報. 2008(02)
[8]Robot算法分析[J]. 吳楠. 艦船電子工程. 2008(01)
[9]基于行模式的網(wǎng)頁信息提取算法[J]. 查志琴. 常州工學(xué)院學(xué)報. 2007(04)
[10]啟發(fā)式算法在搜索引擎的應(yīng)用[J]. 高磊,徐東平. 電腦知識與技術(shù)(學(xué)術(shù)交流). 2007(02)
博士論文
[1]搜索引擎智能行為的研究及實現(xiàn)[D]. 杜亞軍.西南交通大學(xué) 2005
[2]信息獲取中的兩類不確定問題研究[D]. 張宏斌.華中科技大學(xué) 2004
碩士論文
[1]FTP搜索引擎的關(guān)鍵技術(shù)研究[D]. 曹仲偉.湖北工業(yè)大學(xué) 2011
[2]基于規(guī)則引擎的個性化網(wǎng)頁爬蟲研究[D]. 趙思佳.中南大學(xué) 2010
[3]法院內(nèi)網(wǎng)搜索引擎的設(shè)計與實現(xiàn)[D]. 王小君.內(nèi)蒙古大學(xué) 2010
[4]面向農(nóng)業(yè)領(lǐng)域的垂直搜索技術(shù)的研究[D]. 仇亞東.南京農(nóng)業(yè)大學(xué) 2010
[5]分布式信息檢索引擎的分析與實現(xiàn)[D]. 趙聯(lián)冠.華東師范大學(xué) 2010
[6]基于雙語翻譯搜索引擎的智能用戶接口的研究[D]. 盧葦.武漢理工大學(xué) 2009
[7]搜索引擎技術(shù)改進及其行業(yè)發(fā)展對策研究[D]. 閆冬.合肥工業(yè)大學(xué) 2009
[8]基于TSE的特定領(lǐng)域搜索引擎研究及實現(xiàn)[D]. 侯銳.東北師范大學(xué) 2008
[9]古建主題搜索引擎研究[D]. 白毅.北京化工大學(xué) 2008
[10]垂直搜索引擎系統(tǒng)的研究與設(shè)計[D]. 姚琪.上海交通大學(xué) 2008
本文編號:2974818
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2974818.html
最近更新
教材專著