搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)
本文關(guān)鍵詞:搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù),由筆耕文化傳播整理發(fā)布。
搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)
作者:劉荷花 出處:《中國教育信息化》2011年 4月上 總第250期
摘 要:本文對搜索引擎Google的網(wǎng)頁級別(PageRank)技術(shù)進行了研究,整合各種技術(shù)和方法,總結(jié)出PageRank的計算方法。對搜索引擎建立索引的技術(shù)加以改進,將數(shù)據(jù)挖掘中的數(shù)據(jù)分類技術(shù)、自動化中的用戶負反饋技術(shù)、后綴數(shù)組引入搜索引擎,大大提高了搜索引擎的查準率。
關(guān)鍵詞:搜索引擎;數(shù)據(jù)分類;負反饋;數(shù)據(jù)挖掘
中圖分類號:TP31 文獻標識碼:A 文章編號:1673-8454(2011)07-0085-03
目前,對網(wǎng)上信息的高效、智能檢索機制已成為計算機網(wǎng)絡(luò)領(lǐng)域的研究熱點。搜索引擎是幫助互聯(lián)網(wǎng)用戶查詢信息的搜索工具,它搜集、發(fā)現(xiàn)信息,對信息進行理解、提取、組織和處理,為用戶提供檢索服務(wù)。
一、搜索引擎的原理
搜索引擎起源于傳統(tǒng)的信息全文檢索理論。搜索引擎包括全文檢索系統(tǒng)、自動收集網(wǎng)頁的數(shù)據(jù)搜集系統(tǒng)、檢索結(jié)果的頁面生成系統(tǒng),利用網(wǎng)頁收集程序(被稱為Robot,, Spider, Crawler)自動訪問Web站點,提取站點上的網(wǎng)頁,并根據(jù)網(wǎng)頁中的鏈接進一步提取其他網(wǎng)頁,或轉(zhuǎn)移到其他站點上。Crawler搜集的網(wǎng)頁被加入到搜索引擎的數(shù)據(jù)庫中,供用戶查詢使用。
上一篇:基于嵌入式DVR/DVS的視頻監(jiān)控系統(tǒng)在實驗教學中的應(yīng)用
下一篇:一種基于數(shù)字水印技術(shù)的文本文檔版權(quán)保護方案
推薦閱讀
本文關(guān)鍵詞:搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù),由筆耕文化傳播整理發(fā)布。
本文編號:72181
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/72181.html