搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)
本文關(guān)鍵詞:搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù),由筆耕文化傳播整理發(fā)布。
搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)
作者:劉荷花 出處:《中國(guó)教育信息化》2011年 4月上 總第250期
摘 要:本文對(duì)搜索引擎Google的網(wǎng)頁(yè)級(jí)別(PageRank)技術(shù)進(jìn)行了研究,整合各種技術(shù)和方法,總結(jié)出PageRank的計(jì)算方法。對(duì)搜索引擎建立索引的技術(shù)加以改進(jìn),將數(shù)據(jù)挖掘中的數(shù)據(jù)分類技術(shù)、自動(dòng)化中的用戶負(fù)反饋技術(shù)、后綴數(shù)組引入搜索引擎,大大提高了搜索引擎的查準(zhǔn)率。
關(guān)鍵詞:搜索引擎;數(shù)據(jù)分類;負(fù)反饋;數(shù)據(jù)挖掘
中圖分類號(hào):TP31 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-8454(2011)07-0085-03
目前,對(duì)網(wǎng)上信息的高效、智能檢索機(jī)制已成為計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn)。搜索引擎是幫助互聯(lián)網(wǎng)用戶查詢信息的搜索工具,它搜集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織和處理,為用戶提供檢索服務(wù)。
一、搜索引擎的原理
搜索引擎起源于傳統(tǒng)的信息全文檢索理論。搜索引擎包括全文檢索系統(tǒng)、自動(dòng)收集網(wǎng)頁(yè)的數(shù)據(jù)搜集系統(tǒng)、檢索結(jié)果的頁(yè)面生成系統(tǒng),利用網(wǎng)頁(yè)收集程序(被稱為Robot,, Spider, Crawler)自動(dòng)訪問(wèn)Web站點(diǎn),提取站點(diǎn)上的網(wǎng)頁(yè),并根據(jù)網(wǎng)頁(yè)中的鏈接進(jìn)一步提取其他網(wǎng)頁(yè),或轉(zhuǎn)移到其他站點(diǎn)上。Crawler搜集的網(wǎng)頁(yè)被加入到搜索引擎的數(shù)據(jù)庫(kù)中,供用戶查詢使用。
上一篇:基于嵌入式DVR/DVS的視頻監(jiān)控系統(tǒng)在實(shí)驗(yàn)教學(xué)中的應(yīng)用
下一篇:一種基于數(shù)字水印技術(shù)的文本文檔版權(quán)保護(hù)方案
推薦閱讀
本文關(guān)鍵詞:搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù),由筆耕文化傳播整理發(fā)布。
本文編號(hào):72181
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/72181.html