搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)

發(fā)布時(shí)間：2016-07-16 20:11

本文關(guān)鍵詞：搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)，由筆耕文化傳播整理發(fā)布。

搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)

作者：劉荷花　出處：《中國(guó)教育信息化》2011年 4月上總第250期

　　摘　要：本文對(duì)搜索引擎Google的網(wǎng)頁(yè)級(jí)別(PageRank)技術(shù)進(jìn)行了研究，整合各種技術(shù)和方法，總結(jié)出PageRank的計(jì)算方法。對(duì)搜索引擎建立索引的技術(shù)加以改進(jìn)，將數(shù)據(jù)挖掘中的數(shù)據(jù)分類技術(shù)、自動(dòng)化中的用戶負(fù)反饋技術(shù)、后綴數(shù)組引入搜索引擎，大大提高了搜索引擎的查準(zhǔn)率。
　　關(guān)鍵詞：搜索引擎;數(shù)據(jù)分類;負(fù)反饋;數(shù)據(jù)挖掘
　　中圖分類號(hào)：TP31　文獻(xiàn)標(biāo)識(shí)碼：A　文章編號(hào)：1673-8454(2011)07-0085-03

　　目前，對(duì)網(wǎng)上信息的高效、智能檢索機(jī)制已成為計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn)。搜索引擎是幫助互聯(lián)網(wǎng)用戶查詢信息的搜索工具，它搜集、發(fā)現(xiàn)信息，對(duì)信息進(jìn)行理解、提取、組織和處理，為用戶提供檢索服務(wù)。

　　一、搜索引擎的原理

　　搜索引擎起源于傳統(tǒng)的信息全文檢索理論。搜索引擎包括全文檢索系統(tǒng)、自動(dòng)收集網(wǎng)頁(yè)的數(shù)據(jù)搜集系統(tǒng)、檢索結(jié)果的頁(yè)面生成系統(tǒng)，利用網(wǎng)頁(yè)收集程序(被稱為Robot，， Spider， Crawler)自動(dòng)訪問(wèn)Web站點(diǎn)，提取站點(diǎn)上的網(wǎng)頁(yè)，并根據(jù)網(wǎng)頁(yè)中的鏈接進(jìn)一步提取其他網(wǎng)頁(yè)，或轉(zhuǎn)移到其他站點(diǎn)上。Crawler搜集的網(wǎng)頁(yè)被加入到搜索引擎的數(shù)據(jù)庫(kù)中，供用戶查詢使用。

上一篇：基于嵌入式DVR/DVS的視頻監(jiān)控系統(tǒng)在實(shí)驗(yàn)教學(xué)中的應(yīng)用
下一篇：一種基于數(shù)字水印技術(shù)的文本文檔版權(quán)保護(hù)方案

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)