全文搜索引擎e_Guide的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:全文搜索引擎e_Guide的設(shè)計(jì)與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:面對(duì)互聯(lián)網(wǎng)信息量爆炸式的增長(zhǎng),人們對(duì)搜索引擎的需求和依賴越來(lái)越強(qiáng),因此對(duì)搜索引擎技術(shù)的研究具有非常重要的理論意義和實(shí)用價(jià)值。本文描述全文搜索引擎e_Guide的設(shè)計(jì)和實(shí)現(xiàn)。e_Guide是基于Apache Lucene項(xiàng)目及其子項(xiàng)目Nutch和Hadoop的搜索引擎,致力于向用戶提供高質(zhì)量的信息檢索服務(wù)。整個(gè)系統(tǒng)主要分為信息獲取模塊,信息整理模塊,和搜索服務(wù)模塊。使用Nutch獲取網(wǎng)頁(yè)信息,用Lucene API進(jìn)行信息索引和檢索,同時(shí)使用AJAX實(shí)現(xiàn)瀏覽器服務(wù)器之間的異步交互。
【作者單位】: 德州學(xué)院信息管理學(xué)院;
【關(guān)鍵詞】: 搜索引擎 信息檢索 AJAX 異步交互
【分類號(hào)】:TP391.3
【正文快照】: 1、全文搜索引擎概述搜索引擎是隨著Web信息的迅速增加,從1995年開(kāi)始逐漸發(fā)展起來(lái)的技術(shù)。它在互聯(lián)網(wǎng)中提供導(dǎo)航服務(wù),該服務(wù)已經(jīng)成為互聯(lián)網(wǎng)上非常重要的網(wǎng)絡(luò)服務(wù)。全文搜索引擎從互聯(lián)網(wǎng)提取各個(gè)網(wǎng)站的信息(以網(wǎng)頁(yè)文字為主),建立起數(shù)據(jù)庫(kù),并能向用戶提供查詢檢索服務(wù)。在眾多
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計(jì)算機(jī)應(yīng)用;2005年07期
2 歐陽(yáng)柳波,李學(xué)勇,李國(guó)徽,王鑫;網(wǎng)絡(luò)蜘蛛搜索策略進(jìn)展研究[J];小型微型計(jì)算機(jī)系統(tǒng);2005年04期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 蘇旋;分布式網(wǎng)絡(luò)爬蟲技術(shù)的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2006年
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 鄭志波;;搜索器的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年01期
2 張麗敏;;垂直搜索引擎的主題爬蟲策略[J];電腦知識(shí)與技術(shù);2010年15期
3 趙穎斯;劉云;;BBS輿情系統(tǒng)的數(shù)據(jù)采集方法[J];電信快報(bào);2008年12期
4 徐英;;面向搜索引擎優(yōu)化的網(wǎng)站建設(shè)方法淺析[J];福建電腦;2011年10期
5 劉東鑫;周斯寧;沈軍;;互聯(lián)網(wǎng)不良信息治理的研究與探討[J];廣東通信技術(shù);2010年12期
6 劉繼紅;吳軍華;任明鑫;;基于改進(jìn)的網(wǎng)絡(luò)蜘蛛算法抽取Web站點(diǎn)結(jié)構(gòu)的方法[J];江南大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期
7 譚龍江;;基于搜索引擎優(yōu)化的網(wǎng)絡(luò)宣傳機(jī)模型[J];計(jì)算機(jī)應(yīng)用;2010年08期
8 梁黨衛(wèi);彭文滔;邊利亞;;垂直搜索引擎中過(guò)濾器的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2009年12期
9 閔惜琳;朱展發(fā);;面向“百度”搜索引擎優(yōu)化算法應(yīng)用規(guī)律分析[J];價(jià)值工程;2012年14期
10 李向陽(yáng);李錚;;基于Struts和Hibernate框架的比價(jià)網(wǎng)設(shè)計(jì)與實(shí)現(xiàn)[J];龍巖學(xué)院學(xué)報(bào);2007年06期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 王亮;基于胞映射的數(shù)字控制系統(tǒng)量化效應(yīng)分析與設(shè)計(jì)[D];華中科技大學(xué);2008年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 周兵;基于分布式精準(zhǔn)采集的垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
2 連惠杰;基于主題的教育信息定向采集系統(tǒng)[D];南京理工大學(xué);2011年
3 王甲坤;基于互聯(lián)網(wǎng)的話題分類及敏感話題發(fā)現(xiàn)技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
4 盧凡;基于領(lǐng)域本體的主題爬蟲系統(tǒng)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
5 楊哲;基于Groovy的分布式網(wǎng)絡(luò)爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2010年
6 唐華姣;主題搜索引擎索引技術(shù)的研究與實(shí)現(xiàn)[D];重慶交通大學(xué);2011年
7 汪明強(qiáng);基于JAVA+LUCENE+HERITRIX的WEB垂直搜索引擎技術(shù)研究與實(shí)現(xiàn)[D];河北工業(yè)大學(xué);2011年
8 李海波;基于MapReduce框架的分布式網(wǎng)絡(luò)爬行器研究[D];哈爾濱工程大學(xué);2011年
9 徐濤;基于社會(huì)網(wǎng)絡(luò)分析的藏文web鏈接結(jié)構(gòu)研究[D];西北民族大學(xué);2011年
10 馮振明;分塊式PageRank收斂算法及其改進(jìn)[D];河海大學(xué);2006年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 文坤梅,盧正鼎,葉衛(wèi)國(guó),金莉;搜索引擎中頁(yè)面更新策略的分析與改進(jìn)[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年12期
2 王繼民;國(guó)內(nèi)綜合性搜索引擎時(shí)新性的計(jì)算[J];計(jì)算機(jī)工程與應(yīng)用;2003年21期
3 潘春華 ,常敏 ,武港山;面向Web的信息收集工具的設(shè)計(jì)與開(kāi)發(fā)[J];計(jì)算機(jī)應(yīng)用研究;2002年06期
4 冉曉e
本文編號(hào):456955
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/456955.html