基于Lucene2.0和Heritrix搜索引擎的應(yīng)用研究
本文關(guān)鍵詞:基于Lucene2.0和Heritrix搜索引擎的應(yīng)用研究
更多相關(guān)文章: 搜索引擎 網(wǎng)絡(luò)爬蟲 Lucene軟件 Heritrix程序 Java語(yǔ)言
【摘要】:基于Lucene2.0和Heritrix的搜索引擎是以廣東技術(shù)師范學(xué)院天河學(xué)院為對(duì)象構(gòu)建的,著重開發(fā)一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)垂直搜索引擎,實(shí)現(xiàn)一個(gè)簡(jiǎn)單的搜索引擎所具備的基本功能,為今后搭建一個(gè)標(biāo)準(zhǔn)的、實(shí)用的、商業(yè)化的搜索引擎打下堅(jiān)實(shí)的基礎(chǔ)。
【作者單位】: 廣東技術(shù)師范學(xué)院天河學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系;
【關(guān)鍵詞】: 搜索引擎 網(wǎng)絡(luò)爬蟲 Lucene軟件 Heritrix程序 Java語(yǔ)言
【分類號(hào)】:TP391.3
【正文快照】: 1引言英特網(wǎng)上的信息浩瀚萬(wàn)千,而且毫無(wú)秩序,所有的信息像汪洋上的一個(gè)個(gè)小島,網(wǎng)頁(yè)鏈接是這些小島之間縱橫交錯(cuò)的橋梁,而搜索引擎,則為其繪制一幅一目了然的信息地圖,供隨時(shí)查閱。搜索引擎是指自動(dòng)從英特網(wǎng)搜集信息,經(jīng)過(guò)一定整理以后,提供給用戶進(jìn)行查詢的系統(tǒng)。搜索引擎的工
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 沈文勤,李慶超,邵志清;搜索引擎的漸增式爬行和備份式更新模式[J];華東理工大學(xué)學(xué)報(bào);2004年03期
2 何詠梅;毛云舸;;搜索引擎的發(fā)展現(xiàn)狀與趨勢(shì)研究[J];吉林省經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào);2007年04期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 徐曉力;;SEO及其策略研究[J];電腦知識(shí)與技術(shù);2010年01期
2 周巍巍;;網(wǎng)絡(luò)爬蟲網(wǎng)頁(yè)庫(kù)智能更新策略分析與研究[J];電腦知識(shí)與技術(shù);2010年31期
3 周少波;;基于Lucene2.0和Heritrix搜索引擎的應(yīng)用研究[J];電腦編程技巧與維護(hù);2013年16期
4 劉喜文;鄭昌興;王文龍;湯剛強(qiáng);;構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)過(guò)程中的數(shù)據(jù)清洗研究[J];圖書與情報(bào);2013年05期
5 潘善亮;茅琴嬌;韓露;;一種基于虛擬社交化的Web服務(wù)發(fā)現(xiàn)方法研究[J];電信科學(xué);2013年12期
6 顧益軍;解易;張培晶;;面向有組織犯罪分析的人際關(guān)系網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)價(jià)研究[J];中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
7 鄭晶;;基于云計(jì)算的Pagerank算法的改進(jìn)[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
8 "基于大數(shù)據(jù)的互聯(lián)網(wǎng)化存量經(jīng)營(yíng)"項(xiàng)目組;"基于用戶感知的運(yùn)維轉(zhuǎn)型"項(xiàng)目組;;運(yùn)營(yíng)商存量經(jīng)營(yíng)大數(shù)據(jù)平臺(tái)及其關(guān)鍵技術(shù)研究[J];電信科學(xué);2014年06期
9 張喜平;李永樹;劉剛;王蕾;;節(jié)點(diǎn)重要度貢獻(xiàn)的復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要度評(píng)估方法[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2014年03期
10 龔衛(wèi)華;郭偉鵬;楊良懷;;信任網(wǎng)絡(luò)中多維信任序列模式挖掘方法研究[J];電子與信息學(xué)報(bào);2014年08期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉馨月;Web挖掘中的鏈接分析與話題檢測(cè)研究[D];大連理工大學(xué);2012年
2 馬飛;云數(shù)據(jù)中心中虛擬機(jī)放置和實(shí)時(shí)遷移研究[D];北京交通大學(xué);2013年
3 樂(lè)承毅;企業(yè)知識(shí)與員工知識(shí)貢獻(xiàn)度集成評(píng)價(jià)方法及應(yīng)用研究[D];浙江大學(xué);2013年
4 孫甲申;基于主題模型和隨機(jī)游走的標(biāo)簽技術(shù)研究[D];北京郵電大學(xué);2013年
5 張鵬;數(shù)據(jù)中心網(wǎng)絡(luò)的流量管理和優(yōu)化問(wèn)題研究[D];北京郵電大學(xué);2013年
6 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年
7 尹莉;基礎(chǔ)數(shù)學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)實(shí)證分析[D];西北大學(xué);2013年
8 李朋;異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究[D];重慶大學(xué);2013年
9 程輝;網(wǎng)絡(luò)用戶偏好分析及話題趨勢(shì)預(yù)測(cè)方法研究[D];北京交通大學(xué);2013年
10 湯,|;基于多生物信息的蛋白質(zhì)網(wǎng)絡(luò)研究[D];中南大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 郭海燕;搜索引擎中網(wǎng)絡(luò)爬蟲技術(shù)研究[D];西安電子科技大學(xué);2009年
2 程濤;個(gè)性化網(wǎng)絡(luò)信息采集處理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
3 楊頌;面向電子商務(wù)網(wǎng)站的增量爬蟲設(shè)計(jì)與實(shí)現(xiàn)[D];湖南大學(xué);2010年
4 姜杰;專業(yè)搜索引擎分布式Robot設(shè)計(jì)研究[D];南京師范大學(xué);2005年
5 趙欽;并行爬行器的架構(gòu)與優(yōu)化策略[D];北京工業(yè)大學(xué);2006年
6 張維維;搜索引擎的研究與實(shí)現(xiàn)[D];長(zhǎng)春理工大學(xué);2008年
7 仰景崗;在線關(guān)鍵字廣告最優(yōu)競(jìng)價(jià)策略效果及預(yù)算的影響研究[D];上海交通大學(xué);2008年
8 魏春燕;基礎(chǔ)教育多媒體網(wǎng)絡(luò)教學(xué)資源檢索研究[D];山東師范大學(xué);2008年
9 王國(guó)才;基于本體的微內(nèi)容聚合與查詢技術(shù)[D];合肥工業(yè)大學(xué);2009年
10 易顯;搜索引擎中大型網(wǎng)站的網(wǎng)頁(yè)更新策略研究[D];湖南大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 曹玉霞;搜索引擎新思維[J];現(xiàn)代圖書情報(bào)技術(shù);2000年05期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 熊定富;;基于開源Lucene2.0的書目搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];圖書情報(bào)知識(shí);2009年04期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 羅玫;基于LUCENE2.0的源代碼搜索引擎架構(gòu)的實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2007年
,本文編號(hào):811171
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/811171.html