基于Lucene和Nutch的林業(yè)垂直搜索引擎的研建
本文關(guān)鍵詞:基于Lucene和Nutch的林業(yè)垂直搜索引擎的研建,由筆耕文化傳播整理發(fā)布。
本文描述了一個基于Lucene和Nutch實現(xiàn)的林業(yè)垂直搜索引擎,給出了系統(tǒng)框架,其可以為林業(yè)用戶提供專業(yè)的資源檢索服務(wù)。
維普資訊
《農(nóng)業(yè)網(wǎng)絡(luò)信 )o8 g 2o年第 4期研究與開發(fā)
基于 L cn u e e和 N th的林業(yè)垂直搜索引擎 uc的研建 申晉 (林業(yè)大學(xué)信息學(xué)院,京 10 8)北京北 00 3 摘要:文描述了一個基于 L cn和 N t本 uee uc h實現(xiàn)的林業(yè)垂直搜索引擎,出了系統(tǒng)框架,可以為林業(yè)用戶提供專業(yè)的給其 資源檢索服務(wù)。 關(guān)鍵詞:ueeN th搜索引擎; L cn;uc;垂直搜索 中圖分類號: 16¥2文獻(xiàn)標(biāo)識碼: B文章編碼:6 2 6 5 ( 0 8 0 - 0 6 0 1 7 - 2 12 0 ) 0 1— 3 4
S ud n m p e e t to ff r s e tc ls a c e g n a e n u e e a u c t y a d i lm n a i n o o e tv r ia e r h n i e b s d o l c n nd n t h
S HEN Jn i ( o ee o If m t n B i g F rs y U i r t B in 0 0 3 C ia C l g f no a o, e i oet nv s y e ig 10 8, hn ) l r i j n r ei, j
Ab ta tT i a e e c ie h mp e e tto ffr sr e tc ls a c n i e ba e n u e e a d Nuc,a d gv s t e s r c: h s p p r d s rb s te i lm n ain o oe ty v ria e r h e gn s d o L c n n th n i e h s se ac ie t r, i h c n p o i eprfsi n lrs u c ssa c e vc o oe ty u e s y tm h tcu e wh c a r vd oe so a e o r e e h sr iefrfr sr s r. r r
K yw r s u e e N th S a he g e V rc l erh e o d: cn; uc; er n n; e i a’ L c i t as c
1前言 近些年 .隨著因特網(wǎng)的不斷發(fā)展,為廣大農(nóng)林用戶提供服務(wù)的網(wǎng)站日趨豐富,但這些網(wǎng)站所提供的信息相對獨(dú)立、內(nèi)容也較為分散,這就使得農(nóng)林用戶很 難及時有效的獲得較為全面的相關(guān)知識。 G ol、百 og e
( )派出網(wǎng)頁搜索工具 R b t機(jī)器人)或叫做 1 oo ( S i rf p e網(wǎng)絡(luò)爬蟲1在 It n t d n
e e上搜索信息,并把它們 r帶回搜索引擎;
( )把信息進(jìn)行分類索引,建立網(wǎng)頁索引數(shù)據(jù) 2 庫;
度等綜合性搜索引擎雖然強(qiáng)大,但是使用它們來搜索像林業(yè)這樣特定專業(yè)的信息時,往往顯得力不從心。 本文從林業(yè)應(yīng)用的需求考慮,探索一個利用
( )通過 We 3 b服務(wù)器端軟件,為用戶提供瀏覽器 界面下的信息查詢。
目前,常見的綜合型搜索引擎由于其涉及領(lǐng)域太廣,某些特定領(lǐng)域的查詢上則顯得不夠深入和專在業(yè)化l l l。針對這種狀況,出現(xiàn)了專門針對某一專題的主題型搜索引擎,也叫垂直搜索引擎,其可以在某些小范圍的領(lǐng)域取得比綜合型搜索引擎更滿意的結(jié)果,滿足了某些特定用戶的搜索需求。垂直搜索引擎提供的資源都是與某個領(lǐng)域或主題相關(guān)的,與綜合型搜索引擎相比,在服務(wù)上更有專業(yè)特色,有一定程度的個性化,因此它比通用的綜合型搜索引擎將更加有效和準(zhǔn) 確。
L cn和 N t uee uc h的搜索技術(shù)建立林業(yè)知識垂直搜索引 擎,幫助廣大農(nóng)林用戶及時獲取林業(yè)相關(guān)知識。
2相關(guān)技術(shù)介紹 21綜合搜索引擎和垂直搜索引擎 . 搜索引擎就是指在互聯(lián)網(wǎng)上能夠響應(yīng)用戶提交的搜索請求,返回相應(yīng)查詢結(jié)果的技術(shù)和系統(tǒng)。搜索引 擎以一定的策略在互聯(lián)網(wǎng)上搜集、發(fā)現(xiàn)信息,對信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的。搜索引擎提供的導(dǎo)航 服務(wù)已經(jīng)成為互聯(lián)網(wǎng)上非常重要的網(wǎng)絡(luò)服務(wù),成為互聯(lián)網(wǎng)一項最基本的功能。 搜索引擎的工作原理基本分為三個步驟: 收稿日期:0 80— 2 20— 1 2
垂直搜索引擎與綜合搜索引擎存在著很大的差別: ( )服務(wù)目的不同。綜合搜索引擎面向任意用 1戶,提供對任意信息的查詢,而垂直搜索引擎則面向
作者簡介:申晉(9 3 )男, 18一,,碩士研究生,研究方向:森林經(jīng)理學(xué)。
Word文檔免費(fèi)下載:基于Lucene和Nutch的林業(yè)垂直搜索引擎的研建 (下載1-1頁,共1頁)
本文關(guān)鍵詞:基于Lucene和Nutch的林業(yè)垂直搜索引擎的研建,由筆耕文化傳播整理發(fā)布。
本文編號:90231
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/90231.html