國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心站內(nèi)搜索引擎技術(shù)研究
本文選題:Lucene + 搜索引擎 ; 參考:《中國(guó)農(nóng)學(xué)通報(bào)》2011年30期
【摘要】:為了解決原有檢索技術(shù)已經(jīng)不能滿足國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心檢索需求的問(wèn)題,研究了Lucene這種開源全文檢索工具包的原理及使用方法,探討了利用Lucene工具包在國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心站內(nèi)構(gòu)建海量數(shù)據(jù)搜索引擎的方法,并在農(nóng)業(yè)科學(xué)數(shù)據(jù)中心網(wǎng)站中選取3個(gè)有代表性的大、中、小型數(shù)據(jù)庫(kù),依照上述方法建立了基于Lucene工具包的搜索引擎,以此為基礎(chǔ)進(jìn)行不同大小數(shù)據(jù)庫(kù)搜索效率對(duì)比實(shí)驗(yàn),最后,將實(shí)驗(yàn)結(jié)果與傳統(tǒng)的數(shù)據(jù)檢索方法在相應(yīng)數(shù)據(jù)庫(kù)搜索時(shí)所得到的結(jié)果相比較。實(shí)驗(yàn)結(jié)果表明,基于Lucene的搜索引擎在檢索效率上明顯占優(yōu),實(shí)際應(yīng)用效果也是令人滿意的。
[Abstract]:In order to solve the problem that the original retrieval technology can no longer meet the retrieval needs of the National Agricultural Science data Center, this paper studies the principle and use method of Lucene, an open source full-text retrieval toolkit. This paper discusses the method of constructing the massive data search engine in the National Agricultural Science data Center by using the Lucene Toolkit, and selects three representative large, medium and small databases in the website of the Agricultural Science data Center. According to the above method, the search engine based on Lucene Toolkit is established, based on which the search efficiency of different size databases is compared. Finally, The experimental results are compared with those obtained by the traditional data retrieval methods in the corresponding database search. The experimental results show that the search engine based on Lucene is superior in retrieval efficiency and the practical application effect is satisfactory.
【作者單位】: 中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所;
【基金】:國(guó)家科技重大專項(xiàng)課題“基于TD-SCDMA的農(nóng)村信息化應(yīng)用方案開發(fā)及示范驗(yàn)證”(2009ZX03001-019)
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 謝峰;劉洪星;;基于Lucene的Web站內(nèi)搜索引擎的研究[J];電腦知識(shí)與技術(shù);2008年04期
2 張盼;聶剛;;基于Lucene的全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2010年01期
3 劉磊安;符志強(qiáng);;基于Lucene.net網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2010年08期
4 解鵬飛;;Lucene搜索引擎技術(shù)在國(guó)家海洋數(shù)字檔案館示范系統(tǒng)中的實(shí)現(xiàn)及應(yīng)用[J];海洋環(huán)境科學(xué);2008年S2期
5 樊景超;周國(guó)民;;基于Lucene的“農(nóng)搜”并行索引技術(shù)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年08期
6 白曉玲;;Lucene全文檢索系統(tǒng)的實(shí)現(xiàn)及其索引性能的提高[J];情報(bào)探索;2010年01期
7 晁岳峰;曹作良;郭英玲;;基于Lucene的搜索引擎在遠(yuǎn)程教育平臺(tái)中的實(shí)現(xiàn)[J];天津理工大學(xué)學(xué)報(bào);2005年06期
8 彭哲;陳敬文;;Lucene全文檢索的應(yīng)用及檢索效率測(cè)試研究[J];圖書館學(xué)研究;2009年02期
9 李永春;丁華福;;Lucene的全文檢索的研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期
10 葉云;梁京章;;基于Lucene的搜索引擎在遠(yuǎn)程教育平臺(tái)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī);2007年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李敏;黃凱;;一個(gè)多線程全文檢索系統(tǒng)的構(gòu)建[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期
2 梁葉;梁京章;陽(yáng)紅;葉云;;近似鏡像檢測(cè)算法在文本消重中的應(yīng)用研究[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
3 李勇;王移芝;;基于Lucene的網(wǎng)絡(luò)教學(xué)資源檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與信息技術(shù);2008年11期
4 龔磊;武友新;;Lucene全文檢索系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)與數(shù)字工程;2010年05期
5 李立;王小磊;趙東升;;生物醫(yī)學(xué)專題信息跟蹤與服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];軍事醫(yī)學(xué)科學(xué)院院刊;2010年04期
6 李浩;;通用格式的Lucene文檔解析器框架的構(gòu)建[J];計(jì)算機(jī)與現(xiàn)代化;2011年03期
7 聶琰;;校園網(wǎng)多數(shù)據(jù)源信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];中國(guó)教育信息化;2011年05期
8 孫海東;張力;;基于Lucennee.t的醫(yī)學(xué)教育視頻垂直檢索的設(shè)計(jì)與實(shí)現(xiàn)[J];開放教育研究;2011年02期
9 賀秀英;;基于信息檢索的整合檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];商業(yè)時(shí)代;2011年14期
10 丁兆貴;金敏;;基于Lucene的個(gè)性化搜索引擎研究與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年02期
相關(guān)碩士學(xué)位論文 前10條
1 董長(zhǎng)春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
2 陳正思;基于TRS信息檢索技術(shù)的文獻(xiàn)資源統(tǒng)一檢索平臺(tái)的構(gòu)建[D];中南大學(xué);2011年
3 于景茹;基于Lucene的職位垂直搜索引擎的研究與實(shí)現(xiàn)[D];鄭州大學(xué);2011年
4 孫利芳;基于DSpace的文獻(xiàn)倉(cāng)儲(chǔ)庫(kù)的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2010年
5 王可;基于Nutch的學(xué)校信息垂直搜索引擎的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2009年
6 何軍;基于RFID的開發(fā)式門禁系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
7 曾旭;全文檢索引擎應(yīng)用于郵件的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
8 張實(shí)磊;數(shù)字電視業(yè)務(wù)信息協(xié)議棧設(shè)計(jì)[D];電子科技大學(xué);2010年
9 陰曉昱;基于Lucene多核并行索引方法的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2011年
10 黃衛(wèi)平;個(gè)性化搜索引擎的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陸云;;對(duì)基于Java的全文檢索工具包lucene的索引研究[J];電腦學(xué)習(xí);2007年02期
2 孔伯煊;李祥;;基于Lucene\XML技術(shù)的Web搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];航空計(jì)算技術(shù);2006年04期
3 趙汀,孟祥武;基于LUCENEAPI的中文全文數(shù)據(jù)庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2003年20期
4 雷景生,林冬雪,符淺淺;基于改進(jìn)向量空間模型的Web信息檢索技術(shù)研究[J];計(jì)算機(jī)工程;2005年01期
5 郎小偉;王申康;;基于Lucene的全文檢索系統(tǒng)研究與開發(fā)[J];計(jì)算機(jī)工程;2006年04期
6 李志蜀,李果;中文搜索引擎的原理剖析及開發(fā)實(shí)現(xiàn)技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2001年11期
7 朱學(xué)昊;王儒敬;余鋒林;唐昱;;基于Lucene的站內(nèi)搜索設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年10期
8 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機(jī)制——雙字哈希機(jī)制[J];中文信息學(xué)報(bào);2003年04期
9 孫西全;馬瑞芳;李燕靈;;基于Lucene的信息檢索的研究與應(yīng)用[J];情報(bào)理論與實(shí)踐;2006年01期
10 劉紅;XML文獻(xiàn)數(shù)據(jù)庫(kù)檢索系統(tǒng)的建立與實(shí)現(xiàn)[J];情報(bào)學(xué)報(bào);2003年04期
相關(guān)碩士學(xué)位論文 前1條
1 宋艷娟;基于XML的HTML和PDF信息抽取技術(shù)的研究[D];福州大學(xué);2006年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 管建和;甘劍峰;;基于Lucene全文檢索引擎的應(yīng)用研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年02期
2 周楊;;基于Lucene的小型搜索引擎系統(tǒng)的架構(gòu)與實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年11期
3 晁岳峰;曹作良;郭英玲;;基于Lucene的搜索引擎在遠(yuǎn)程教育平臺(tái)中的實(shí)現(xiàn)[J];天津理工大學(xué)學(xué)報(bào);2005年06期
4 李永春;丁華福;;Lucene的全文檢索的研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期
5 任惠靜;;基于Lucene的面向主題搜索引擎的索引技術(shù)的研究[J];電腦知識(shí)與技術(shù);2010年04期
6 侯云;;構(gòu)建基于Lucene的網(wǎng)站站內(nèi)搜索[J];信息與電腦(理論版);2010年02期
7 劉建湘;楊文濤;;基于Lucene的搜索引擎在Struts中的應(yīng)用[J];軟件導(dǎo)刊;2007年03期
8 溫艷鴻;;基于lucene的文件搜索引擎的設(shè)計(jì)與擴(kuò)展[J];福建電腦;2007年08期
9 周平;;Lucene全文檢索引擎技術(shù)及應(yīng)用[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年04期
10 馬志強(qiáng);劉利民;蘇依拉;馬瑞明;;基于Lucene的站內(nèi)搜索引擎研究[J];內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
相關(guān)會(huì)議論文 前10條
1 余珊珊;吳京慧;;個(gè)性化搜索引擎中用戶興趣模型的研究和設(shè)計(jì)[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
2 郭晶;;一個(gè)基于漢語(yǔ)分詞的搜索引擎原型系統(tǒng)[A];OA’2001辦公自動(dòng)化國(guó)際學(xué)術(shù)研討會(huì)論文集[C];2001年
3 于芳;王大玲;于戈;白旭輝;;搜索引擎中一種基于PLSA的用戶模型[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
4 孟紅;鐘華;;基于htmlparser的搜索引擎信息抽取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
5 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
6 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
7 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
8 賈彥國(guó);李培德;;Web檢索結(jié)果聚類算法的改進(jìn)[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(上)[C];2006年
9 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡(luò)搜索引擎用戶行為分析和研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
10 張t$t$;陳華;姜曉寧;;農(nóng)業(yè)電子圖書館在網(wǎng)絡(luò)搜索引擎沖擊下如何發(fā)展的幾點(diǎn)思考[A];中國(guó)農(nóng)業(yè)信息科技創(chuàng)新與學(xué)科發(fā)展大會(huì)論文匯編[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)記者 朱杰;搜索引擎應(yīng)用性能分析報(bào)告[N];中國(guó)計(jì)算機(jī)報(bào);2009年
2 本報(bào)記者 求一兵;國(guó)內(nèi)搜索引擎市場(chǎng)有微變[N];科學(xué)時(shí)報(bào);2009年
3 記者 李建偉;第4代搜索引擎在鄭州問(wèn)世[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2009年
4 記者 趙志鵬;媒體稱俄擬建國(guó)家搜索引擎[N];新華每日電訊;2010年
5 記者 李大慶;新型搜索引擎能向用戶直接提供所需內(nèi)容[N];科技日?qǐng)?bào);2010年
6 深圳大學(xué)傳播學(xué)院、傳媒與文化發(fā)展研究中心 周裕瓊;誰(shuí)動(dòng)了我的大腦[N];社會(huì)科學(xué)報(bào);2010年
7 李大慶;新型搜索引擎直接為用戶提供所需內(nèi)容[N];中國(guó)技術(shù)市場(chǎng)報(bào);2010年
8 余建斌;搜索引擎市場(chǎng)“烽煙四起”[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2010年
9 邁巴赫 編譯;搜索引擎20年[N];計(jì)算機(jī)世界;2010年
10 記者 秦羽 通訊員 施銀峰;全球搜索引擎營(yíng)銷大會(huì)在甬舉行[N];寧波日?qǐng)?bào);2010年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
5 費(fèi)巍;搜索引擎檢索功能的性能評(píng)價(jià)研究[D];武漢大學(xué);2010年
6 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
7 杜亞軍;搜索引擎智能行為的研究及實(shí)現(xiàn)[D];西南交通大學(xué);2005年
8 劉東飛;智能雙語(yǔ)搜索方法及搜索引擎的研究[D];武漢理工大學(xué);2009年
9 周,
本文編號(hào):1946105
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1946105.html