基于Lucene全文檢索系統(tǒng)的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:基于Lucene全文檢索系統(tǒng)的設(shè)計與實現(xiàn)
更多相關(guān)文章: Lucene 文檔解析 全文檢索 搜索引擎
【摘要】:隨著信息化水平不斷提高,如何從海量信息中快速查找到所需內(nèi)容成為當(dāng)前研究的熱點。在分析了全文檢索基本原理及Lucene系統(tǒng)結(jié)構(gòu)的基礎(chǔ)上,提出了MVC模式的全文檢索模型,并實現(xiàn)了一套基于SSH框架技術(shù)和Lucene搜索引擎的全文檢索系統(tǒng)。該系統(tǒng)擴展了檢索文檔支持的類型,不僅可以對TXT、MS Office各類文檔進行檢索,還能對PDF、HTML、RTF等文檔進行檢索;改進了中文分詞器,提高了中文分詞效率與精確度;改善了人機交互方式,實現(xiàn)了類似百度、谷歌搜索顯示功能,對搜索關(guān)鍵字進行高亮顯示。系統(tǒng)應(yīng)用情況表明,該系統(tǒng)創(chuàng)建索引效率高,具有較快的檢索速度以及較全的檢索結(jié)果。
【作者單位】: 61070部隊;國防科學(xué)技術(shù)大學(xué)計算機學(xué)院;
【關(guān)鍵詞】: Lucene 文檔解析 全文檢索 搜索引擎
【基金】:國家863計劃資助項目(2012AA7116048)
【分類號】:TP391.3
【正文快照】: 1引言近年來,信息技術(shù)的快速發(fā)展加快了企業(yè)信息化的進程,同時也促進了企業(yè)的發(fā)展,隨著企業(yè)信息的大量增加,電子文檔數(shù)目也急劇膨脹,如何在海量信息中快速、準(zhǔn)確、全面地查找企業(yè)所需的信息資料已成為信息檢索研究領(lǐng)域內(nèi)的一個熱門課題。全文檢索技術(shù)是一種非常高效的信息檢索
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 黃江平;黃理燦;徐玲;;基于Lucene的PDF文檔的全文檢索的實現(xiàn)[J];工業(yè)控制計算機;2012年05期
2 李雪利;黃理燦;范晨熙;;基于Lucene的文檔管理系統(tǒng)的設(shè)計與實現(xiàn)[J];工業(yè)控制計算機;2012年10期
3 唐鐵兵;陳林;祝偉華;;基于Lucene的全文檢索構(gòu)件的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2010年02期
4 姜鑫;余平;;基于Lucene的音視頻資源檢索系統(tǒng)的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2011年11期
5 鄒燕飛;于成尊;趙亮;;基于Lucene的文本搜索引擎的設(shè)計和實現(xiàn)[J];計算機與現(xiàn)代化;2011年09期
6 義天鵬;陳啟安;;基于Lucene的中文分析器分詞性能比較研究[J];計算機工程;2012年22期
7 夏天;黃文;馬駿濤;李光偉;;Lucene全文檢索軟件及其在學(xué)科信息服務(wù)平臺中的應(yīng)用[J];圖書情報工作;2011年21期
8 李永春;丁華福;;Lucene的全文檢索的研究與應(yīng)用[J];計算機技術(shù)與發(fā)展;2010年02期
9 鄭榕增;林世平;;基于Lucene的中文倒排索引技術(shù)的研究[J];計算機技術(shù)與發(fā)展;2010年03期
10 丁兆貴;金敏;;基于Lucene的個性化搜索引擎研究與實現(xiàn)[J];計算機技術(shù)與發(fā)展;2011年02期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王軍;張興忠;;XML與全文檢索在CMS數(shù)據(jù)歸檔中的應(yīng)用[J];電腦開發(fā)與應(yīng)用;2012年01期
2 吳建;;基于Lucene的校園網(wǎng)搜索引擎的設(shè)計與實現(xiàn)[J];湖南工程學(xué)院學(xué)報(自然科學(xué)版);2012年02期
3 王立遠;;基于lucene的AutoMatching公共控件的設(shè)計與實現(xiàn)[J];計算機光盤軟件與應(yīng)用;2012年03期
4 葉昭暉;曾瓊;李強;;基于搜索引擎的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)設(shè)計與實現(xiàn)[J];廣西大學(xué)學(xué)報(自然科學(xué)版);2011年S1期
5 方躍勝;董輝;姚宏亮;;多格式文檔搜索引擎索引系統(tǒng)設(shè)計與實現(xiàn)[J];長江大學(xué)學(xué)報(自然科學(xué)版);2012年07期
6 許璐蕾;周莉;湯可金;姜艷萍;;基于Lucene的垂直搜索引擎的設(shè)計和實現(xiàn)[J];電腦與電信;2013年03期
7 王研碩;;基于J2EE的船務(wù)模塊的設(shè)計與實現(xiàn)[J];化工管理;2013年06期
8 陳曉麗;楊欣蓉;王作釗;周航;趙益;沈玲玲;;面向制造業(yè)的知識搜索引擎設(shè)計[J];電腦知識與技術(shù);2013年16期
9 韋耿;鐘亮;;基于JSP的個人博客系統(tǒng)[J];電腦知識與技術(shù);2013年21期
10 李麗枝;陶振凱;;基于Lucene全文檢索的設(shè)計與實現(xiàn)[J];計算機光盤軟件與應(yīng)用;2013年19期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 吳昊;;基于Lucene技術(shù)的郵件取證技術(shù)研究[A];第28次全國計算機安全學(xué)術(shù)交流會論文集[C];2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 倪娟;生產(chǎn)測井綜合解釋支持系統(tǒng)平臺的設(shè)計與實現(xiàn)[D];西北大學(xué);2011年
2 孟繁佳;航運企業(yè)動態(tài)電子商務(wù)系統(tǒng)的研究與應(yīng)用[D];大連海事大學(xué);2011年
3 孫海東;面向醫(yī)學(xué)教育視頻的垂直檢索的研究[D];第二軍醫(yī)大學(xué);2011年
4 路衛(wèi)杰;基于知識庫的禮品推薦系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2011年
5 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機制研究[D];新疆農(nóng)業(yè)大學(xué);2011年
6 余偉;基于云計算的分布式搜索技術(shù)研究[D];武漢科技大學(xué);2011年
7 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
8 陰曉昱;基于Lucene多核并行索引方法的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2011年
9 金鶴;基于Lucene的期刊網(wǎng)站內(nèi)信息檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
10 張薇;基于OAI-PMH協(xié)議及全文檢索技術(shù)的圖書館聯(lián)合目錄系統(tǒng)[D];蘇州大學(xué);2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王富強;王青山;張立朝;朱浩群;王銳;;基于Lucene的數(shù)據(jù)庫全文信息檢索[J];測繪科學(xué);2008年03期
2 徐白雁;JAVA編程語言及其應(yīng)用[J];電腦與信息技術(shù);1996年04期
3 丁夷;金永賢;;基于Struts+Spring+Hibernate框架的手機圖書館服務(wù)系統(tǒng)[J];大學(xué)圖書館學(xué)報;2011年01期
4 彭波,李曉明;搜索引擎倒排文件的一種分塊組織技術(shù)[J];電子學(xué)報;2005年02期
5 葛振國;李建;何林糠;吳軍;;基于Lucene的Oracle數(shù)據(jù)庫全文檢索[J];信息技術(shù);2010年03期
6 費洪曉,康松林,朱小娟,謝文彪;基于詞頻統(tǒng)計的中文分詞的研究[J];計算機工程與應(yīng)用;2005年07期
7 鄧攀;劉功申;;一種高效的倒排索引存儲結(jié)構(gòu)[J];計算機工程與應(yīng)用;2008年31期
8 胡長春;劉功申;;面向搜索引擎Lucene的中文分析器[J];計算機工程與應(yīng)用;2009年12期
9 徐小剛,王俊杰,于玉;全文索引的研究[J];計算機工程;2002年02期
10 曹元大,賀海軍,涂哲明,王琴;全文檢索字索引技術(shù)的研究與實現(xiàn)[J];計算機工程;2002年06期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 吳鄭紅;教學(xué)視頻的語義標(biāo)注研究[D];華東師范大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 宋琦;面向IETM的個性化檢索系統(tǒng)研究[D];西北工業(yè)大學(xué);2007年
2 張宏松;基于Lucene的web站內(nèi)英文PDF文檔全文檢索研究[D];遼寧工程技術(shù)大學(xué);2007年
3 馮斌;基于Lucene小型搜索引擎的研究與實現(xiàn)[D];武漢理工大學(xué);2008年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 余海燕,張仲義;基于單漢字索引的全文檢索系統(tǒng)的優(yōu)化研究[J];中文信息學(xué)報;2001年04期
2 孫詠波;郭紅鋒;;天文文獻全文檢索系統(tǒng)的研究與實現(xiàn)[J];天文研究與技術(shù);2007年03期
3 莫夫;;基于通用全文檢索系統(tǒng)的需求分析[J];電腦知識與技術(shù);2009年21期
4 劉成;張溯柳;范晶;;統(tǒng)一新聞全文檢索系統(tǒng)的探索與實踐[J];中國傳媒科技;2010年05期
5 李云帆;韓敏;;一個多文檔全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[J];中小企業(yè)管理與科技(下旬刊);2010年05期
6 梁苑苑;何婉文;王佳;;全文檢索系統(tǒng)在網(wǎng)站中的應(yīng)用研究[J];電腦知識與技術(shù);2012年04期
7 劉寧;漢字全文檢索系統(tǒng)的分析、設(shè)計 從湖北省地方志全文檢索系統(tǒng)的研制談系統(tǒng)功能及設(shè)計方法[J];現(xiàn)代圖書情報技術(shù);1988年02期
8 加貝;“湖北省地方志全文檢索系統(tǒng)”通過鑒定[J];圖書情報知識;1990年04期
9 陳睿,陳光祚,謝新洲;湖北省地方志全文檢索系統(tǒng)(上)[J];情報理論與實踐;1991年02期
10 趙捧來;;全文檢索系統(tǒng)的實現(xiàn)方法研究[J];西安電子科技大學(xué)學(xué)報;1992年01期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 趙慧;李春明;鮑可進;;一種基于DotLucene搜索引擎的知識庫中文全文檢索系統(tǒng)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
2 周小庭;;用Info Digger全文檢索系統(tǒng)構(gòu)建首都師大基教中心網(wǎng)上平臺[A];OA’99辦公自動化全國學(xué)術(shù)研討暨展示會論文集[C];1999年
中國重要報紙全文數(shù)據(jù)庫 前2條
1 肖詩斌;全文檢索技術(shù)的深層剖析[N];中國計算機報;2003年
2 羅懿;世紀(jì)永聯(lián)搜索引擎獲獎[N];中國企業(yè)報;2000年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 吳煒;密文全文檢索系統(tǒng)中的索引機制研究[D];華中科技大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 何勝利;礦山法律法規(guī)全文檢索系統(tǒng)的研究與應(yīng)用[D];西安建筑科技大學(xué);2005年
2 楊鎰菲;基于云存儲的分布式全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];華南理工大學(xué);2012年
3 蔡晶晶;多文檔全文檢索系統(tǒng)的設(shè)計與開發(fā)[D];電子科技大學(xué);2013年
4 王紅勝;多文檔全文檢索系統(tǒng)的設(shè)計與開發(fā)[D];電子科技大學(xué);2010年
5 劉超;專利全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2010年
6 李秦;基于用戶行為的全文檢索系統(tǒng)個性化推薦研究[D];西南大學(xué);2009年
7 席敏;基于單漢字索引的全文檢索系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學(xué);2010年
8 王磊;基于本體的語義全文檢索系統(tǒng)的研究[D];哈爾濱工程大學(xué);2013年
9 周宇;數(shù)字化法定公務(wù)文書全文檢索系統(tǒng)研究[D];鄭州大學(xué);2007年
10 方艷芬;多源文檔全文檢索系統(tǒng)設(shè)計與實現(xiàn)[D];華中師范大學(xué);2009年
,本文編號:890238
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/890238.html