基于Lucene的電子公文檢索系統(tǒng)的研究與實現(xiàn)50
本文關鍵詞:Lucene全文檢索在網(wǎng)絡教學平臺中的應用研究,由筆耕文化傳播整理發(fā)布。
結(jié)論;本文工作成果;本文在深入研究全文檢索系統(tǒng)和全面剖析Lucene;第一,支持電子公文中各種格式文檔的全文檢索;第二,支持中英文的全文檢索系統(tǒng);第三,采用自動索引和手工索引兩種方法來對索引進行;第四,對Lucene的結(jié)果排序算法進行改進,改進;第五,采用Java語言和SSH框架技術來進行系統(tǒng);由于時間和技術水平有限,本文的電子公文檢索系統(tǒng)還;第一,本系統(tǒng)缺
結(jié) 論
本文工作成果
本文在深入研究全文檢索系統(tǒng)和全面剖析Lucene相關技術的基礎上,設計并實現(xiàn)了基于Lucene的電子公文檢索系統(tǒng)。該系統(tǒng)在實驗環(huán)境中己經(jīng)能夠穩(wěn)定、高效地運行,達到了預期的目標。在開發(fā)該系統(tǒng)的過程中,取得的成果可以歸結(jié)為以下幾點:
第一,支持電子公文中各種格式文檔的全文檢索?梢詫ext、PDF、Word、Excel等文檔進行文本抽取,把它們轉(zhuǎn)化為索引的固定格式,以方便全文檢索系統(tǒng)對其內(nèi)容進行索引和存儲,從而彌補Lucene內(nèi)核只能處理純文本文檔的不足。
第二,支持中英文的全文檢索系統(tǒng)。在中文分詞方面,本文采用了基于詞典的正向最大匹配算法。比起Lucene內(nèi)核包的單字切分方式和 Lucene擴展包的二元切分方式,本文設計并實現(xiàn)的切分詞方法效率更高、性能更好。
第三,采用自動索引和手工索引兩種方法來對索引進行實時更新,使得索引更新變得更加靈活。
第四,對Lucene的結(jié)果排序算法進行改進,改進后的結(jié)果排序算法能夠?qū)⒂脩羲P心的信息結(jié)果返回到頁面的最前端,從而更加滿足用戶的需求。
第五,采用Java語言和SSH框架技術來進行系統(tǒng)的開發(fā),該系統(tǒng)具有良好的可移植性和擴展性,并可以使得整個系統(tǒng)徑渭分明,修改界面和數(shù)據(jù)表示更加靈活。 工作展望
由于時間和技術水平有限,本文的電子公文檢索系統(tǒng)還有許多不足的地方,這些不足也幫助了系統(tǒng)的不斷完善,使之走向成熟與穩(wěn)定。因此,在以下幾個方面,還需要進行繼續(xù)深入的研究,以提高整個系統(tǒng)的性能。
第一,本系統(tǒng)缺乏語義處理能力,存在信息的誤檢、漏檢等缺陷,用戶不能根據(jù)語義分析來找到與需求相關的信息。所以如何實現(xiàn)信息資源的語義檢索來提高檢索精度,是將要研究的問題。
第二,,本文探討的系統(tǒng)是基于單服務器的全文檢索系統(tǒng),對于數(shù)據(jù)量和訪問量很大的系統(tǒng),就需要采用分布式處理策略,才能擴展全文檢索的性能。如何將分布式處理應用到全文檢索系統(tǒng)中將有待探討。
參考文獻
[1] 郭艷陽.基于本體論及Lucene的電子公文檢索系統(tǒng)[D].江西財經(jīng)大學碩士學 位論文.2006.1-2 22-23
[2] George Samaras,Odysseas Papapetrou.Distributed Location Aware Web Crawling.
In Proceedings of the 13th international World Wide Web conference[J].NewYork,
USA:ACM Press,2004:468-469
[3] 施曉華,黃冀.信息檢索新技術.中國信息導報[J].2005(3):64-66
[4] 張校乾.基于Lucene的全文檢索系統(tǒng)的研究與應用[D].大連理工大學碩士學位論
文.2005.5-6 8-12
[5] 周平.Lucene全文檢索引擎技術及應用.重慶工學院學報(自然科學版)[J]. 2007,21(4):86-88
[6] 陳寧.基于Lucene全文檢索在網(wǎng)絡教學平臺中的應用研究[D].大連海事大學
碩士學位論文.2007.1-2 10-11
[7] 賴茂生等.計算機情報檢索[M].北京:北京大學出版社.2006.3-4
[8] 方志,夏立新,劉啟強.中外全文檢索研究的現(xiàn)狀及趨勢[J].圖書情報知識.
2006,9:71-75
[9] Erik Hatcher.Lucene in Action [M].USA:Manning Publication.2004.7-8
[10] 黃杰.基于Lucene的全文檢索系統(tǒng)模型的研究[D].暨南大學碩士學位論文. 2007.6-7
[11] Charles T,Meadow.Text Information Retrieval Systems 2nd edition[M].
San Diego:Academic Press,2000.10-11
[12] 陳慧萍,于國政,王建東.全文索引技術在辦公自動化系統(tǒng)中的應用研究.計 算機應用研究[J].2007(1):222-224
[13] 張校乾,金玉玲,侯麗波.一種基于Lucene檢索引擎的全文數(shù)據(jù)庫的研究與實 現(xiàn)[J].現(xiàn)代圖書情報技術.2005(2):111-113
[14] 陳魁.智能搜索引擎系統(tǒng)的分析設計與開發(fā)[D].大連理工大學碩士學位論文.
2004.6-7
[15] callan.Lucene倒排索引原理.
[16] IBM Devloper Works. Parsing, Indexing, and Searching XML with Digester and Lucene .2003.
[17] Linwood J. Give Your Web Site Search Engine Using Lucene.
builder.com.2003
[18] 車東.基于Java的全文索引引擎Lucene簡介. tech/lucene.html.2003
[19] 陸云.對基于Java的全文檢索工具包lucene的索引研究.電腦學習.2007(2): 45-46
[20] 宋佳,諸云強,劉潤達.一種基于Lucene 改進的全文檢索工具包.計算機工程 與應用[J].2008, 44(4):172-175
[21] Apache Software Foundation:Lucene Syntax, /lucene/docs
[22] 王莉云,王華,陳剛,姚乃明.基于Lucene的全文檢索系統(tǒng)的設計與實現(xiàn)[J].計 算機工程與設計.2007, 28(24):5959-5961
[23] 張宏松.基于Lucene的web站內(nèi)英文PDF文檔全文檢索研究[D].遼寧工程技 術大學碩士學位論文.2007.2-3 10-11
[24] 曹強.基Lucene的Web站點站內(nèi)全文檢索系統(tǒng)的設計與實現(xiàn)[J].圖書情報工 作.2007,51(9):124-126
[25] 吳海明.基于Lucene的搜索引擎技術的研究與改進[D].暨南大學碩士學位論 文.2006.10-11
[26]
[27] 溫艷鴻.基于Lucene的文件搜索引擎的設計與擴展[J].福建電腦.2007(8): 125-126
[28] Xue,N.Chinese Word Segmentation as Character Tagging[J].Computational and Chinese Language Processing .2003,8(1):29-48
[29] Winter.中文搜索引擎技術揭密:中文分詞. twiki/bin/view.pl/Main/SESegment
[30] 邱哲,符滔滔.開發(fā)自己的搜索引擎Lucene2.0+Heritrix[M].北京:人民郵電 出版社.2007.220-254
[31] 王楊.基于SSH框架的代碼生成工具的設計與實現(xiàn)[D].沈陽理工大學碩士學 位論文.2008.31-33
[32] 于玉海.基于MVC模式的Struts框架在社會保險管理系統(tǒng)中的應用[D].東北 師范大學碩士學位論文.2005.12-13
[33] Craig Walls,Ryan Breidenbach.Spring in Action中文版[M].北京:人民郵電出 版社.2006.85-86
[34] 陳天河.Hibernate項目開發(fā)寶典[M].北京:電子工業(yè)出版社.2006.69-70
下載地址:基于Lucene的電子公文檢索系統(tǒng)的研究與實現(xiàn)50.Doc
【】最新搜索
基于Lucene的電子公文檢索系統(tǒng)的研究與實現(xiàn)
oracle通訊錄
IA模塊《外國小說欣賞》單元知識復習摘要
2016年南中村防汛抗旱應急預案
公司項目付款審批表
西安外國語大學2010年翻譯碩士考研真題及答案
小學美術4.10號(簡答題)
2012年六一兒童節(jié)活動致辭
最新外研版八年級英語上冊Module 3 Sports Un
【英語】Unit 1《Section Two Reading
本文關鍵詞:Lucene全文檢索在網(wǎng)絡教學平臺中的應用研究,由筆耕文化傳播整理發(fā)布。
本文編號:133161
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/133161.html