基于Lucene的Web站點(diǎn)站內(nèi)全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2018-01-29 04:13
本文關(guān)鍵詞: Lucene 全文檢索 搜索引擎 出處:《圖書(shū)情報(bào)工作》2007年09期 論文類型:期刊論文
【摘要】:設(shè)計(jì)一個(gè)基于開(kāi)源檢索工具包Lucene的Web站點(diǎn)站內(nèi)全文檢索系統(tǒng),詳述系統(tǒng)的設(shè)計(jì)思路與體系架構(gòu),并對(duì)中英文分詞和添加文檔索引等關(guān)鍵技術(shù)給出具體代碼和實(shí)現(xiàn)步驟;最后對(duì)該系統(tǒng)進(jìn)行簡(jiǎn)單的性能測(cè)試并與通用搜索引擎的檢索結(jié)果進(jìn)行查全率和查準(zhǔn)率方面的比較。
[Abstract]:This paper designs a full-text retrieval system in Web site based on open source search toolkit (Lucene), and details the design idea and architecture of the system. The key technologies of Chinese and English word segmentation and document indexing are given. Finally, a simple performance test is carried out and compared with the retrieval results of the general search engine in terms of recall and precision.
【作者單位】: 南京大學(xué)中美文化研究中心圖書(shū)館
【分類號(hào)】:TP391.3;TP393.092
【正文快照】: 1引言對(duì)fw亡b站點(diǎn)來(lái)說(shuō),,一個(gè)優(yōu)秀的站內(nèi)全文檢索系統(tǒng)是不可或缺的。通常有兩種方法:①使用通用的桌面搜索引擎如Google等提供的站內(nèi)搜索功能來(lái)檢索站點(diǎn)內(nèi)部數(shù)據(jù);②開(kāi)發(fā)自己專川的站內(nèi)全文檢索系統(tǒng)。由于通用搜索引擎的索引更新較慢目.針對(duì)性不強(qiáng),因而第一種方法的檢索結(jié)果有
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 陳士杰,張sソ
本文編號(hào):1472488
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1472488.html
最近更新
教材專著