基于Lucene的索引文件深入研究
本文關(guān)鍵詞:基于Lucene的索引文件深入研究
【摘要】:索引是搜索引擎的核心概念,優(yōu)化索引提高使用效率是當(dāng)前主要研究內(nèi)容。文中研究了Lucene索引文件的內(nèi)部結(jié)構(gòu),包括Lucene索引文件格式、文件組成、索引創(chuàng)建過程,并重點(diǎn)研究了段Segment文件的存儲結(jié)構(gòu)。經(jīng)研究表明,創(chuàng)建單一且重用的文檔實(shí)例以及提高使用的內(nèi)存大小可有效提高索引使用效率。
【作者單位】: 江蘇聯(lián)合職業(yè)技術(shù)學(xué)院徐州財(cái)經(jīng)分院;
【分類號】:TP391.3
【正文快照】: 1引言(Introduction)在Lucence中包括了幾個(gè)基礎(chǔ)的概念,分別是索引、段、文檔、域和項(xiàng)。其中索引由段構(gòu)成,段由文檔構(gòu)成,因此索引可以理解為包含了多個(gè)文檔的序列。文檔由域構(gòu)成,域由項(xiàng)構(gòu)成,項(xiàng)是索引中最小構(gòu)成單位,其本質(zhì)是一個(gè)字符串。段是索引數(shù)據(jù)存儲的基本單元,多個(gè)段之
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 王冬;左萬利;赫楓齡;彭濤;張長利;;一種增量倒排索引結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2007年06期
2 李曉麗;杜振龍;;基于Lucence的個(gè)性化搜索引擎研究[J];計(jì)算機(jī)工程;2010年19期
3 黃軼文;;搜索引擎原理與快速開發(fā)應(yīng)用[J];科技信息;2010年36期
4 何偉;薛素靜;孔夢榮;楊正黨;;基于Lucene的全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];情報(bào)雜志;2006年09期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 周珍娟;張字平;陸玲;;基于Lucene2.0的電子文獻(xiàn)全文檢索系統(tǒng)[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年23期
2 吳佩韋;李昌華;;一種基于Lucene的搜索推薦詞生成方法[J];電腦知識與技術(shù);2009年10期
3 李文;洪親;滕忠堅(jiān);石兆英;;一種由B+樹實(shí)現(xiàn)的倒排索引[J];電腦知識與技術(shù);2011年08期
4 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的結(jié)構(gòu)機(jī)制與應(yīng)用方式[J];廣西科學(xué)院學(xué)報(bào);2010年04期
5 王文超;亢煥楠;;基于安卓系統(tǒng)的桌面搜索引擎的設(shè)計(jì)研究[J];電子技術(shù)與軟件工程;2014年16期
6 胡宏偉;虞萍;周南;喬軍;;基于Lucene的文獻(xiàn)資料全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2014年11期
7 吳代文;;Lucene文本分析器的改進(jìn)[J];信息技術(shù);2011年10期
8 孫虞祿;萬e,
本文編號:1246982
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1246982.html