基于Lucene的倒排索引性能的研究
本文關(guān)鍵詞:基于Lucene的倒排索引性能的研究
更多相關(guān)文章: 倒排索引 搜索引擎 Lucene 性能
【摘要】:倒排索引技術(shù)是現(xiàn)代搜索引擎的核心技術(shù)之一,索引技術(shù)的好壞直接影響搜索引擎的性能。Lucene是一個(gè)優(yōu)秀的全文檢索引擎架構(gòu),采用高度優(yōu)化的倒排索引結(jié)構(gòu),可以方便的嵌入到各種應(yīng)用程序中。在深入分析和研究Lucene索引機(jī)制的基礎(chǔ)上,通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),與傳統(tǒng)的字符串匹配查找的性能相比,使用倒排索引的Lucene更快捷、更準(zhǔn)確的實(shí)現(xiàn)全文檢索。
【作者單位】: 貴州交通職業(yè)技術(shù)學(xué)院;
【關(guān)鍵詞】: 倒排索引 搜索引擎 Lucene 性能
【分類(lèi)號(hào)】:TP391.3
【正文快照】: 隨著互聯(lián)網(wǎng)的普及以及數(shù)字信息的爆炸式增長(zhǎng),網(wǎng)絡(luò)信息資源數(shù)量以幾何級(jí)數(shù)倍增,面對(duì)日益產(chǎn)生的海量數(shù)據(jù),其異構(gòu)性、分布性和動(dòng)態(tài)性,對(duì)信息檢索的研究不斷提出新的挑戰(zhàn)。為了在海量的數(shù)據(jù)中迅速而全面地找到所需要的信息,搜索引擎由此產(chǎn)生了。1 Lucene及相關(guān)分析1.1 Lucene概述L
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 魏刃佳;吳振強(qiáng);;面向教育視頻資源的垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2014年15期
2 杜若鵬;趙瑞雪;朱亮;寇遠(yuǎn)濤;鮮國(guó)建;;DSpace的檢索機(jī)制及其擴(kuò)展應(yīng)用[J];圖書(shū)情報(bào)工作;2013年S2期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 楊楠;基于用戶習(xí)慣的網(wǎng)頁(yè)排序算法研究[D];大連交通大學(xué);2013年
2 張曉偉;聚類(lèi)算法及在搜索引擎系統(tǒng)中的應(yīng)用[D];哈爾濱理工大學(xué);2014年
3 王鵬;基于Lucene的中文分詞技術(shù)研究與實(shí)現(xiàn)[D];浙江工商大學(xué);2014年
4 張松峰;政府資助項(xiàng)目個(gè)性化推送系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年
5 張陽(yáng);基于Lucene技術(shù)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2014年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王智強(qiáng),劉建毅;一種實(shí)時(shí)更新索引結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2005年10期
2 王宏宇;;基于Native-XML數(shù)據(jù)庫(kù)倒排索引算法研究[J];情報(bào)科學(xué);2006年07期
3 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計(jì)算機(jī)工程;2007年23期
4 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代情報(bào);2009年07期
5 王濤;吳潔明;;搜索引擎建立倒排索引的算法研究[J];現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版);2008年01期
6 王路芳;張虎;;一種面向搜索引擎的基于集合模型的搜索算法[J];山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期
7 吐?tīng)柡椤の崴韭?維尼拉·木沙江;;維、哈、柯多語(yǔ)種搜索引擎中索引器的研究[J];新疆大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期
8 余淼;楊丹;趙俊芹;;垂直搜索引擎的關(guān)鍵技術(shù)研究[J];軟件導(dǎo)刊;2007年23期
9 寧可為;;自動(dòng)答疑系統(tǒng)知識(shí)庫(kù)文本的索引研究[J];電腦知識(shí)與技術(shù);2009年35期
10 寧可為;王煒;;基于倒排索引的答疑系統(tǒng)知識(shí)庫(kù)文本研究[J];湖北廣播電視大學(xué)學(xué)報(bào);2010年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機(jī)制研究[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
2 李棟;史曉東;;對(duì)搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
3 董祥千;左志宏;劉強(qiáng)國(guó);;Lucene倒排索引文件的實(shí)現(xiàn)與優(yōu)化[A];四川省通信學(xué)會(huì)2006年學(xué)術(shù)年會(huì)論文集(二)[C];2006年
4 辛欣;李涓子;;基于Java語(yǔ)言全文信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國(guó)Java技術(shù)及應(yīng)用大會(huì)文集[C];2007年
5 維尼拉·木沙江;吳俊森;吐?tīng)柛ひ啦祭?;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
6 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年
7 李遠(yuǎn)寧;劉汀;蔣樹(shù)強(qiáng);黃慶明;;基于“Bag of Words”的視頻匹配方法[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
8 李勇;陳文斌;;嵌入式平臺(tái)上的地址搜索[A];中國(guó)地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年
9 吐?tīng)柕亍ね泻咸?維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎中查詢處理研究與實(shí)現(xiàn)[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 朱虹;吳林;;DM4全文檢索機(jī)制的設(shè)計(jì)[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 清華大學(xué)計(jì)算機(jī)系智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室 張敏 金奕江;尋“寶”有術(shù)[N];計(jì)算機(jī)世界;2003年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 馮德瀛;圖像檢索技術(shù)中相似性搜索方法研究[D];上海交通大學(xué);2013年
2 吳煒;密文全文檢索系統(tǒng)中的索引機(jī)制研究[D];華中科技大學(xué);2009年
3 龍柏;并行計(jì)算平臺(tái)上的數(shù)據(jù)索引技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
4 鄺礫;基于接口和行為語(yǔ)義的Web服務(wù)發(fā)現(xiàn)與適配研究[D];浙江大學(xué);2009年
5 溫延龍;XML信息檢索關(guān)鍵技術(shù)研究[D];南開(kāi)大學(xué);2012年
6 胥正川;基于關(guān)系數(shù)據(jù)庫(kù)的XML數(shù)據(jù)存儲(chǔ)、更新和檢索[D];復(fù)旦大學(xué);2003年
7 劉紅;近重復(fù)視頻檢測(cè)算法研究[D];復(fù)旦大學(xué);2012年
8 張帆;搜索引擎中索引表求交和提前停止技術(shù)優(yōu)化研究[D];南開(kāi)大學(xué);2012年
9 張乃靜;基于林業(yè)科學(xué)數(shù)據(jù)的語(yǔ)義檢索研究[D];中國(guó)林業(yè)科學(xué)研究院;2013年
10 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉紅雨;基于倒排索引的微博話題檢測(cè)[D];哈爾濱工業(yè)大學(xué);2013年
2 董長(zhǎng)春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
3 代萬(wàn)能;倒排索引技術(shù)在Hadoop平臺(tái)上的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2013年
4 汪紅敏;基于固態(tài)硬盤(pán)的倒排索引動(dòng)態(tài)更新策略及其優(yōu)化研究[D];華中科技大學(xué);2013年
5 張博;基于Lucene倒排索引性能的研究與優(yōu)化[D];昆明理工大學(xué);2013年
6 劉曉奎;基于mongodb的倒排索引建立[D];吉林大學(xué);2014年
7 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年
8 楊國(guó)營(yíng);基于MapReduce模型文本分類(lèi)算法的研究[D];遼寧大學(xué);2013年
9 陳雪帆;基于固態(tài)硬盤(pán)的倒排索引構(gòu)建與維護(hù)策略研究[D];華中科技大學(xué);2012年
10 薛煜陽(yáng);農(nóng)業(yè)搜索引擎倒排索引緩沖機(jī)制研究[D];新疆農(nóng)業(yè)大學(xué);2011年
,本文編號(hào):1000966
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1000966.html