基于Lucene的倒排索引性能的研究
本文關(guān)鍵詞:基于Lucene的倒排索引性能的研究
更多相關(guān)文章: 倒排索引 搜索引擎 Lucene 性能
【摘要】:倒排索引技術(shù)是現(xiàn)代搜索引擎的核心技術(shù)之一,索引技術(shù)的好壞直接影響搜索引擎的性能。Lucene是一個優(yōu)秀的全文檢索引擎架構(gòu),采用高度優(yōu)化的倒排索引結(jié)構(gòu),可以方便的嵌入到各種應(yīng)用程序中。在深入分析和研究Lucene索引機(jī)制的基礎(chǔ)上,通過實驗發(fā)現(xiàn),與傳統(tǒng)的字符串匹配查找的性能相比,使用倒排索引的Lucene更快捷、更準(zhǔn)確的實現(xiàn)全文檢索。
【作者單位】: 貴州交通職業(yè)技術(shù)學(xué)院;
【關(guān)鍵詞】: 倒排索引 搜索引擎 Lucene 性能
【分類號】:TP391.3
【正文快照】: 隨著互聯(lián)網(wǎng)的普及以及數(shù)字信息的爆炸式增長,網(wǎng)絡(luò)信息資源數(shù)量以幾何級數(shù)倍增,面對日益產(chǎn)生的海量數(shù)據(jù),其異構(gòu)性、分布性和動態(tài)性,對信息檢索的研究不斷提出新的挑戰(zhàn)。為了在海量的數(shù)據(jù)中迅速而全面地找到所需要的信息,搜索引擎由此產(chǎn)生了。1 Lucene及相關(guān)分析1.1 Lucene概述L
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 魏刃佳;吳振強;;面向教育視頻資源的垂直搜索引擎設(shè)計與實現(xiàn)[J];計算機(jī)工程與應(yīng)用;2014年15期
2 杜若鵬;趙瑞雪;朱亮;寇遠(yuǎn)濤;鮮國建;;DSpace的檢索機(jī)制及其擴(kuò)展應(yīng)用[J];圖書情報工作;2013年S2期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 楊楠;基于用戶習(xí)慣的網(wǎng)頁排序算法研究[D];大連交通大學(xué);2013年
2 張曉偉;聚類算法及在搜索引擎系統(tǒng)中的應(yīng)用[D];哈爾濱理工大學(xué);2014年
3 王鵬;基于Lucene的中文分詞技術(shù)研究與實現(xiàn)[D];浙江工商大學(xué);2014年
4 張松峰;政府資助項目個性化推送系統(tǒng)設(shè)計與實現(xiàn)[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年
5 張陽;基于Lucene技術(shù)搜索引擎設(shè)計與實現(xiàn)[D];吉林大學(xué);2014年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王智強,劉建毅;一種實時更新索引結(jié)構(gòu)的設(shè)計與實現(xiàn)[J];計算機(jī)系統(tǒng)應(yīng)用;2005年10期
2 王宏宇;;基于Native-XML數(shù)據(jù)庫倒排索引算法研究[J];情報科學(xué);2006年07期
3 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計算機(jī)工程;2007年23期
4 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計與實現(xiàn)[J];現(xiàn)代情報;2009年07期
5 王濤;吳潔明;;搜索引擎建立倒排索引的算法研究[J];現(xiàn)代計算機(jī)(專業(yè)版);2008年01期
6 王路芳;張虎;;一種面向搜索引擎的基于集合模型的搜索算法[J];山西農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版);2009年06期
7 吐爾洪·吾司曼;維尼拉·木沙江;;維、哈、柯多語種搜索引擎中索引器的研究[J];新疆大學(xué)學(xué)報(自然科學(xué)版);2011年02期
8 余淼;楊丹;趙俊芹;;垂直搜索引擎的關(guān)鍵技術(shù)研究[J];軟件導(dǎo)刊;2007年23期
9 寧可為;;自動答疑系統(tǒng)知識庫文本的索引研究[J];電腦知識與技術(shù);2009年35期
10 寧可為;王煒;;基于倒排索引的答疑系統(tǒng)知識庫文本研究[J];湖北廣播電視大學(xué)學(xué)報;2010年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機(jī)制研究[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
2 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
3 董祥千;左志宏;劉強國;;Lucene倒排索引文件的實現(xiàn)與優(yōu)化[A];四川省通信學(xué)會2006年學(xué)術(shù)年會論文集(二)[C];2006年
4 辛欣;李涓子;;基于Java語言全文信息檢索系統(tǒng)的設(shè)計與實現(xiàn)[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國Java技術(shù)及應(yīng)用大會文集[C];2007年
5 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計與實現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
6 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實現(xiàn)[A];黑龍江省計算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年
7 李遠(yuǎn)寧;劉汀;蔣樹強;黃慶明;;基于“Bag of Words”的視頻匹配方法[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
8 李勇;陳文斌;;嵌入式平臺上的地址搜索[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
9 吐爾地·托合提;維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎中查詢處理研究與實現(xiàn)[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
10 朱虹;吳林;;DM4全文檢索機(jī)制的設(shè)計[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 清華大學(xué)計算機(jī)系智能技術(shù)與系統(tǒng)國家重點實驗室 張敏 金奕江;尋“寶”有術(shù)[N];計算機(jī)世界;2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 馮德瀛;圖像檢索技術(shù)中相似性搜索方法研究[D];上海交通大學(xué);2013年
2 吳煒;密文全文檢索系統(tǒng)中的索引機(jī)制研究[D];華中科技大學(xué);2009年
3 龍柏;并行計算平臺上的數(shù)據(jù)索引技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
4 鄺礫;基于接口和行為語義的Web服務(wù)發(fā)現(xiàn)與適配研究[D];浙江大學(xué);2009年
5 溫延龍;XML信息檢索關(guān)鍵技術(shù)研究[D];南開大學(xué);2012年
6 胥正川;基于關(guān)系數(shù)據(jù)庫的XML數(shù)據(jù)存儲、更新和檢索[D];復(fù)旦大學(xué);2003年
7 劉紅;近重復(fù)視頻檢測算法研究[D];復(fù)旦大學(xué);2012年
8 張帆;搜索引擎中索引表求交和提前停止技術(shù)優(yōu)化研究[D];南開大學(xué);2012年
9 張乃靜;基于林業(yè)科學(xué)數(shù)據(jù)的語義檢索研究[D];中國林業(yè)科學(xué)研究院;2013年
10 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉紅雨;基于倒排索引的微博話題檢測[D];哈爾濱工業(yè)大學(xué);2013年
2 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
3 代萬能;倒排索引技術(shù)在Hadoop平臺上的研究與實現(xiàn)[D];電子科技大學(xué);2013年
4 汪紅敏;基于固態(tài)硬盤的倒排索引動態(tài)更新策略及其優(yōu)化研究[D];華中科技大學(xué);2013年
5 張博;基于Lucene倒排索引性能的研究與優(yōu)化[D];昆明理工大學(xué);2013年
6 劉曉奎;基于mongodb的倒排索引建立[D];吉林大學(xué);2014年
7 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年
8 楊國營;基于MapReduce模型文本分類算法的研究[D];遼寧大學(xué);2013年
9 陳雪帆;基于固態(tài)硬盤的倒排索引構(gòu)建與維護(hù)策略研究[D];華中科技大學(xué);2012年
10 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機(jī)制研究[D];新疆農(nóng)業(yè)大學(xué);2011年
,本文編號:1000966
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1000966.html