大數(shù)據(jù)分布式全文檢索系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2017-10-19 20:50
本文關(guān)鍵詞:大數(shù)據(jù)分布式全文檢索系統(tǒng)的設(shè)計與實現(xiàn)
更多相關(guān)文章: Solr HBase 大數(shù)據(jù) 搜索 python
【摘要】:論文是基于一種開源企業(yè)搜索引擎Solr實現(xiàn)對大數(shù)據(jù)分布式數(shù)據(jù)庫HBase中數(shù)據(jù)的檢索。論文簡單地介紹了分布式存儲技術(shù)HBase和分布式索引技術(shù)SolrCloud,實現(xiàn)了基于Solr和Zookeeper的分布式搜索方式SolrCloud模式對HBase表的索引的建立。該系統(tǒng)通過python程序在對HBase中的Rowkey建立索引的同時還對每列數(shù)據(jù)都建立索引,實現(xiàn)了Hbase的二級索引,克服了HBase只能通過Rowkey單一查詢的不足。經(jīng)過反復(fù)測試,充分地表明了基于Solr的分布式搜索系統(tǒng)的高效性及高可靠性。
【作者單位】: 西安郵電大學(xué);
【關(guān)鍵詞】: Solr HBase 大數(shù)據(jù) 搜索 python
【分類號】:TP391.3
【正文快照】: 1引言隨著信息技術(shù)的飛速發(fā)展,信息化建設(shè)是我國現(xiàn)在非常重要的一項工作,而且數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務(wù)領(lǐng)域,成為重要的生產(chǎn)因素。隨著大數(shù)據(jù)時代的到來,越來越多的數(shù)據(jù)信息呈爆炸式增長,人們對于數(shù)據(jù)的挖掘和運用,也逐漸因為互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展得到人們的關(guān)注,因此
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 趙凱;王敏;;基于Solr的企業(yè)級搜索引擎的設(shè)計[J];電子世界;2013年22期
2 ;[J];;年期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 劉博文;分布式企業(yè)搜索引擎的設(shè)計與實現(xiàn)[D];浙江大學(xué);2015年
2 王小森;基于Solr的搜索引擎的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2011年
3 李雪利;基于Solr的企業(yè)搜索引擎的研究與實現(xiàn)[D];浙江理工大學(xué);2013年
4 蔡學(xué)鋒;基于Solr的搜索引擎核心技術(shù)研究與應(yīng)用[D];武漢理工大學(xué);2013年
5 李晨鳴;基于solr搜索引擎的問吧系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2012年
6 張新生;基于solr的分布式搜索引擎研究[D];華中科技大學(xué);2012年
,本文編號:1063273
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1063273.html
最近更新
教材專著