基于HBase的海量文件的檢索方案研究
本文關(guān)鍵詞:基于HBase的海量文件的檢索方案研究,由筆耕文化傳播整理發(fā)布。
【摘要】:在互聯(lián)網(wǎng)(尤其是移動(dòng)互聯(lián)網(wǎng))、物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等高速發(fā)展的大背景下,數(shù)據(jù)呈現(xiàn)爆炸式地增長(zhǎng)。這類數(shù)據(jù)不規(guī)則的特性決定了其無(wú)法再按照傳統(tǒng)基于屬性列的方式進(jìn)行檢索,而是需要具備更加龐大的水平擴(kuò)展性。使用No SQL數(shù)據(jù)庫(kù)HBase和搜索引擎Elastic Search相結(jié)合,通過(guò)對(duì)檢索方案進(jìn)行設(shè)計(jì),對(duì)關(guān)鍵字匹配、語(yǔ)意檢索、邏輯關(guān)系等檢索策略進(jìn)行測(cè)試和分析,實(shí)現(xiàn)能夠快速、準(zhǔn)確的適用于海量數(shù)據(jù)的檢索方案。
【作者單位】: 北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室;上海欣方智能系統(tǒng)有限公司北京分公司;
【關(guān)鍵詞】: 大數(shù)據(jù) HBase Elastic Search 檢索方案
【分類號(hào)】:TP391.3
【正文快照】: 0引言在互聯(lián)網(wǎng)(尤其是移動(dòng)互聯(lián)網(wǎng))、物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等高速發(fā)展的大背景下,數(shù)據(jù)呈現(xiàn)爆炸式地增長(zhǎng)。海量小文件的應(yīng)用在生活中已越來(lái)越常見(jiàn),不僅存儲(chǔ)容量巨大,而且數(shù)據(jù)類型繁多、數(shù)據(jù)大小變化幅度大、流動(dòng)快等顯著特點(diǎn),往往能夠產(chǎn)生千萬(wàn)級(jí)、億級(jí)甚至十億、百億級(jí)的海量
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 楊淼淇;孫納新;柴華;;大數(shù)據(jù)時(shí)代教育模式的研究[J];計(jì)算機(jī)工程與科學(xué);2014年S1期
2 陳飛;;“大數(shù)據(jù)”對(duì)軍事外宣的影響探析[J];軍事記者;2014年05期
3 石岱;;大數(shù)據(jù)帶給圖書(shū)館的影響和挑戰(zhàn)[J];黑龍江教育(理論與實(shí)踐);2014年05期
4 王玉筠;;淺談大數(shù)據(jù)背景下的圖書(shū)館服務(wù)[J];合作經(jīng)濟(jì)與科技;2014年09期
5 趙偉;郭軍;;大數(shù)據(jù)——我該用怎樣的戰(zhàn)略眼光看待你[J];中國(guó)新通信;2014年12期
6 趙建偉;;大數(shù)據(jù)初探[J];科技資訊;2013年20期
7 潘海鵬;;淺談電信行業(yè)大數(shù)據(jù)的意義與應(yīng)用[J];電子世界;2014年03期
8 黃鍇;;世界杯中大數(shù)據(jù)顯大威風(fēng)[J];物聯(lián)網(wǎng)技術(shù);2014年07期
9 繆其浩;;當(dāng)情報(bào)遇到大數(shù)據(jù)——大數(shù)據(jù)熱點(diǎn)情報(bào)跟蹤的回顧與感悟[J];情報(bào)探索;2013年05期
10 桑慶兵;;大數(shù)據(jù)在高校的應(yīng)用與思考[J];南通紡織職業(yè)技術(shù)學(xué)院學(xué)報(bào);2013年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 康慶陽(yáng);;建立面向用戶的架構(gòu)推動(dòng)新聞傳播變革[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)第六次會(huì)員代表大會(huì)、2014年學(xué)術(shù)年會(huì)暨第七屆《王選新聞科學(xué)技術(shù)獎(jiǎng)》和優(yōu)秀論文獎(jiǎng)?lì)C獎(jiǎng)大會(huì)論文集(三等獎(jiǎng))[C];2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 張占軍;訂閱式云存儲(chǔ)方案設(shè)計(jì)[D];電子科技大學(xué);2014年
2 王雪皎;大數(shù)據(jù)驅(qū)動(dòng)下的數(shù)據(jù)新聞生產(chǎn)研究[D];電子科技大學(xué);2015年
3 曲娜;基于網(wǎng)絡(luò)數(shù)據(jù)的CPI典型商品采價(jià)質(zhì)量?jī)?yōu)化方案研究[D];吉林大學(xué);2016年
4 姚孟樂(lè);大數(shù)據(jù)視野下的新聞傳播變革[D];吉林大學(xué);2016年
5 崔路云;基于大數(shù)據(jù)時(shí)代背景對(duì)統(tǒng)計(jì)學(xué)教育的幾點(diǎn)思考[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年
6 李佳飛;論遺忘權(quán)[D];西南政法大學(xué);2015年
7 張曉帆;未來(lái)銀行的設(shè)計(jì)與規(guī)劃[D];河北大學(xué);2014年
本文關(guān)鍵詞:基于HBase的海量文件的檢索方案研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):460906
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/460906.html