大數(shù)據(jù)環(huán)境下支持概率數(shù)據(jù)范圍查詢索引的研究
發(fā)布時(shí)間:2017-11-16 07:35
本文關(guān)鍵詞:大數(shù)據(jù)環(huán)境下支持概率數(shù)據(jù)范圍查詢索引的研究
更多相關(guān)文章: 大數(shù)據(jù) 概率數(shù)據(jù) 索引 概率概要信息 多分辨率網(wǎng)格
【摘要】:隨著數(shù)據(jù)規(guī)模的不斷增長(zhǎng),大數(shù)據(jù)管理具有重要意義.在眾多數(shù)學(xué)模型中,因?yàn)楦怕誓P涂梢詫⒑A繑?shù)據(jù)抽象成少量概率數(shù)據(jù),所以它非常適合管理大數(shù)據(jù).因此,研究大數(shù)據(jù)環(huán)境下的概率數(shù)據(jù)管理具有重要意義.作為一種經(jīng)典查詢,基于概率數(shù)據(jù)的范圍查詢已被深入研究.然而,當(dāng)前研究成果不適合在大數(shù)據(jù)環(huán)境下使用.其根本原因是這些索引的更新代價(jià)較大.該文提出了索引HGD-Tree解決這一問題.首先,該文提出了一系列算法降低新增數(shù)據(jù)的處理代價(jià).它可以保證樹結(jié)構(gòu)平衡的前提下快速地執(zhí)行插入、刪除、更新等操作.其次,該文提出了一種基于劃分的方法構(gòu)建概率對(duì)象的概要信息.它可以根據(jù)概率密度函數(shù)的特點(diǎn)自適應(yīng)地執(zhí)行劃分.此外,由于作者提出的概要是基于比特向量,上述策略可以保證索引以較低空間代價(jià)管理概率數(shù)據(jù).最后,該文提出了一種基于位運(yùn)算的方法訪問HGD-Tree.它可以用少量的位運(yùn)算執(zhí)行過濾操作.大量的實(shí)驗(yàn)驗(yàn)證了算法的有效性.
【作者單位】: 東北大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家“九七三”重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃項(xiàng)目基金(2012CB316201) 國(guó)家自然科學(xué)基金(61272178,61572122,61173031,61129002,61532021,U1401256) 國(guó)家優(yōu)秀青年科學(xué)基金(61322208)資助~~
【分類號(hào)】:TP311.13
【正文快照】: 1引言 由大數(shù)據(jù)的3V模型可知,高效管理大數(shù)據(jù)面臨兩大挑戰(zhàn):(1)數(shù)據(jù)的高效存儲(chǔ);(2)事件的快速響應(yīng).例如,在環(huán)境監(jiān)測(cè)系統(tǒng)中,通常有MB規(guī)模的傳感器實(shí)時(shí)向服務(wù)器上報(bào)監(jiān)測(cè)數(shù)據(jù).假設(shè)傳感器每隔5s向服務(wù)器上報(bào)一次數(shù)據(jù),并且每條數(shù)據(jù)的凈荷只有10Byte,那么服務(wù)器每周將為這些數(shù)據(jù)分配
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 趙婷婷;趙素云;裴斌;陳紅;李翠平;;概率數(shù)據(jù)上基于規(guī)則的分類器[J];計(jì)算機(jī)科學(xué)與探索;2013年07期
,本文編號(hào):1191627
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1191627.html
最近更新
教材專著