基于HBase的RDF數(shù)據(jù)存儲方案研究與設(shè)計
發(fā)布時間:2017-11-09 00:04
本文關(guān)鍵詞:基于HBase的RDF數(shù)據(jù)存儲方案研究與設(shè)計
更多相關(guān)文章: 語義網(wǎng) RDF數(shù)據(jù) HBase MapReduce HFile文件
【摘要】:針對RDF數(shù)據(jù)的存儲問題,文章提出一種利用分布式數(shù)據(jù)庫HBase以及設(shè)計數(shù)據(jù)庫的Rowkey進(jìn)行有效存儲的方案,主要利用HBase與RDF數(shù)據(jù)的特點,使用經(jīng)典的BKDRHash算法對謂詞進(jìn)行散列計算,將散列值與謂詞作為主鍵,實現(xiàn)數(shù)據(jù)的存儲。有效設(shè)置HBase的Rowkey不僅避免出現(xiàn)節(jié)點堆積現(xiàn)象,BKDRHash算法的使用也保證了數(shù)據(jù)的完整性。為證明該存儲模式的有效性,文章實驗選擇利用Map Reduce將數(shù)據(jù)生成HBase內(nèi)部存儲格式HFile文件進(jìn)行并行加載。實驗證明,針對這樣的存儲模式,當(dāng)數(shù)據(jù)量很大時數(shù)據(jù)加載性能較好。使用LUBM測試集進(jìn)行仿真實驗,證明該方案是有效的。
【作者單位】: 貴州大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;貴州大學(xué)大數(shù)據(jù)與信息工程學(xué)院;
【基金】:黔科合JZ字[2014]2001
【分類號】:TP333;TP311.13
【正文快照】: 絡(luò)安全,2016(3):59-63.0引言RDF(Resource Description Framework)是W3C提出的一個資源描述框架,通過對網(wǎng)絡(luò)資源進(jìn)行一定程度的語義描述,為計算機(jī)能夠模擬大腦理解語義信息提供可能。而隨著LOD(Linking Open Data)等項目的展開[1],大量的RDF數(shù)據(jù)發(fā)布,互聯(lián)網(wǎng)中包含的RDF數(shù)據(jù)已,
本文編號:1159399
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1159399.html
最近更新
教材專著