基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲
【圖文】:
錄?個方面:(1)RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射;(2)圖數(shù)據(jù)庫分布式存儲擴(kuò)展,本文采用Neo4j圖形數(shù)據(jù)庫,并設(shè)計了一個邏輯處理層,以支持分布式存儲;(3)從圖模型視角對RDF數(shù)據(jù)集進(jìn)行分割,本文采用文獻(xiàn)[14]提出的針對大圖數(shù)據(jù)流的分割算法,用于對RDF圖數(shù)據(jù)流的分割;(4)提供SPARQL查詢接口,CYPHER是Neo4j圖形數(shù)據(jù)庫支持的一個數(shù)據(jù)查詢語言,本文將討論SPARQL查詢語言到CYPHER查詢語言的轉(zhuǎn)換。2基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案2.1系統(tǒng)總體架構(gòu)本文提出的基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)如圖1所示。圖1基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)2.2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射RDF數(shù)據(jù)集由很多RDF語句組成,每條RDF語句是一個三元組<主體,屬性,客體>,其中主體是被描述的資源,客體表示主體在屬性上的取值,可以是另外一個資源或者是文本。若從圖數(shù)據(jù)模型視角看,主體、客體對應(yīng)圖中的頂點(diǎn),屬性對應(yīng)圖中的一條有向邊,一條RDF語句對應(yīng)于圖中的兩個頂點(diǎn)、從主體頂點(diǎn)指向客體頂點(diǎn)的一條有向邊。映射關(guān)系如圖2所示。圖2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射2.3分布式存儲為支持分布式存儲,存儲層各個RDF數(shù)據(jù)存儲節(jié)點(diǎn)相互獨(dú)立,在其之上增加一層邏輯處理層,往系統(tǒng)存入RDF數(shù)據(jù)時,記錄這個RDF數(shù)據(jù)的存儲位置;查詢RDF數(shù)據(jù)時,先獲取所查RDF數(shù)據(jù)可能的存儲位置,然后到對應(yīng)的存儲節(jié)點(diǎn)上進(jìn)行查詢。系統(tǒng)需要存儲兩類數(shù)據(jù),一類是元數(shù)據(jù),主要為RDF數(shù)據(jù)的存儲位置信息,本文用Redis[15]數(shù)據(jù)庫,這是Key-Value型內(nèi)存數(shù)據(jù)庫,讀取速度快,且支持持久化,存儲時以資源ID、屬性ID作為Key,存儲位置作為Value。另一類是RDF數(shù)據(jù),本文用Neo4j圖形數(shù)據(jù)庫,存入一條RDF語句將往圖數(shù)據(jù)庫中插?
儲方案2.1系統(tǒng)總體架構(gòu)本文提出的基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)如圖1所示。圖1基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)2.2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射RDF數(shù)據(jù)集由很多RDF語句組成,每條RDF語句是一個三元組<主體,屬性,客體>,,其中主體是被描述的資源,客體表示主體在屬性上的取值,可以是另外一個資源或者是文本。若從圖數(shù)據(jù)模型視角看,主體、客體對應(yīng)圖中的頂點(diǎn),屬性對應(yīng)圖中的一條有向邊,一條RDF語句對應(yīng)于圖中的兩個頂點(diǎn)、從主體頂點(diǎn)指向客體頂點(diǎn)的一條有向邊。映射關(guān)系如圖2所示。圖2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射2.3分布式存儲為支持分布式存儲,存儲層各個RDF數(shù)據(jù)存儲節(jié)點(diǎn)相互獨(dú)立,在其之上增加一層邏輯處理層,往系統(tǒng)存入RDF數(shù)據(jù)時,記錄這個RDF數(shù)據(jù)的存儲位置;查詢RDF數(shù)據(jù)時,先獲取所查RDF數(shù)據(jù)可能的存儲位置,然后到對應(yīng)的存儲節(jié)點(diǎn)上進(jìn)行查詢。系統(tǒng)需要存儲兩類數(shù)據(jù),一類是元數(shù)據(jù),主要為RDF數(shù)據(jù)的存儲位置信息,本文用Redis[15]數(shù)據(jù)庫,這是Key-Value型內(nèi)存數(shù)據(jù)庫,讀取速度快,且支持持久化,存儲時以資源ID、屬性ID作為Key,存儲位置作為Value。另一類是RDF數(shù)據(jù),本文用Neo4j圖形數(shù)據(jù)庫,存入一條RDF語句將往圖數(shù)據(jù)庫中插入兩個頂點(diǎn)及兩頂點(diǎn)之間的一條邊,并以資源ID、屬性ID分別對頂點(diǎn)、邊建立索引,查詢時利用索引可直接定位到某個頂點(diǎn)或邊。2.4邏輯處理層2.4.1分區(qū)管理RDF數(shù)據(jù)模型是一個圖模型,本文從圖模型視角對RDF數(shù)據(jù)進(jìn)行分割,決策RDF數(shù)據(jù)的存儲位置,劃分的準(zhǔn)則是盡量將關(guān)聯(lián)比較緊密的頂點(diǎn)劃到同一個分區(qū),因為當(dāng)在RDF數(shù)據(jù)集上做推理查詢時會涉及到遍歷操作,而關(guān)聯(lián)比較緊密的頂點(diǎn)在遍歷路徑上的概率比較大,這樣可減少跨存儲節(jié)點(diǎn)之
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王征;劉心松;李美安;;企業(yè)信息分布式存儲的熱點(diǎn)處理策略[J];計算機(jī)集成制造系統(tǒng);2006年09期
2 李磊;沈海斌;黃凱;嚴(yán)曉浪;Han Sangil;Ahmed A Jerraya;;分布式存儲管理在多核設(shè)計中的高層建模[J];電子與信息學(xué)報;2008年11期
3 劉翔;汪海玲;;分布式存儲中的一種數(shù)據(jù)放置策略[J];計算機(jī)與數(shù)字工程;2009年05期
4 陳衛(wèi)衛(wèi);吳海佳;胥光輝;;分布式存儲中文件分割的最優(yōu)化模型[J];解放軍理工大學(xué)學(xué)報(自然科學(xué)版);2010年04期
5 崔忠強(qiáng);左德承;張展;;在云間可重構(gòu)的分布式存儲[J];系統(tǒng)工程理論與實踐;2011年S2期
6 郝杰;逯彥博;劉鑫吉;夏樹濤;;分布式存儲中的再生碼綜述[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2013年01期
7 唐京偉;;基于云計算的分布式存儲技術(shù)[J];中國傳媒科技;2013年15期
8 郭棟;王偉;曾國蓀;;基于一致性樹分布的數(shù)據(jù)分布式存儲方法[J];計算機(jī)應(yīng)用;2013年12期
9 蘇李亮;王云福;侯斌;;海量設(shè)計文檔分布式存儲及負(fù)載均衡的研究與實現(xiàn)[J];電信科學(xué);2013年12期
10 謝然;;敢問存儲之路在何方?見分布式存儲搖曳在數(shù)據(jù)枝頭[J];互聯(lián)網(wǎng)周刊;2014年02期
相關(guān)會議論文 前7條
1 蘇李亮;王云福;侯斌;;海量設(shè)計文檔分布式存儲及負(fù)載均衡的研究與實現(xiàn)[A];2013電力行業(yè)信息化年會論文集[C];2013年
2 蘇李亮;王云福;侯斌;;海量設(shè)計文檔分布式存儲及負(fù)載均衡的研究與實現(xiàn)[A];2013電力行業(yè)信息化年會論文集[C];2013年
3 鄭文武;李先緒;黃植勤;邱紅飛;;云存儲關(guān)鍵技術(shù)[A];2012全國無線及移動通信學(xué)術(shù)大會論文集(下)[C];2012年
4 蔣軼林;郭淑琴;;分布式存儲在數(shù)字集群移動通信系統(tǒng)中的應(yīng)用[A];浙江省電子學(xué)會2013學(xué)術(shù)年會論文集[C];2013年
5 姜繼忱;陳鋼;;P2P之路——締造“分布式對等”的Internet3.0[A];全面建設(shè)小康社會:中國科技工作者的歷史責(zé)任——中國科協(xié)2003年學(xué)術(shù)年會論文集(下)[C];2003年
6 付偉;肖儂;盧錫城;;QoS感知的副本放置問題研究綜述[A];第15屆全國信息存儲技術(shù)學(xué)術(shù)會議論文集[C];2008年
7 張彥;劉欣然;徐慧彬;;一種基于虛擬計算環(huán)境的分布式存儲體系結(jié)構(gòu)[A];2009全國計算機(jī)網(wǎng)絡(luò)與通信學(xué)術(shù)會議論文集[C];2009年
相關(guān)重要報紙文章 前8條
1 京東架構(gòu)委員會主任 云平臺首席架構(gòu)師 系統(tǒng)技術(shù)部負(fù)責(zé)人 劉海鋒;京東:分布式存儲體系成為業(yè)務(wù)基石[N];中國信息化周報;2014年
2 《網(wǎng)絡(luò)世界》記者 于翔;京東分布式存儲體系研發(fā)歷程[N];網(wǎng)絡(luò)世界;2014年
3 《網(wǎng)絡(luò)世界》記者 于翔;融合一體機(jī)投入大規(guī)模商用[N];網(wǎng)絡(luò)世界;2013年
4 記者 余榮華;大數(shù)據(jù),催生大變革[N];人民日報;2014年
5 本報記者 張佳星;新生產(chǎn)業(yè)布局如何“云”中索驥[N];科技日報;2014年
6 本報記者 甘露;物聯(lián)網(wǎng)讓管理更美妙[N];計算機(jī)世界;2013年
7 本報記者 郭濤;華為幫用戶定制HANA一體機(jī)[N];中國計算機(jī)報;2013年
8 臨江;手機(jī)瀏覽器,3G時代的采礦機(jī)?[N];人民郵電;2009年
相關(guān)博士學(xué)位論文 前8條
1 胡q
本文編號:2586672
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2586672.html