海量RDF數(shù)據(jù)的分布式存儲研究
發(fā)布時間:2020-04-25 08:48
【摘要】: 隨著Web數(shù)據(jù)和各種網(wǎng)絡資源劇增以及語義網(wǎng)的興起與發(fā)展,海量RDF(Resource Description Framework,資源描述框架)數(shù)據(jù)存儲已成為當前Web數(shù)據(jù)存儲領(lǐng)域的研究熱點。作者在深入學習和研究了當前流行的若干分布式存儲框架后,提出了海量RDF數(shù)據(jù)分布式存儲的一種解決方案,并在linux集群上實現(xiàn)了高效、協(xié)作地海量RDF數(shù)據(jù)存儲。 首先,作者在深入對比分析了若干種分布式存儲框架之后,結(jié)合本項目的特點,選定了開源存儲框架Hbase (Hadoop DataBase, Hadoop數(shù)據(jù)庫),實現(xiàn)了把海量稀疏的RDF數(shù)據(jù)集中存儲在一個Hbase表中,這樣不僅解決了傳統(tǒng)關(guān)系數(shù)據(jù)庫的低效率聯(lián)合查詢問題,并且我們還可以在分布式平臺上使用MapReduce并行算法加快處理速度。 其次,論文剖析了開源框架Hadoop分布式數(shù)據(jù)平臺以及語義網(wǎng)基礎(chǔ)框架Jena,并依托于此框架完成RDF/XML文檔的解析和RDF模型的創(chuàng)建、以及一些模型的語義分析,作者幾乎重寫了Jena所有存儲方面的底層代碼,使得把數(shù)據(jù)的存儲遷移到分布式平臺,還重寫了Jena模型解析和查詢的部分代碼,使其能充分發(fā)揮分布式處理的強大作用。加快查詢效率和處理速度,這也為快速發(fā)展語義網(wǎng)奠定了基礎(chǔ)。 最后作者總結(jié)了整個項目的研究結(jié)果,結(jié)合自己的研究方向,提出了將來的研究目標和展望。
【學位授予單位】:西安建筑科技大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:TP333
本文編號:2640040
【學位授予單位】:西安建筑科技大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:TP333
【引證文獻】
相關(guān)碩士學位論文 前3條
1 程西;數(shù)字油田中非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)的設計與實現(xiàn)[D];西北大學;2011年
2 劉燕;基于Map/Reduce框架的分布式日志分析系統(tǒng)的研究及應用[D];東北師范大學;2011年
3 郭志恒;云計算環(huán)境下GML空間數(shù)據(jù)存儲索引機制研究[D];江西理工大學;2012年
,本文編號:2640040
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2640040.html
最近更新
教材專著