基于BSP的SPARQL基本圖模式查詢
發(fā)布時(shí)間:2018-05-15 19:47
本文選題:語義網(wǎng) + 資源描述框架 ; 參考:《天津大學(xué)》2014年碩士論文
【摘要】:隨著語義網(wǎng)的不斷發(fā)展以及開放鏈接運(yùn)動(dòng)深入展開,發(fā)布在互聯(lián)網(wǎng)上的RDF數(shù)據(jù)不僅已達(dá)到百億級三元組規(guī)模,而且呈現(xiàn)出幾何增長的趨勢。有效的管理和查詢這些RDF數(shù)據(jù),正顯得日益重要。傳統(tǒng)的單機(jī)上針對RDF數(shù)據(jù)的SPARQL基本圖模式查詢算法,不能滿足RDF數(shù)據(jù)日益增長的需求。而基于MapReduce分布式計(jì)算模型的SPARQL基本圖模式查詢方法,不能夠充分發(fā)揮分布式計(jì)算的潛力,并行度有待提高。 針對該問題,本文提出了一種基于BSP模型的SPARQL基本圖模式算法。根據(jù)RDF數(shù)據(jù)是有向圖數(shù)據(jù)的特性以及基本圖模式的定義,把整個(gè)查詢過程分成“匹配”和“迭代”兩個(gè)階段,先匹配出每個(gè)要查詢的三元組模式,然后通過迭代讓部分解逐步逼近完全解,,最后得到查詢結(jié)果。根據(jù)本文提出的基于BSP模型的SPARQL基本圖模式算法,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)SPARQL查詢機(jī)原型。該SPARQL查詢機(jī)原型的查詢引擎部分采用BSP模型分布式計(jì)算框架——HAMA實(shí)現(xiàn)。在數(shù)據(jù)持久層,該SPARQL查詢原型機(jī)中引入了基于Cassandra數(shù)據(jù)庫存儲RDF圖數(shù)據(jù),以滿足RDF數(shù)據(jù)能夠得到有效管理和快速加載的需要。此外,還設(shè)計(jì)了針對本文提出的基于BSP模型的SPARQL基本圖模式算法的特有的緩存機(jī)制,提高查詢速度。在實(shí)驗(yàn)部分,與前人提出的基于MapReduce模型的SPARQL基本圖模式算法的查詢時(shí)間對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的基于BSP模型的SPARQL基本圖模式算法查詢效率得到提升。 總的來說,本文提出的基于BSP模型的SPARQL基本圖模式算法充分利用了BSP模型的消息機(jī)制,相對前人提出的基于MapReduce模型SPARQL基本圖模式算法,在并行度上更優(yōu)。從而可以為大規(guī)模RDF數(shù)據(jù)的快速SPARQL查詢提供支持。
[Abstract]:With the development of semantic network and the deep development of open link movement , RDF data published on the Internet has not only reached 100 billion triple - tuple scale , but also presents the trend of geometric growth .
In order to solve the problem , this paper presents an algorithm based on BSP model , which is based on BSP model . The query engine is implemented by using BSP model distributed computing framework _ HAMA .
In general , the BSP model - based model based on BSP model makes full use of the BSP model ' s message mechanism , which is superior to the MapReduce model based on the MapReduce model based on the MapReduce model .
【學(xué)位授予單位】:天津大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.41;TP393.4
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 王鑫;馮志勇;杜樸風(fēng);饒國政;姜洋;李旭;生兆花;姜龍翔;;Jingwei:一種分布式大規(guī)模RDF數(shù)據(jù)服務(wù)器[J];計(jì)算機(jī)研究與發(fā)展;2011年S3期
2 杜方;陳躍國;杜小勇;;RDF數(shù)據(jù)查詢處理技術(shù)綜述[J];軟件學(xué)報(bào);2013年06期
3 沈志宏;黎建輝;張曉林;;關(guān)聯(lián)數(shù)據(jù)互聯(lián)技術(shù)研究綜述:應(yīng)用、方法與框架[J];圖書情報(bào)工作;2013年14期
4 何少鵬;黎建輝;沈志宏;周園春;;大規(guī)模的RDF數(shù)據(jù)存儲技術(shù)綜述[J];網(wǎng)絡(luò)新媒體技術(shù);2013年01期
本文編號:1893667
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1893667.html
最近更新
教材專著