RDF數(shù)據(jù)在線更新處理系統(tǒng)研究
本文關(guān)鍵詞:RDF數(shù)據(jù)在線更新處理系統(tǒng)研究
更多相關(guān)文章: 批量更新 在線更新 事務(wù)處理 事務(wù)調(diào)度
【摘要】:由于具有靈活方便的特點,RDF(Resource Description Framework)在多個領(lǐng)域中得到普遍應(yīng)用,其數(shù)據(jù)量也在飛速增加。正是由于RDF數(shù)據(jù)在變化,許多應(yīng)用都需要對RDF數(shù)據(jù)進行靈活的更新。為此,RDF數(shù)據(jù)查詢語句SPARQL(SPARQLProtocol and RDF Query Language)也增加了數(shù)據(jù)更新的內(nèi)容,RDF存儲系統(tǒng)理應(yīng)支持,F(xiàn)有RDF存儲系統(tǒng)的研究工作多集中于存儲的優(yōu)化和查詢性能的提升,而在數(shù)據(jù)更新方面的研究較少。 RDF在線更新處理系統(tǒng)x-TripleBit旨在提供高效的處理大規(guī)模RDF數(shù)據(jù)更新的方法。為了提高事務(wù)處理的速度,系統(tǒng)提出了一種以數(shù)據(jù)塊為單位的細粒度事務(wù)執(zhí)行框架,每個SPARQL語句都被分解成針對各個數(shù)據(jù)塊的子任務(wù),,由于數(shù)據(jù)塊之間的數(shù)據(jù)互不重疊,因此同一個SPARQL語句的各個子任務(wù)可以并行執(zhí)行,加速了事務(wù)處理。在此基礎(chǔ)上系統(tǒng)采用了一種兩層事務(wù)調(diào)度方案優(yōu)化事務(wù)執(zhí)行過程,該調(diào)度方案分別在數(shù)據(jù)塊層面和數(shù)據(jù)塊內(nèi)部進行事務(wù)調(diào)度,減少讀寫數(shù)據(jù)的次數(shù)以提高系統(tǒng)的并行度。在處理數(shù)據(jù)塊中新增數(shù)據(jù)的插入時系統(tǒng)采用了延遲更新的策略,利用二級緩存提高系統(tǒng)的性能。而對于RDF數(shù)據(jù)的批量更新,系統(tǒng)針對RDF數(shù)據(jù)的特點和系統(tǒng)的存儲結(jié)構(gòu)提出了一個兩步更新的策略,新增數(shù)據(jù)首先在緩存中進行處理,然后再將緩存中的數(shù)據(jù)合并到數(shù)據(jù)庫中。 x-TripleBit與目前較好的RDF數(shù)據(jù)存儲系統(tǒng)TripleBit、RDF-3X相比:查詢性能方面,在處理不是特別簡單的查詢語句時,比TripleBit提升了30%左右;數(shù)據(jù)批量更新方面比RDF-3X提升了接近40%;數(shù)據(jù)在線更新方面在高負載的情況下相比RDF-3X、PostgreSQL有數(shù)十倍的性能提升。
【關(guān)鍵詞】:批量更新 在線更新 事務(wù)處理 事務(wù)調(diào)度
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP333
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-15
- 1.1 研究背景和問題提出8-9
- 1.2 國內(nèi)外研究現(xiàn)狀9-13
- 1.3 研究內(nèi)容13-14
- 1.4 文章框架結(jié)構(gòu)14-15
- 2 RDF 在線更新處理系統(tǒng)設(shè)計15-21
- 2.1 X-TRIPLEBIT 主要設(shè)計思想15-16
- 2.2 X-TRIPLEBIT 系統(tǒng)結(jié)構(gòu)與系統(tǒng)模塊16-18
- 2.3 X-TRIPLEBIT 工作流程18-20
- 2.4 本章小結(jié)20-21
- 3 細粒度的 SPARQL 事務(wù)并行處理技術(shù)21-34
- 3.1 概述21-22
- 3.2 SPARQL 查詢語言簡介及解析22-25
- 3.3 以塊為單位的細粒度事務(wù)執(zhí)行框架25-26
- 3.4 兩層事務(wù)處理調(diào)度方法26-29
- 3.5 SPARQL 事務(wù)處理的實現(xiàn)29-33
- 3.6 本章小結(jié)33-34
- 4 數(shù)據(jù)更新的執(zhí)行和優(yōu)化34-40
- 4.1 RDF 數(shù)據(jù)的批量更新34-35
- 4.2 RDF 數(shù)據(jù)的在線更新35-39
- 4.3 本章小結(jié)39-40
- 5 系統(tǒng)測試與分析40-49
- 5.1 測試環(huán)境40
- 5.2 測試數(shù)據(jù)集40-41
- 5.3 性能測試41-47
- 5.4 本章小結(jié)47-49
- 6 總結(jié)與展望49-51
- 致謝51-53
- 參考文獻53-57
- 附錄 1 攻讀學(xué)位期間申請的軟件著作版權(quán)57-58
- 附錄 2 攻讀學(xué)位期間參與的主要科研項目58-59
- 附錄 3 LUBM 數(shù)據(jù)集的查詢語句59-60
- 附錄 4 UNIPROT 數(shù)據(jù)集的查詢語句60-61
- 附錄 5 BTC 數(shù)據(jù)集的查詢語句61
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王志軍;;應(yīng)用程序也能批量更新[J];電腦迷;2007年10期
2 李輝;吳躍;龔海剛;;基于隊列模型的批量更新密鑰的研究[J];計算機應(yīng)用;2009年04期
3 李輝;;基于秘密份額的組密鑰批量更新方案的研究[J];福建電腦;2013年03期
4 劉兵;林劍;李艷華;徐磊;;一種GridView批量更新方法[J];電腦編程技巧與維護;2011年18期
5 歐陽艷階;張明;;GridView控件批量更新方法的改進研究與實現(xiàn)[J];十堰職業(yè)技術(shù)學(xué)院學(xué)報;2013年02期
6 張迎新;;批量更新,Office 2003也可以[J];電腦愛好者;2006年23期
7 張率;;為Office 2003來個批量更新[J];辦公自動化;2007年02期
8 周本新,安興亞,童小念;ASP.net中自動生成批量更新數(shù)據(jù)表單的設(shè)計[J];中南民族大學(xué)學(xué)報(自然科學(xué)版);2004年04期
9 沈明峰;巧用Javascript實現(xiàn)網(wǎng)站批量更新[J];電腦愛好者;2003年01期
10 謝海濤;王玉明;楊宗凱;程文青;;一種M維幾何球形組播密鑰批量更新方案[J];小型微型計算機系統(tǒng);2010年02期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 翁海星;面向讀寫分離、批量更新存儲機制的高效分布式索引[D];華東師范大學(xué);2016年
2 范立健;RDF數(shù)據(jù)在線更新處理系統(tǒng)研究[D];華中科技大學(xué);2014年
3 王s
本文編號:932695
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/932695.html