基于HBase的本體存儲(chǔ)與查詢的研究
發(fā)布時(shí)間:2023-02-23 19:21
語義網(wǎng)(Semantic Web)從提出到現(xiàn)在,受到越來越多的個(gè)人、研究機(jī)構(gòu)和企業(yè)組織的關(guān)注。本體作為語義網(wǎng)數(shù)據(jù)的核心,主要通過RDF三元組進(jìn)行描述。近年來互聯(lián)網(wǎng)數(shù)據(jù)驟增,也讓以RDF陳述為基礎(chǔ)的本體數(shù)據(jù)存儲(chǔ)面臨越來越大的壓力,如何高效的存儲(chǔ)與查詢本體數(shù)據(jù)成為研究的熱點(diǎn)。 本文在總結(jié)分析RDF存儲(chǔ)系統(tǒng)、RDF查詢語言、非關(guān)系型數(shù)據(jù)庫(kù)HBase以及分布式框架Hadoop的應(yīng)用現(xiàn)狀的基礎(chǔ)上,討論設(shè)計(jì)了基于分布式HBase存儲(chǔ)的RDF存儲(chǔ)模型。并在存儲(chǔ)模型的基礎(chǔ)上,設(shè)計(jì)了本體存儲(chǔ)表結(jié)構(gòu)。通過分析SPARQL查詢語言的原理與特性,設(shè)計(jì)并實(shí)現(xiàn)了基于HBase的RDF核心三元組匹配算法,且在該算法的基礎(chǔ)上,設(shè)計(jì)了基于SPARQL圖模式(基本模式、組圖模式、Optional圖模式、Alternative圖模式)的查詢匹配算法。 最后本文介紹了搭建基于Hadoop單機(jī)偽分布式和Hadoop分布式集群兩種架構(gòu)的環(huán)境,在此環(huán)境下,通過實(shí)驗(yàn),驗(yàn)證了本文所提出的本體分布式存儲(chǔ)和相關(guān)查詢算法的可行性與有效性。
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
目錄
第一章 緒論
1.1 選題背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 RDF 存儲(chǔ)系統(tǒng)現(xiàn)狀
1.2.2 RDF 查詢語言現(xiàn)狀
1.2.3 非關(guān)系型數(shù)據(jù)庫(kù)發(fā)展現(xiàn)狀
1.2.4 分布式 Hadoop 的應(yīng)用現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排和框架
第二章 相關(guān)技術(shù)
2.1 本體技術(shù)
2.1.1 RDF 資源描述框架
2.1.2 RDF 存儲(chǔ)模型
2.1.3 RDF 查詢
2.2 分布式技術(shù)
2.2.1 分布式架構(gòu) Hadoop
2.2.2 文件系統(tǒng) HDFS
2.2.3 分布式計(jì)算 MapReduce
2.2.4 分布式存儲(chǔ) HBase
第三章 基于 HBase 存儲(chǔ)模型的構(gòu)建
3.1 類關(guān)系存儲(chǔ)模型
3.2 屬性關(guān)系存儲(chǔ)模型
3.3 實(shí)例存儲(chǔ)模型
3.4 小結(jié)
第四章 基于 HBase 查詢算法設(shè)計(jì)
4.1 SPARQL 查詢模式
4.2 RDF 三元組匹配
4.3 基于基本圖模式的查詢
4.4 基于組圖模式的查詢
4.5 基于 Optional 圖模式的查詢
4.6 基于 Alternative 圖模式的查詢
4.7 小結(jié)
第五章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)平臺(tái)
5.2 實(shí)驗(yàn)數(shù)據(jù)加載
5.2.1 數(shù)據(jù)生成
5.2.2 數(shù)據(jù)加載
5.3 實(shí)驗(yàn)分析和評(píng)估
5.3.1 RDF 三元組匹配實(shí)驗(yàn)
5.3.2 圖模式查詢實(shí)驗(yàn)
5.4 小結(jié)
第六章 總結(jié)
6.1 主要工作回顧
6.2 本課題今后需進(jìn)一步研究的地方
參考文獻(xiàn)
個(gè)人簡(jiǎn)歷 在讀期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號(hào):3748595
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
目錄
第一章 緒論
1.1 選題背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 RDF 存儲(chǔ)系統(tǒng)現(xiàn)狀
1.2.2 RDF 查詢語言現(xiàn)狀
1.2.3 非關(guān)系型數(shù)據(jù)庫(kù)發(fā)展現(xiàn)狀
1.2.4 分布式 Hadoop 的應(yīng)用現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排和框架
第二章 相關(guān)技術(shù)
2.1 本體技術(shù)
2.1.1 RDF 資源描述框架
2.1.2 RDF 存儲(chǔ)模型
2.1.3 RDF 查詢
2.2 分布式技術(shù)
2.2.1 分布式架構(gòu) Hadoop
2.2.2 文件系統(tǒng) HDFS
2.2.3 分布式計(jì)算 MapReduce
2.2.4 分布式存儲(chǔ) HBase
第三章 基于 HBase 存儲(chǔ)模型的構(gòu)建
3.1 類關(guān)系存儲(chǔ)模型
3.2 屬性關(guān)系存儲(chǔ)模型
3.3 實(shí)例存儲(chǔ)模型
3.4 小結(jié)
第四章 基于 HBase 查詢算法設(shè)計(jì)
4.1 SPARQL 查詢模式
4.2 RDF 三元組匹配
4.3 基于基本圖模式的查詢
4.4 基于組圖模式的查詢
4.5 基于 Optional 圖模式的查詢
4.6 基于 Alternative 圖模式的查詢
4.7 小結(jié)
第五章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)平臺(tái)
5.2 實(shí)驗(yàn)數(shù)據(jù)加載
5.2.1 數(shù)據(jù)生成
5.2.2 數(shù)據(jù)加載
5.3 實(shí)驗(yàn)分析和評(píng)估
5.3.1 RDF 三元組匹配實(shí)驗(yàn)
5.3.2 圖模式查詢實(shí)驗(yàn)
5.4 小結(jié)
第六章 總結(jié)
6.1 主要工作回顧
6.2 本課題今后需進(jìn)一步研究的地方
參考文獻(xiàn)
個(gè)人簡(jiǎn)歷 在讀期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號(hào):3748595
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3748595.html
最近更新
教材專著