分布式計算環(huán)境下海量RDF數(shù)據(jù)的skyline查詢研究
發(fā)布時間:2017-05-24 09:20
本文關(guān)鍵詞:分布式計算環(huán)境下海量RDF數(shù)據(jù)的skyline查詢研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著語義網(wǎng)的提出和相關(guān)技術(shù)的發(fā)展與成熟,該領(lǐng)域吸引了學(xué)術(shù)界、政府部門和工業(yè)界的廣泛關(guān)注和積極參與。關(guān)聯(lián)數(shù)據(jù)作為語義網(wǎng)的最佳實踐,越來越成為研究的熱點。資源描述框架RDF現(xiàn)已成為關(guān)聯(lián)數(shù)據(jù)的實際標(biāo)準(zhǔn),為網(wǎng)絡(luò)上的資源提供了一種資源描述標(biāo)準(zhǔn)。通過給萬維網(wǎng)上的文檔添加計算機(jī)能夠理解和處理的形式化語義信息,大大提高信息檢索的精度和效率。隨著RDF數(shù)據(jù)的不斷增多,針對RDF數(shù)據(jù)的信息挖掘成為數(shù)據(jù)管理和數(shù)據(jù)挖掘的研究熱點。Skyline查詢作為一種典型的多目標(biāo)優(yōu)化查詢,為用戶決策提供參考依據(jù),因而得到了廣泛研究。本論文主要研究針對海量RDF數(shù)據(jù)的Skyline查詢。第一,根據(jù)RDF垂直存儲的方式設(shè)計一種候選Skyline點篩選策略,提前修剪部分非Skyline元組,減少skyline支配點計算的數(shù)據(jù)量;并且在篩選的基礎(chǔ)上給出基于MapReduce的Skyline并行化查詢算法以提高查詢效率。第二,針對高維數(shù)據(jù)空間下Skyline查詢的不足,研究K-支配Skyline查詢算法。論文提出兩種K-支配查詢算法。一種基于支配能力的K-支配查詢算法,根據(jù)每個數(shù)據(jù)點的支配能力劃分?jǐn)?shù)據(jù)塊,分別計算局部K-支配點,最后合并計算最終的K-支配點。另一種基于空間劃分的K-支配查詢算法,通過挖掘數(shù)據(jù)空間和K-支配的關(guān)系,計算支配集合。最后,本論文在大量數(shù)據(jù)的基礎(chǔ)上進(jìn)行實驗,驗證所提算法的計算效率。實驗結(jié)果表明,與現(xiàn)有的Skyline查詢算法和K-支配Skyline查詢算法相比,本文提出的基于MapReduce的RDF數(shù)據(jù)Skyline查詢算法和K-支配Skyline查詢算法有效的提高查詢效率。
【關(guān)鍵詞】:Skyline查詢 RDF數(shù)據(jù) K-支配Skyline查詢 MapReduce框架 云計算
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.4;TP311.13
【目錄】:
- 摘要4-5
- Abstract5-12
- 1 緒論12-19
- 1.1 研究背景12-13
- 1.2 研究現(xiàn)狀13-17
- 1.2.1 Skyline查詢的研究現(xiàn)狀13-16
- 1.2.2 RDF數(shù)據(jù)的研究現(xiàn)狀16-17
- 1.3 本文的主要研究內(nèi)容17-18
- 1.4 論文的組織結(jié)構(gòu)18-19
- 2 相關(guān)技術(shù)研究19-29
- 2.1 Skyline查詢19-22
- 2.1.1 單Skyline查詢處理算法19-21
- 2.1.2 多Skyline查詢處理算法21
- 2.1.3 不同應(yīng)用環(huán)境的Skyline查詢算法21-22
- 2.1.4 海量數(shù)據(jù)的Skyline查詢22
- 2.2 K-支配Skyline查詢算法22-24
- 2.3 RDF數(shù)據(jù)24-25
- 2.4 MapReduce計算框架25-28
- 2.5 本章小結(jié)28-29
- 3 RDF數(shù)據(jù)的Skyline優(yōu)化查詢機(jī)制29-39
- 3.1 概念描述29
- 3.2 RDF數(shù)據(jù)存儲結(jié)構(gòu)分析29-32
- 3.3 RDF數(shù)據(jù)篩選策略32-34
- 3.3.1 相關(guān)定義32-33
- 3.3.2 篩選策略及證明33-34
- 3.4 基于MapReduce的Skyline查詢算法34-38
- 3.4.1 屬性連接和數(shù)據(jù)篩選34-36
- 3.4.2 支配點計算36-38
- 3.5 本章小結(jié)38-39
- 4 RDF數(shù)據(jù)的K-支配Skyline算法研究39-52
- 4.1 K-支配Skyline查詢引入39-40
- 4.2 概念描述40-41
- 4.3 K-支配特性41-42
- 4.3.1 K-支配的循環(huán)支配情況41-42
- 4.3.2 K-支配的支配關(guān)系的不傳遞性42
- 4.4 基于支配能力的K-支配算法42-45
- 4.4.1 篩選策略42-43
- 4.4.2 基于支配能力的K-支配查詢算法43-45
- 4.5 基于空間劃分的K-支配算法45-51
- 4.5.1 劃分子空間原理45-49
- 4.5.2 基于空間劃分的K-支配Skyline算法并行化實現(xiàn)49-51
- 4.6 本章小結(jié)51-52
- 5 實驗及結(jié)果分析52-56
- 5.1 實驗數(shù)據(jù)和實驗環(huán)境52
- 5.2 實驗分析52-55
- 5.2.1 RDF數(shù)據(jù)的Skyline優(yōu)化查詢機(jī)制實驗52-54
- 5.2.2 RDF數(shù)據(jù)的K-支配Skyline查詢算法實驗54-55
- 5.3 本章小結(jié)55-56
- 6 總結(jié)與展望56-58
- 6.1 總結(jié)56-57
- 6.2 展望57-58
- 參考文獻(xiàn)58-61
- 致謝61-62
- 個人簡歷62
- 在讀期間發(fā)表的論文及參與的項目62
- 發(fā)表論文62
- 參與項目62
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 孫圣力;戴東波;黃震華;張齊勛;周立新;;概率數(shù)據(jù)流上Skyline查詢處理算法[J];電子學(xué)報;2009年02期
2 雷婷;王濤;曲武;韓曉光;;云環(huán)境下基于超球面投影分區(qū)的Skyline計算[J];計算機(jī)科學(xué);2013年06期
3 潘立強(qiáng);李建中;駱吉洲;;無線傳感器網(wǎng)絡(luò)中一種近似Skyline查詢處理算法[J];軟件學(xué)報;2010年05期
4 楊艷艷;趙雷;楊季文;;改進(jìn)的概率數(shù)據(jù)流上Skyline查詢算法[J];蘇州大學(xué)學(xué)報(工科版);2012年02期
本文關(guān)鍵詞:分布式計算環(huán)境下海量RDF數(shù)據(jù)的skyline查詢研究,,由筆耕文化傳播整理發(fā)布。
本文編號:390404
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/390404.html
最近更新
教材專著