不確定RDF數(shù)據(jù)查詢處理的研究
發(fā)布時間:2022-02-08 23:30
語義Web作為數(shù)據(jù)之網正在不斷地匯集并組織Web信息,因此相關應用面臨著對語義Web所含的大規(guī)模RDF(Resource Description Framework,資源描述框架)數(shù)據(jù)進行高效訪問的挑戰(zhàn)。另一方面,由于現(xiàn)代科學的研究方法和測量技術普遍存在誤差和噪聲,數(shù)據(jù)集集成后存在的數(shù)據(jù)雜亂等因素,使得RDF數(shù)據(jù)具有不確定性。在語義Web領域,不確定RDF數(shù)據(jù)查詢的研究已經引起了學術界的廣泛重視,成為新近發(fā)展起來的研究熱點。本論文研究的目的就在于設計出高效準確的算法進行不確定性RDF數(shù)據(jù)的查詢,提高查詢效率。論文具體所做工作如下:構建不確定RDF數(shù)據(jù)基準?紤]到目前在進行不確定RDF數(shù)據(jù)研究時,并沒有可以直接獲取的實驗數(shù)據(jù)。論文在現(xiàn)有的確定性RDF數(shù)據(jù)測試基準的基礎之上進行擴展,構建了一個不確定RDF數(shù)據(jù)測試基準。該測試基準可根據(jù)測試需要,選擇生成任意大小的具有均勻或偏態(tài)分布特性的不確定RDF數(shù)據(jù)。提出一種高效的不確定RDF圖查詢算法。論文中首先建立了有利于高效進行子圖匹配的索引。其次,利用獲取的RDF圖摘要信息,在子圖匹配查詢過程中進行有效的結構化剪枝和概率剪枝。同時,還提出了通過采...
【文章來源】:東北大學遼寧省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
圖5.3通過代價模型選擇(W,?A〇參數(shù)對(Hada(z)適應性哈希函數(shù))??巧呂??5.3?Choosing?(W,?parame化r?pairs?with?cost?model?(Hada(z)?adaptive?hash?ftmction)??
?第S章實驗分析??這樣獲取的結果就是理想的結果值。如下圖5.3所示,假定iV的初始值為1.0,??每次遞進0.1,m的初始值為1,每次遞進1?桑子^察到對于需插入到布隆過濾??器的標簽數(shù)組,當OT增大時,誤差率^逐漸減小。當iV増大時,誤差率P也是??逐漸減小。為保證誤差率在1%之內,我們選擇(m,7V)對為(4,1.3)。??圖5.4提供了當哈希函數(shù)采用均勻映射的函數(shù)時,m值從5取值,每次遞進??1,值從5.0取值,每次遞進0.1時,誤差率的變化圖。與圖5.3表對比可知在??誤差率;?進行相同時,使用適應性哈希函數(shù)所需要的W值相對于使用傳統(tǒng)哈希??函數(shù)所需要的值要小很多。因此對空間的節(jié)省效果也是非常明顯的。??0.2?m?:???????????I?1??巧?!巧1??0.15-?:?……II可…品?:?;■;??宗???C5???與’?0.1?i??進?I?g?。4??。.:??1.0?1.1?1.2?1.2?1.4?1.5??微—碌賽??圖5.3通過代價模型選擇(W,?A〇參數(shù)對(Hada(z)適應性哈希函數(shù))??巧呂??5.3?Choosing?(W
?第S章實驗分析??這樣獲取的結果就是理想的結果值。如下圖5.3所示,假定iV的初始值為1.0,??每次遞進0.1,m的初始值為1,每次遞進1。可W觀察到對于需插入到布隆過濾??器的標簽數(shù)組,當OT增大時,誤差率^逐漸減小。當iV増大時,誤差率P也是??逐漸減小。為保證誤差率在1%之內,我們選擇(m,7V)對為(4,1.3)。??圖5.4提供了當哈希函數(shù)采用均勻映射的函數(shù)時,m值從5取值,每次遞進??1,值從5.0取值,每次遞進0.1時,誤差率的變化圖。與圖5.3表對比可知在??誤差率;?進行相同時,使用適應性哈希函數(shù)所需要的W值相對于使用傳統(tǒng)哈希??函數(shù)所需要的值要小很多。因此對空間的節(jié)省效果也是非常明顯的。??0.2?m?:???????????I?1??巧?!巧1??0.15-?:?……II可…品?:?;■;??宗???C5???與’?0.1?i??進?I?g?。4??。.:??1.0?1.1?1.2?1.2?1.4?1.5??微—碌賽??圖5.3通過代價模型選擇(W,?A〇參數(shù)對(Hada(z)適應性哈希函數(shù))??巧呂??5.3?Choosing?(W
【參考文獻】:
期刊論文
[1]基于Prüfer序列的RDF數(shù)據(jù)索引與查詢[J]. 劉翔宇,吳剛. 計算機學報. 2011(10)
[2]面向不確定圖的概率可達查詢[J]. 袁野,王國仁. 計算機學報. 2010(08)
[3]不確定性數(shù)據(jù)管理技術研究綜述[J]. 周傲英,金澈清,王國仁,李建中. 計算機學報. 2009(01)
本文編號:3615955
【文章來源】:東北大學遼寧省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
圖5.3通過代價模型選擇(W,?A〇參數(shù)對(Hada(z)適應性哈希函數(shù))??巧呂??5.3?Choosing?(W,?parame化r?pairs?with?cost?model?(Hada(z)?adaptive?hash?ftmction)??
?第S章實驗分析??這樣獲取的結果就是理想的結果值。如下圖5.3所示,假定iV的初始值為1.0,??每次遞進0.1,m的初始值為1,每次遞進1?桑子^察到對于需插入到布隆過濾??器的標簽數(shù)組,當OT增大時,誤差率^逐漸減小。當iV増大時,誤差率P也是??逐漸減小。為保證誤差率在1%之內,我們選擇(m,7V)對為(4,1.3)。??圖5.4提供了當哈希函數(shù)采用均勻映射的函數(shù)時,m值從5取值,每次遞進??1,值從5.0取值,每次遞進0.1時,誤差率的變化圖。與圖5.3表對比可知在??誤差率;?進行相同時,使用適應性哈希函數(shù)所需要的W值相對于使用傳統(tǒng)哈希??函數(shù)所需要的值要小很多。因此對空間的節(jié)省效果也是非常明顯的。??0.2?m?:???????????I?1??巧?!巧1??0.15-?:?……II可…品?:?;■;??宗???C5???與’?0.1?i??進?I?g?。4??。.:??1.0?1.1?1.2?1.2?1.4?1.5??微—碌賽??圖5.3通過代價模型選擇(W,?A〇參數(shù)對(Hada(z)適應性哈希函數(shù))??巧呂??5.3?Choosing?(W
?第S章實驗分析??這樣獲取的結果就是理想的結果值。如下圖5.3所示,假定iV的初始值為1.0,??每次遞進0.1,m的初始值為1,每次遞進1。可W觀察到對于需插入到布隆過濾??器的標簽數(shù)組,當OT增大時,誤差率^逐漸減小。當iV増大時,誤差率P也是??逐漸減小。為保證誤差率在1%之內,我們選擇(m,7V)對為(4,1.3)。??圖5.4提供了當哈希函數(shù)采用均勻映射的函數(shù)時,m值從5取值,每次遞進??1,值從5.0取值,每次遞進0.1時,誤差率的變化圖。與圖5.3表對比可知在??誤差率;?進行相同時,使用適應性哈希函數(shù)所需要的W值相對于使用傳統(tǒng)哈希??函數(shù)所需要的值要小很多。因此對空間的節(jié)省效果也是非常明顯的。??0.2?m?:???????????I?1??巧?!巧1??0.15-?:?……II可…品?:?;■;??宗???C5???與’?0.1?i??進?I?g?。4??。.:??1.0?1.1?1.2?1.2?1.4?1.5??微—碌賽??圖5.3通過代價模型選擇(W,?A〇參數(shù)對(Hada(z)適應性哈希函數(shù))??巧呂??5.3?Choosing?(W
【參考文獻】:
期刊論文
[1]基于Prüfer序列的RDF數(shù)據(jù)索引與查詢[J]. 劉翔宇,吳剛. 計算機學報. 2011(10)
[2]面向不確定圖的概率可達查詢[J]. 袁野,王國仁. 計算機學報. 2010(08)
[3]不確定性數(shù)據(jù)管理技術研究綜述[J]. 周傲英,金澈清,王國仁,李建中. 計算機學報. 2009(01)
本文編號:3615955
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3615955.html
最近更新
教材專著