面向大規(guī)模RDF數(shù)據(jù)的關(guān)鍵詞查詢(xún)方法研究
發(fā)布時(shí)間:2021-03-03 17:15
資源描述框架(Resource Description Framework,簡(jiǎn)稱(chēng)RDF)是語(yǔ)義Web中所使用的基本標(biāo)記語(yǔ)言,在知識(shí)的組織與管理和社會(huì)網(wǎng)絡(luò)應(yīng)用中廣泛應(yīng)用。RDF數(shù)據(jù)的規(guī)模隨著語(yǔ)義Web應(yīng)用的發(fā)展而增大。RDF數(shù)據(jù)具有典型的圖特征,含有復(fù)雜的結(jié)構(gòu)信息,以及大量的文本信息。可見(jiàn),如何在大規(guī)模RDF數(shù)據(jù)上進(jìn)行高效的關(guān)鍵詞查詢(xún)是當(dāng)前研究的熱點(diǎn)之一。針對(duì)已有研究在查詢(xún)執(zhí)行效率和結(jié)果質(zhì)量方面存在的不足,提出了基于近似組斯坦納樹(shù)的大規(guī)模RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)方法RAGS。RAGS將RDF上的關(guān)鍵詞查詢(xún)映射為組斯坦納樹(shù)問(wèn)題,然后通過(guò)將組斯坦納樹(shù)問(wèn)題規(guī)約為最小斯坦納樹(shù)問(wèn)題進(jìn)行求解。針對(duì)經(jīng)典的最小斯坦納樹(shù)算法是非規(guī)約安全的問(wèn)題,提出了改進(jìn)方法,并分析了算法的時(shí)間復(fù)雜度和近似比性能。為了使大規(guī)模RDF數(shù)據(jù)上的關(guān)鍵詞查詢(xún)具有更友好的用戶(hù)體驗(yàn),設(shè)計(jì)了最短路徑三元組倒排索引結(jié)構(gòu),通過(guò)離線預(yù)先計(jì)算全源最短路徑的方式,改善在線查詢(xún)的實(shí)時(shí)性;提出基于升序排列生成樹(shù)算法的top-k查詢(xún)方法,以便更快的為用戶(hù)返回準(zhǔn)確結(jié)果?紤]到對(duì)于大規(guī)模RDF數(shù)據(jù)而言,索引構(gòu)建時(shí)間也是系統(tǒng)的主要瓶頸。提出基于整體同步并行計(jì)算模...
【文章來(lái)源】:東北大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 引言
1.2 研究現(xiàn)狀
1.3 挑戰(zhàn)與研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)與安排
第2章 相關(guān)工作
2.1 半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)上的關(guān)鍵詞查詢(xún)
2.1.1 XML文檔上的關(guān)鍵詞搜索
2.1.2 關(guān)系數(shù)據(jù)庫(kù)上的關(guān)鍵詞查詢(xún)
2.1.3 RDF數(shù)據(jù)上的關(guān)鍵詞查詢(xún)
2.2 組斯坦納樹(shù)和最小斯坦納樹(shù)問(wèn)題
2.2.1 最小斯坦納樹(shù)問(wèn)題
2.2.2 組斯坦納樹(shù)問(wèn)題
2.3 分布式大規(guī)模圖處理技術(shù)
2.3.1 基于MapReduce的大規(guī)模圖處理
2.3.2 基于BSP的大規(guī)模圖處理
2.4 本章小結(jié)
第3章 基于近似組斯坦納樹(shù)的RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)方法
3.1 問(wèn)題定義
3.2 方法概述
3.3 RDF圖變換
3.4 近似組斯坦納樹(shù)
3.4.1 組斯坦納樹(shù)問(wèn)題規(guī)約為最小斯坦納樹(shù)問(wèn)題
3.4.2 基于DNH最小斯坦納樹(shù)啟發(fā)算法的近似組斯坦納樹(shù)求解
3.5 本章小結(jié)
第4章 面向大規(guī)模RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)的改進(jìn)方法
4.1 最短路徑三元組倒排索引
4.2 TOP-K查詢(xún)
4.3 基于BSP的分布式算法
4.4 本章小結(jié)
第5章 實(shí)驗(yàn)設(shè)計(jì)與分析
5.1 實(shí)驗(yàn)設(shè)計(jì)
5.1.1 實(shí)驗(yàn)環(huán)境
5.1.2 測(cè)試數(shù)據(jù)集
5.1.3 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)
5.2 實(shí)驗(yàn)結(jié)果分析
5.2.1 索引時(shí)間開(kāi)銷(xiāo)和空間開(kāi)銷(xiāo)
5.2.2 查詢(xún)響應(yīng)時(shí)間比較
5.2.3 查詢(xún)效果分析
5.2.4 k值對(duì)top-k查詢(xún)響應(yīng)時(shí)間的影響
5.2.5 基于BSP的分布式算法性能
5.3 本章小結(jié)
第6章 結(jié)論與展望
6.1 結(jié)論
6.2 未來(lái)展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間參與的項(xiàng)目
【參考文獻(xiàn)】:
期刊論文
[1]云計(jì)算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)[J]. 于戈,谷峪,鮑玉斌,王志剛. 計(jì)算機(jī)學(xué)報(bào). 2011(10)
[2]KREAG:基于實(shí)體三元組關(guān)聯(lián)圖的RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)方法[J]. 李慧穎,瞿裕忠. 計(jì)算機(jī)學(xué)報(bào). 2011(05)
[3]XML數(shù)據(jù)的查詢(xún)技術(shù)[J]. 孔令波,唐世渭,楊冬青,王騰蛟,高軍. 軟件學(xué)報(bào). 2007(06)
[4]細(xì)粒度語(yǔ)義網(wǎng)檢索[J]. 吳剛,唐杰,李涓子,王克宏. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(S1)
[5]并行計(jì)算模型在集群環(huán)境下的適應(yīng)性[J]. 宋安軍,彭勤科,胡保生. 計(jì)算機(jī)工程. 2003(18)
博士論文
[1]RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D]. 吳剛.清華大學(xué) 2008
本文編號(hào):3061627
【文章來(lái)源】:東北大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 引言
1.2 研究現(xiàn)狀
1.3 挑戰(zhàn)與研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)與安排
第2章 相關(guān)工作
2.1 半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)上的關(guān)鍵詞查詢(xún)
2.1.1 XML文檔上的關(guān)鍵詞搜索
2.1.2 關(guān)系數(shù)據(jù)庫(kù)上的關(guān)鍵詞查詢(xún)
2.1.3 RDF數(shù)據(jù)上的關(guān)鍵詞查詢(xún)
2.2 組斯坦納樹(shù)和最小斯坦納樹(shù)問(wèn)題
2.2.1 最小斯坦納樹(shù)問(wèn)題
2.2.2 組斯坦納樹(shù)問(wèn)題
2.3 分布式大規(guī)模圖處理技術(shù)
2.3.1 基于MapReduce的大規(guī)模圖處理
2.3.2 基于BSP的大規(guī)模圖處理
2.4 本章小結(jié)
第3章 基于近似組斯坦納樹(shù)的RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)方法
3.1 問(wèn)題定義
3.2 方法概述
3.3 RDF圖變換
3.4 近似組斯坦納樹(shù)
3.4.1 組斯坦納樹(shù)問(wèn)題規(guī)約為最小斯坦納樹(shù)問(wèn)題
3.4.2 基于DNH最小斯坦納樹(shù)啟發(fā)算法的近似組斯坦納樹(shù)求解
3.5 本章小結(jié)
第4章 面向大規(guī)模RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)的改進(jìn)方法
4.1 最短路徑三元組倒排索引
4.2 TOP-K查詢(xún)
4.3 基于BSP的分布式算法
4.4 本章小結(jié)
第5章 實(shí)驗(yàn)設(shè)計(jì)與分析
5.1 實(shí)驗(yàn)設(shè)計(jì)
5.1.1 實(shí)驗(yàn)環(huán)境
5.1.2 測(cè)試數(shù)據(jù)集
5.1.3 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)
5.2 實(shí)驗(yàn)結(jié)果分析
5.2.1 索引時(shí)間開(kāi)銷(xiāo)和空間開(kāi)銷(xiāo)
5.2.2 查詢(xún)響應(yīng)時(shí)間比較
5.2.3 查詢(xún)效果分析
5.2.4 k值對(duì)top-k查詢(xún)響應(yīng)時(shí)間的影響
5.2.5 基于BSP的分布式算法性能
5.3 本章小結(jié)
第6章 結(jié)論與展望
6.1 結(jié)論
6.2 未來(lái)展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間參與的項(xiàng)目
【參考文獻(xiàn)】:
期刊論文
[1]云計(jì)算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)[J]. 于戈,谷峪,鮑玉斌,王志剛. 計(jì)算機(jī)學(xué)報(bào). 2011(10)
[2]KREAG:基于實(shí)體三元組關(guān)聯(lián)圖的RDF數(shù)據(jù)關(guān)鍵詞查詢(xún)方法[J]. 李慧穎,瞿裕忠. 計(jì)算機(jī)學(xué)報(bào). 2011(05)
[3]XML數(shù)據(jù)的查詢(xún)技術(shù)[J]. 孔令波,唐世渭,楊冬青,王騰蛟,高軍. 軟件學(xué)報(bào). 2007(06)
[4]細(xì)粒度語(yǔ)義網(wǎng)檢索[J]. 吳剛,唐杰,李涓子,王克宏. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(S1)
[5]并行計(jì)算模型在集群環(huán)境下的適應(yīng)性[J]. 宋安軍,彭勤科,胡保生. 計(jì)算機(jī)工程. 2003(18)
博士論文
[1]RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D]. 吳剛.清華大學(xué) 2008
本文編號(hào):3061627
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3061627.html
最近更新
教材專(zhuān)著