基于r-clique的不確定RDF關(guān)鍵字查詢研究
[Abstract]:Resource description Framework (Resource Description Framework,) is a basic markup language used in semantic Web nets, which is widely used in many fields. Due to the existing ontology extraction, labeling methods and measurement techniques, there are errors and noises, which make uncertain RDF data widely exist. In recent years, query for uncertain RDF data has become a hot topic. Because uncertain RDF data can be modeled as an uncertain RDF graph, the research on keyword query of uncertain RDF data is actually a study of keyword query on an uncertain RDF graph. Based on the previous research, this paper proposes two algorithms of uncertain RDF keyword query based on r-clique-SABR and Habr. The Chinese meaning of the word "clique" is "maximum mass, subgroup", which refers to a subgraph in an uncertain graph. The letter r is a variable representing the threshold of distance. Therefore, r-clique is a subgraph of any two nodes containing all query keys whose distance is not greater than a given value r. In order to improve the query speed, an approximate algorithm of polynomial delay is proposed to construct r-clique. The algorithm KSABR (Keyword Search Algorithm Based on r-clique maps the keyword query problem on uncertain RDF data to the problem of finding r-cliques on uncertain graphs. In order to improve the quality of query results, a more accurate algorithm called: Habr (Efficient Algorithm Based on r-clique is proposed on the basis of KSABR. In HABR, a scoring function is used to sort the results. For the obtained k results top-k algorithm calls the scoring function to sort the results and then returns the top-k results to the user. In order to further improve the query speed, this paper designs two index structures, Ki (Keyword Inverted Index) and PI (Probabilistic Inverted Index). Ki, which store the mapping relationship between keywords and nodes. It can be used to implement structural pruning and probabilistic pruning. Pi can store the mapping relationship between key nodes and r-clique, and it can be used to implement scoring functions. Experiments show that the proposed algorithm KSABR has better performance in time performance and HABR has better performance in both time performance and result quality.
【學(xué)位授予單位】:東北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.09
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王煥景;李明;;“關(guān)鍵字查詢”教學(xué)設(shè)計(jì)[J];中國教育技術(shù)裝備;2007年12期
2 宋玉玲;王寧;;利用實(shí)體語義信息的關(guān)鍵字查詢結(jié)果多樣化[J];計(jì)算機(jī)科學(xué)與探索;2014年03期
3 陳子軍;周同;劉文遠(yuǎn);;面向集合和方向的空間關(guān)鍵字查詢[J];小型微型計(jì)算機(jī)系統(tǒng);2014年05期
4 任建華;周建;孟祥福;魏珂;;基于關(guān)鍵字之間結(jié)構(gòu)關(guān)系的XML查詢結(jié)果排序方法[J];計(jì)算機(jī)科學(xué);2013年06期
5 黃靜;陸嘉恒;孟小峰;;高效的XML關(guān)鍵字查詢改寫和結(jié)果生成技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2010年05期
6 王金寶;高宏;李建中;楊東華;;RB樹:一種支持空間近似關(guān)鍵字查詢的外存索引[J];計(jì)算機(jī)研究與發(fā)展;2012年10期
7 周軍鋒;孟小峰;;XML關(guān)鍵字查詢處理研究[J];計(jì)算機(jī)學(xué)報(bào);2012年12期
8 吳海濤;;一種改進(jìn)的XML關(guān)鍵字查詢算法[J];南京工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年02期
9 李艷紅;李國徽;張聰;;路網(wǎng)中空間關(guān)鍵字連續(xù)k近鄰查詢算法研究[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年12期
10 劉琰;周理;;基于VLCA的關(guān)鍵字查詢匹配算法[J];科學(xué)技術(shù)與工程;2008年02期
相關(guān)會議論文 前5條
1 謝濤;王曉玲;歐陽樹生;周傲英;;XML關(guān)鍵字檢索的最低公共祖先快速查找方法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2006年
2 黃靜;陸嘉恒;孟小峰;;高效的XML關(guān)鍵字查詢改寫和結(jié)果生成技術(shù)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
3 方非;朱皓;楊衛(wèi)東;;基于結(jié)構(gòu)摘要的XML關(guān)鍵字檢索[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
4 黃靜;徐俊勁;周軍鋒;孟小峰;;MLCEA:一種基于實(shí)體的XML關(guān)鍵字查詢語義[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
5 王小鋒;張新;謝敏;孟小峰;周軍鋒;;XML數(shù)據(jù)流上的關(guān)鍵字查詢[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2006年
相關(guān)博士學(xué)位論文 前1條
1 張晨靜;XML關(guān)鍵字過濾技術(shù)[D];復(fù)旦大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 張丹婷;基于事前約束的XML關(guān)鍵字查詢處理研究[D];燕山大學(xué);2015年
2 徐超;基于路網(wǎng)關(guān)鍵字的選擇性估算研究[D];安徽工業(yè)大學(xué);2015年
3 林健;云環(huán)境下支持隱私保護(hù)的動態(tài)模糊多關(guān)鍵字排列查詢方法研究[D];東北大學(xué);2014年
4 張舒;基于r-clique的不確定RDF關(guān)鍵字查詢研究[D];東北大學(xué);2014年
5 李赫;個人數(shù)據(jù)空間管理系統(tǒng)關(guān)鍵字查詢的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2012年
6 周月;關(guān)鍵字查詢性能優(yōu)化研究[D];天津大學(xué);2012年
7 付顏勝;面向集合的空間關(guān)鍵字查詢方法研究[D];燕山大學(xué);2012年
8 潘瑾琨;面向互聯(lián)網(wǎng)位置服務(wù)的空間關(guān)鍵字查詢技術(shù)研究與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2012年
9 陳坤杰;帶關(guān)鍵字的聚集路徑查詢技術(shù)研究[D];復(fù)旦大學(xué);2013年
10 賀騰;面向XML關(guān)鍵字查詢的用戶查詢意圖推斷問題研究[D];燕山大學(xué);2014年
,本文編號:2154799
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2154799.html