分布式RDF關(guān)鍵詞近似搜索方法
本文選題:RDF 切入點(diǎn):關(guān)鍵詞 出處:《中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào)》2017年10期
【摘要】:現(xiàn)有的RDF關(guān)鍵詞搜索方法主要是在大規(guī)模的RDF數(shù)據(jù)圖上直接進(jìn)行搜索,未能充分利用RDF本體中的語(yǔ)義信息,迭代次數(shù)過(guò)多造成搜索效率和效果不理想.針對(duì)這些問(wèn)題,借助Redis內(nèi)存數(shù)據(jù)庫(kù)集群,提出分布式RDF關(guān)鍵詞近似搜索算法(DKASR),即在分布式平臺(tái)上實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的并行搜索.算法結(jié)合RDF本體的語(yǔ)義信息構(gòu)建本體子圖,利用語(yǔ)義評(píng)分函數(shù)對(duì)本體子圖進(jìn)行排序,借助MapReduce計(jì)算模型實(shí)現(xiàn)并行搜索并返回Top-k結(jié)果;如果返回的結(jié)果沒(méi)有達(dá)到Top-k,則對(duì)本體子圖進(jìn)行擴(kuò)展生成近似本體子圖,使用語(yǔ)義相似度函數(shù)對(duì)近似本體子圖進(jìn)行排序,再利用MapReduce計(jì)算模型實(shí)現(xiàn)并行搜索,直到返回Top-k結(jié)果.實(shí)驗(yàn)結(jié)果表明,DKASR算法能夠高效正確地實(shí)現(xiàn)RDF關(guān)鍵詞近似搜索并有效返回Top-k結(jié)果.
[Abstract]:The existing RDF keyword search methods are mainly based on the large-scale RDF data graph, and the semantic information in the RDF ontology is not fully utilized, so the search efficiency and effect are not satisfactory due to the excessive number of iterations. With the help of Redis memory database cluster, a distributed RDF keyword approximate search algorithm, named DKASRN, is proposed, that is, parallel search of large-scale data is realized on distributed platform. The algorithm combines semantic information of RDF ontology to construct ontology subgraph. The semantic scoring function is used to sort the ontology subgraph, and the MapReduce computing model is used to realize the parallel search and return the Top-k result. If the returned result does not reach Top-k, the ontology subgraph is extended to generate the approximate ontology subgraph. The semantic similarity function is used to sort the approximate ontology subgraph, and the MapReduce computing model is used to realize the parallel search. The experimental results show that the DKASR algorithm can efficiently and correctly realize the approximate search of RDF keywords and return the Top-k results effectively.
【作者單位】: 福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61300104) 福建省科技擁軍基金(JG2014001) 福建省自然科學(xué)基金(2012J01168) 福州大學(xué)科技發(fā)展基金(2013-XQ-32)資助
【分類(lèi)號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊書(shū)新;徐慧琴;譚偉;;結(jié)合查詢(xún)相關(guān)性的關(guān)鍵詞查詢(xún)排序方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年09期
2 梁銀;董永權(quán);;基于對(duì)象集合的空間關(guān)鍵詞查詢(xún)[J];計(jì)算機(jī)應(yīng)用;2014年07期
3 張穎;李昕;;一種關(guān)系數(shù)據(jù)庫(kù)上的關(guān)鍵詞查詢(xún)排序方法[J];遼寧工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期
4 寇蘇玲;蔡慶生;;應(yīng)用于用戶(hù)興趣建模的多文本關(guān)鍵詞抽取研究[J];計(jì)算機(jī)仿真;2007年02期
5 林子雨;楊冬青;王騰蛟;張東站;;基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)[J];軟件學(xué)報(bào);2010年10期
6 林子雨;鄒權(quán);賴(lài)永炫;林琛;;關(guān)系數(shù)據(jù)庫(kù)中的關(guān)鍵詞查詢(xún)結(jié)果動(dòng)態(tài)優(yōu)化[J];軟件學(xué)報(bào);2014年03期
7 李慧穎;瞿裕忠;;基于關(guān)鍵詞的RDF數(shù)據(jù)查詢(xún)方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
8 楊書(shū)新;徐慧琴;;基于數(shù)據(jù)圖的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞查詢(xún)排序研究[J];計(jì)算機(jī)應(yīng)用研究;2014年02期
9 海沫;郭樹(shù)行;;網(wǎng)絡(luò)環(huán)境中基于語(yǔ)義聚類(lèi)的多關(guān)鍵詞查詢(xún)機(jī)制[J];圖書(shū)情報(bào)工作;2012年20期
10 萬(wàn)常選;鄧松;劉德喜;江騰蛟;劉喜平;;面向混合類(lèi)型關(guān)鍵詞查詢(xún)的非合作結(jié)構(gòu)化深網(wǎng)數(shù)據(jù)源選擇[J];計(jì)算機(jī)研究與發(fā)展;2014年04期
相關(guān)會(huì)議論文 前3條
1 楊艷;何天宇;;基于短語(yǔ)的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞查詢(xún)方法[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
2 李_,
本文編號(hào):1656166
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1656166.html