分布式RDF關(guān)鍵詞近似搜索方法
本文選題:RDF 切入點(diǎn):關(guān)鍵詞 出處:《中國科學(xué)技術(shù)大學(xué)學(xué)報(bào)》2017年10期
【摘要】:現(xiàn)有的RDF關(guān)鍵詞搜索方法主要是在大規(guī)模的RDF數(shù)據(jù)圖上直接進(jìn)行搜索,未能充分利用RDF本體中的語義信息,迭代次數(shù)過多造成搜索效率和效果不理想.針對這些問題,借助Redis內(nèi)存數(shù)據(jù)庫集群,提出分布式RDF關(guān)鍵詞近似搜索算法(DKASR),即在分布式平臺(tái)上實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的并行搜索.算法結(jié)合RDF本體的語義信息構(gòu)建本體子圖,利用語義評分函數(shù)對本體子圖進(jìn)行排序,借助MapReduce計(jì)算模型實(shí)現(xiàn)并行搜索并返回Top-k結(jié)果;如果返回的結(jié)果沒有達(dá)到Top-k,則對本體子圖進(jìn)行擴(kuò)展生成近似本體子圖,使用語義相似度函數(shù)對近似本體子圖進(jìn)行排序,再利用MapReduce計(jì)算模型實(shí)現(xiàn)并行搜索,直到返回Top-k結(jié)果.實(shí)驗(yàn)結(jié)果表明,DKASR算法能夠高效正確地實(shí)現(xiàn)RDF關(guān)鍵詞近似搜索并有效返回Top-k結(jié)果.
[Abstract]:The existing RDF keyword search methods are mainly based on the large-scale RDF data graph, and the semantic information in the RDF ontology is not fully utilized, so the search efficiency and effect are not satisfactory due to the excessive number of iterations. With the help of Redis memory database cluster, a distributed RDF keyword approximate search algorithm, named DKASRN, is proposed, that is, parallel search of large-scale data is realized on distributed platform. The algorithm combines semantic information of RDF ontology to construct ontology subgraph. The semantic scoring function is used to sort the ontology subgraph, and the MapReduce computing model is used to realize the parallel search and return the Top-k result. If the returned result does not reach Top-k, the ontology subgraph is extended to generate the approximate ontology subgraph. The semantic similarity function is used to sort the approximate ontology subgraph, and the MapReduce computing model is used to realize the parallel search. The experimental results show that the DKASR algorithm can efficiently and correctly realize the approximate search of RDF keywords and return the Top-k results effectively.
【作者單位】: 福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院;
【基金】:國家自然科學(xué)基金(61300104) 福建省科技擁軍基金(JG2014001) 福建省自然科學(xué)基金(2012J01168) 福州大學(xué)科技發(fā)展基金(2013-XQ-32)資助
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊書新;徐慧琴;譚偉;;結(jié)合查詢相關(guān)性的關(guān)鍵詞查詢排序方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年09期
2 梁銀;董永權(quán);;基于對象集合的空間關(guān)鍵詞查詢[J];計(jì)算機(jī)應(yīng)用;2014年07期
3 張穎;李昕;;一種關(guān)系數(shù)據(jù)庫上的關(guān)鍵詞查詢排序方法[J];遼寧工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期
4 寇蘇玲;蔡慶生;;應(yīng)用于用戶興趣建模的多文本關(guān)鍵詞抽取研究[J];計(jì)算機(jī)仿真;2007年02期
5 林子雨;楊冬青;王騰蛟;張東站;;基于關(guān)系數(shù)據(jù)庫的關(guān)鍵詞查詢[J];軟件學(xué)報(bào);2010年10期
6 林子雨;鄒權(quán);賴永炫;林琛;;關(guān)系數(shù)據(jù)庫中的關(guān)鍵詞查詢結(jié)果動(dòng)態(tài)優(yōu)化[J];軟件學(xué)報(bào);2014年03期
7 李慧穎;瞿裕忠;;基于關(guān)鍵詞的RDF數(shù)據(jù)查詢方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
8 楊書新;徐慧琴;;基于數(shù)據(jù)圖的關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢排序研究[J];計(jì)算機(jī)應(yīng)用研究;2014年02期
9 海沫;郭樹行;;網(wǎng)絡(luò)環(huán)境中基于語義聚類的多關(guān)鍵詞查詢機(jī)制[J];圖書情報(bào)工作;2012年20期
10 萬常選;鄧松;劉德喜;江騰蛟;劉喜平;;面向混合類型關(guān)鍵詞查詢的非合作結(jié)構(gòu)化深網(wǎng)數(shù)據(jù)源選擇[J];計(jì)算機(jī)研究與發(fā)展;2014年04期
相關(guān)會(huì)議論文 前3條
1 楊艷;何天宇;;基于短語的關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢方法[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
2 李_,
本文編號(hào):1656166
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1656166.html