基于Hadoop的物聯(lián)網(wǎng)(WoT)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)
本文選題:規(guī)則推理 切入點(diǎn):查詢擴(kuò)展 出處:《北京郵電大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:感知設(shè)備的搜索是物聯(lián)網(wǎng)發(fā)展道路上的關(guān)鍵一環(huán),是物聯(lián)網(wǎng)應(yīng)用的前提,目前尚未有成熟的解決方案,而面向互聯(lián)網(wǎng)的傳統(tǒng)搜索引擎技術(shù)卻已相當(dāng)成熟,重用這些技術(shù),對(duì)發(fā)展物聯(lián)網(wǎng)搜索無疑是一種助力。另外,開源分布式計(jì)算平臺(tái)Hadoop憑借易擴(kuò)展、海量數(shù)據(jù)存儲(chǔ)和超強(qiáng)計(jì)算能力被產(chǎn)業(yè)界和學(xué)術(shù)界視為大數(shù)據(jù)處理最重要的工具,除此之外,Hadoop可以被廣泛地部署于廉價(jià)PC之上,能夠降低生產(chǎn)成本。在此背景之下,本課題設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)“基于Hadoop的物聯(lián)網(wǎng)(WoT)搜索引擎”,它含有查詢擴(kuò)展模塊和分布式倒排索引系統(tǒng)兩個(gè)核心組成部分。本課題研究工作的主要內(nèi)容如下:為了克服傳統(tǒng)搜索引擎技術(shù)基于關(guān)鍵詞進(jìn)行機(jī)械式地符號(hào)匹配所帶來的查全率低下的問題,查詢擴(kuò)展模塊中引用一個(gè)已有的物聯(lián)網(wǎng)領(lǐng)域本體,并對(duì)其進(jìn)行基于規(guī)則的語義推理,獲取本體中的隱含信息,完成對(duì)本體的擴(kuò)充,依據(jù)推理之后的本體進(jìn)行查詢擴(kuò)展。著重研究了本體相關(guān)理論、基于規(guī)則的本體推理以及Jena推理機(jī),構(gòu)建了用于本體推理的規(guī)則庫,給出了一種基于本體的查詢擴(kuò)展算法。分布式倒排索引系統(tǒng)采用的是按文檔劃分的局部倒排索引組織策略。著重研究了面向互聯(lián)網(wǎng)的傳統(tǒng)搜索引擎的工作原理、HDFS、MapReduce、開源核心搜索庫Lucene以及分布式倒排索引的兩種組織策略。為了體現(xiàn)物聯(lián)網(wǎng)搜索應(yīng)該具有的空間特性,課題增加了一個(gè)基于距離的搜索結(jié)果排序模塊;诒倔w的查詢擴(kuò)展模塊、分布式倒排索引系統(tǒng)、基于距離的搜索結(jié)果排序模塊以及用戶查詢接口共同構(gòu)成了完整的WoT搜索引擎。最后,通過測試證明了課題方案的可行性及有效性。
[Abstract]:Perception device search is a key link in the development of the Internet of things, is the premise of the Internet of things application, there is no mature solution, but the traditional search engine technology for the Internet has been quite mature, reuse these technologies, In addition, Hadoop, an open source distributed computing platform, is regarded by industry and academia as the most important tool to deal with by big data because of its easy expansion, massive data storage and super computing power. In addition, Hadoop can be widely deployed on cheap PCs and reduce production costs. This paper designs and implements a "Internet of things (IoT) search engine based on Hadoop", which contains two core components: query extension module and distributed inverted index system. The main contents of this research work are as follows:. To overcome the problem of low recall caused by traditional search engine technology based on keywords for mechanical symbol matching, In the query extension module, an existing ontology of the Internet of things is referenced, and the semantic reasoning based on rules is carried out to obtain the implicit information in the ontology to complete the extension of the ontology. Based on the query extension of ontology after reasoning, this paper focuses on the ontology theory, rule-based ontology reasoning and Jena inference engine, and constructs a rule base for ontology reasoning. This paper presents a query extension algorithm based on ontology. The distributed inverted index system adopts the local inverted index organization strategy according to documents. The working principle of traditional search engine for Internet is studied emphatically. Open source core search library Lucene and two organizational strategies for distributed inverted indexes. In this paper, a distance based search result sorting module is added. The query extension module based on ontology and the distributed inverted index system are introduced. The search result sorting module based on distance and the user query interface constitute the complete WoT search engine. Finally, the feasibility and effectiveness of the project are proved by testing.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3;TP391.44;TN929.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張?zhí)m芳;年梅;李芳;;信息查詢擴(kuò)展發(fā)展研究[J];計(jì)算機(jī)時(shí)代;2015年11期
2 楊成龍;李德識(shí);;面向物聯(lián)網(wǎng)的傳感器實(shí)體搜索系統(tǒng)[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年10期
3 于海寧;張宏莉;方濱興;余翔湛;;物聯(lián)網(wǎng)中物理實(shí)體搜索服務(wù)的研究[J];電信科學(xué);2012年10期
4 紀(jì)兆輝;;本體的查詢與推理研究[J];微電子學(xué)與計(jì)算機(jī);2011年10期
5 王智;潘強(qiáng);邢濤;;面向物聯(lián)網(wǎng)的實(shí)體實(shí)時(shí)搜索服務(wù)綜述[J];計(jì)算機(jī)應(yīng)用研究;2011年06期
6 譚月輝;肖冰;陳建泗;齊京禮;李志勇;;Jena推理機(jī)制及應(yīng)用研究[J];河北省科學(xué)院學(xué)報(bào);2009年04期
7 梁曄;劉宏哲;;運(yùn)用Jena對(duì)本體模型進(jìn)行推理及其應(yīng)用[J];北京聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
8 何琳;杜慧平;侯漢清;;一種基于領(lǐng)域本體的語義檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];圖書情報(bào)工作;2008年08期
9 黃名選;嚴(yán)小衛(wèi);張師超;;查詢擴(kuò)展技術(shù)進(jìn)展與展望[J];計(jì)算機(jī)應(yīng)用與軟件;2007年11期
10 徐德智;汪智勇;王斌;;當(dāng)前主要本體推理工具的比較分析與研究[J];現(xiàn)代圖書情報(bào)技術(shù);2006年12期
相關(guān)博士學(xué)位論文 前1條
1 王進(jìn);基于本體的語義信息檢索研究[D];中國科學(xué)技術(shù)大學(xué);2006年
相關(guān)碩士學(xué)位論文 前5條
1 何葦;搜索引擎中查詢擴(kuò)展模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2014年
2 孫婷婷;物聯(lián)網(wǎng)語義搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
3 楊春輝;面向汽車主題的垂直搜索引擎相關(guān)技術(shù)的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2014年
4 王磊;基于本體的語義全文檢索系統(tǒng)的研究[D];哈爾濱工程大學(xué);2013年
5 王文聰;基于本體的知識(shí)庫語義擴(kuò)展搜索方法的研究與實(shí)現(xiàn)[D];北京化工大學(xué);2012年
,本文編號(hào):1609904
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1609904.html