面向領域本體的主題搜索服務研究
本文選題:領域本體 切入點:搜索服務 出處:《華東交通大學》2012年碩士論文 論文類型:學位論文
【摘要】:互聯(lián)網(wǎng)已是我們生活中密不可分的重要工具。為了滿足用戶對網(wǎng)上信息資源的獲取,各種搜索引擎應運而生,如Google和百度等。但是隨著信息急劇膨脹以及信息多元化的發(fā)展,傳統(tǒng)搜索引擎的索引查詢內容不斷擴大。在檢索結果中,用戶不得不在大量的失效信息、甚至垃圾信息中費力尋找。因此,搜索引擎正向著專業(yè)化、個性化、智能化的方向發(fā)展。面向領域本體的主題搜索服務成為信息搜索的發(fā)展趨勢。 主題搜索服務可保證領域信息的完全收錄與及時更新,避免了搜索時強大的“噪音”,提高了查詢效率。為了描述領域的知識結構,有多種表示形式,比較流行的做法采用本體來描述。本文首先對本體的相關知識進行概述,介紹本體的定義,構成,分類,描述語言以及構建本體原則、方法和常用的本體編輯工具。選取通信行業(yè)作為主題領域,根據(jù)其概念和術語,通過本體編輯工具protégé建立本體模型。根據(jù)搜索服務的結構和分類,,提出面向領域本體的主題搜索服務體系結構模型。對領域本體的構建、搜索服務的信息處理,主題爬蟲的設計,索引的建立等做了深入細致地分析。在此基礎上,利用本體模型,設計出滿足用戶需求的查詢接口,實現(xiàn)對用戶查詢關鍵詞的標準化處理以及擴展查詢,提高搜索服務的查準率和查全率。
[Abstract]:The Internet has become an important tool in our life. In order to satisfy users' access to online information resources, various search engines, such as Google and Baidu, came into being. However, with the rapid expansion of information and the development of information diversification, In the search results, users have to find a lot of invalid information, even spam information. Therefore, the search engine is becoming professional and personalized. The subject search service for domain ontology has become the trend of information search. The topic search service can ensure the complete collection and timely updating of domain information, avoid the powerful "noise" in the search, and improve the query efficiency. In order to describe the knowledge structure of the domain, there are many forms of representation. In this paper, the definition, constitution, classification, description language and principles of ontology are introduced. Methods and commonly used ontology editing tools. According to the concept and terminology of communication industry, the ontology model is established by prot 茅 g 茅. According to the structure and classification of the search service, the ontology model is established by using the ontology editing tool, prot 茅 g 茅, according to the structure and classification of the search service. The architecture model of domain ontology oriented subject search service is put forward. The construction of domain ontology, the information processing of search service, the design of topic crawler and the establishment of index are analyzed in detail. By using ontology model, a query interface is designed to meet the needs of users. The standard processing of user query keywords and the expansion of query are realized, and the recall rate and recall rate of search service are improved.
【學位授予單位】:華東交通大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前10條
1 郎鳳舉;;HTMLParser提取網(wǎng)頁超鏈接研究[J];電腦編程技巧與維護;2010年02期
2 譚月輝;肖冰;陳建泗;齊京禮;李志勇;;Jena推理機制及應用研究[J];河北省科學院學報;2009年04期
3 任寧;;XML技術研究[J];黑龍江科技信息;2010年18期
4 陳堯清;薛建武;崔璇;;一種異步本體系統(tǒng)的實現(xiàn)框架[J];計算機應用研究;2009年02期
5 黃穎;黃治平;;HtmIParser提取網(wǎng)頁信息的設計與實現(xiàn)[J];江西理工大學學報;2007年06期
6 張盛蕾;;基于Lucene的校園網(wǎng)搜索引擎的設計與實現(xiàn)[J];華章;2011年06期
7 魏毅峰;張亮;;基于本體的搜索引擎模型設計[J];軟件導刊;2010年07期
8 陳丹;郭偉青;;信息搜索引擎綜述及系統(tǒng)架構設計[J];商場現(xiàn)代化;2008年03期
9 劉靜;;改進潛在語義索引的個性化搜索引擎的設計[J];蘇州市職業(yè)大學學報;2010年02期
10 王曉盈;王曉璇;劉鵬;;中文本體構建及可視化研究[J];計算機技術與發(fā)展;2010年02期
相關碩士學位論文 前10條
1 李永春;主題搜索引擎的研究與實現(xiàn)[D];哈爾濱理工大學;2010年
2 蒲宇達;基于web的網(wǎng)頁鏈接與正文抽取技術研究[D];哈爾濱工業(yè)大學;2006年
3 秦嘉偉;基于本體的信息檢索方法研究[D];上海交通大學;2007年
4 孫煒;基于語義網(wǎng)技術的主題搜索引擎原型研究及其在電子政務領域的應用[D];北京交通大學;2008年
5 馮斌;基于Lucene小型搜索引擎的研究與實現(xiàn)[D];武漢理工大學;2008年
6 黃華勇;奧運競技體育項目技戰(zhàn)術分析知識庫的研究與實現(xiàn)[D];南京理工大學;2008年
7 吳建強;垂直搜索引擎爬蟲系統(tǒng)的研究與實現(xiàn)[D];貴州大學;2008年
8 趙永平;面向特定領域的主題搜索技術研究[D];哈爾濱工程大學;2008年
9 藍雪燕;基于Ontology的信息搜索技術研究與實現(xiàn)[D];天津大學;2009年
10 毛鑫;基于本體的語義信息集成與知識發(fā)現(xiàn)研究[D];華北電力大學(北京);2010年
本文編號:1643466
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1643466.html