基于地理本體的同名實體匹配技術(shù)研究
發(fā)布時間:2017-05-02 15:01
本文關(guān)鍵詞:基于地理本體的同名實體匹配技術(shù)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:為了全面查實查清全國土地的使用狀況,及時掌握真實準確的土地基礎(chǔ)數(shù)據(jù)信息,建立并完善土地統(tǒng)計、登記制度,實現(xiàn)土地數(shù)據(jù)資源信息的社會化信息化服務,滿足國土資源管理以及經(jīng)濟社會發(fā)展的需要,在實際工作中我們常常需要對土地數(shù)據(jù)隨時進行整合與更新。然而土地數(shù)據(jù)及地理信息系統(tǒng)數(shù)據(jù)與普通的圖書管理系統(tǒng)數(shù)據(jù)、學生選課等系統(tǒng)中的數(shù)據(jù)不同,地理信息系統(tǒng)數(shù)據(jù)需要包含空間關(guān)系、屬性關(guān)系、時間關(guān)系,所以在整合過程中遠遠比別的數(shù)據(jù)要更加復雜。 目前對于地理空間數(shù)據(jù)的整合和更新已經(jīng)成為國際地理信息系統(tǒng)科學的前沿課題,在對數(shù)據(jù)進行更新的過程中,我們經(jīng)常會用新獲取到的地理空間數(shù)據(jù)對舊的地理數(shù)據(jù)進行更新。在對地理空間數(shù)據(jù)進行整合和更新的過程中,同名實體匹配技術(shù)起了非常重要的作用,匹配結(jié)果的好壞會直接影響到數(shù)據(jù)整合與更新的結(jié)果,同名實體匹配技術(shù)就是要對不同的空間數(shù)據(jù)集進行匹配,通過尋找進行匹配的目標實體對,進而來對不同的空間數(shù)據(jù)集進行整合與更新。目前,國際上已提出了許多種同名實體匹配方法,但這些方法在一定程度上都有一定的缺點和不足。本文利用本體在語義匹配方面的優(yōu)勢,把本體加入到同名實體匹配過程中,在構(gòu)建本體的過程中,加入了空間數(shù)據(jù)的空間關(guān)系,并且把標準的分層方式加入到本體構(gòu)建的過程中,很好的解決了空間數(shù)據(jù)語義異構(gòu)的問題。通過對同名實體匹配的相關(guān)理論算法的研究,對同名實體的語義匹配進行了探討。主要工作和創(chuàng)新如下: 1)對空間數(shù)據(jù)的特點,空間數(shù)據(jù)的差異性來源進行了探討;對同名實體匹配的定義,同名實體匹配的匹配過程進行了研究。 2)對地理本體的空間特征進行了研究,并在構(gòu)建地理本體過程中加入其空間特征,并且把構(gòu)建好的地理本體應用到同名實體匹配技術(shù)中來。 3)以往同名實體匹配技術(shù)由于只是通過簡單疊加,然后依據(jù)精度高的原則移除疊加后邊界的不一致性,易造成由于數(shù)據(jù)基礎(chǔ)不一致,最終導致同名實體錯誤匹配。本文針對以往同名實體匹配技術(shù)的缺陷,在構(gòu)建地理本體和封裝本體屬性的基礎(chǔ)上,提出了一種通過屬性相似度進行同名實體匹配的方法,通過實驗證明了該方法有較好的同名實體匹配結(jié)果,并能提高查詢檢索效率,方便數(shù)據(jù)管理和實現(xiàn)數(shù)據(jù)共享。
【關(guān)鍵詞】:異構(gòu)數(shù)據(jù) 地理本體 實體匹配 本體 本體構(gòu)建
【學位授予單位】:太原理工大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:P208
【目錄】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 緒論10-18
- 1.1 論文研究的背景及意義10-15
- 1.1.1 地理信息系統(tǒng)簡介10-11
- 1.1.2 研究背景11-13
- 1.1.3 研究意義13-14
- 1.1.4 地理本體研究意義14-15
- 1.2 同名實體匹配的國內(nèi)外研究現(xiàn)狀15-16
- 1.2.1 國內(nèi)研究現(xiàn)狀15
- 1.2.2 國外研究現(xiàn)狀15-16
- 1.3 論文研究內(nèi)容和組織結(jié)構(gòu)16-18
- 1.3.1 研究內(nèi)容16-17
- 1.3.2 組織結(jié)構(gòu)17-18
- 第二章 同名實體匹配技術(shù)基本理論18-28
- 2.1 空間數(shù)據(jù)概述18-22
- 2.1.1 數(shù)據(jù)的空間性18-20
- 2.1.2 數(shù)據(jù)的時間性20
- 2.1.3 數(shù)據(jù)的屬性20-22
- 2.2 空間異構(gòu)數(shù)據(jù)源異構(gòu)特點22-23
- 2.3 同名實體匹配技術(shù)23-28
- 2.3.1 定義23
- 2.3.2 導致同名實體匹配問題的原因23
- 2.3.3 同名實體匹配的意義23-25
- 2.3.4 同名實體匹配方法25-28
- 第三章 地理本體的應用現(xiàn)狀28-36
- 3.1 引言28
- 3.2 地理本體的研究內(nèi)容和特性28-29
- 3.3 地理本體的結(jié)構(gòu)29-30
- 3.3.1 地理概念描述30
- 3.3.2 關(guān)系描述30
- 3.3.3 實例描述30
- 3.3.4 公理描述30
- 3.4 地理本體的構(gòu)建語言30
- 3.5 地理本體的空間特征30-36
- 3.5.1 拓撲關(guān)系31-32
- 3.5.2 方位關(guān)系32-33
- 3.5.3 距離關(guān)系33
- 3.5.4 本體映射關(guān)系33-36
- 第四章 地理本體的構(gòu)建與同名實體匹配36-46
- 4.1 地理本體的屬性特征36-38
- 4.2 地理本體的構(gòu)建步驟38-40
- 4.3 地理本體的構(gòu)建40-44
- 4.4 實體匹配算法設(shè)計44-46
- 4.4.1 數(shù)字型數(shù)據(jù)45
- 4.4.2 字符型數(shù)據(jù)45-46
- 第五章 實驗與結(jié)果分析46-52
- 5.1 數(shù)據(jù)結(jié)構(gòu)46-47
- 5.2 屬性數(shù)據(jù)的編碼47-48
- 5.2.1 編碼原則47-48
- 5.3 實驗設(shè)計48-50
- 5.4 數(shù)據(jù)分析50-52
- 第六章 總結(jié)與展望52-54
- 6.1 論文總結(jié)52-53
- 6.2 工作展望53-54
- 參考文獻54-58
- 致謝58-60
- 攻讀學位期間發(fā)表的學術(shù)論文目錄60
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 李德仁,朱欣焰,龔健雅;從數(shù)字地圖到空間信息網(wǎng)格——空間信息多級網(wǎng)格理論思考[J];武漢大學學報(信息科學版);2003年06期
2 黃茂軍,杜清運,杜曉初;地理本體空間特征的形式化表達機制研究[J];武漢大學學報(信息科學版);2005年04期
本文關(guān)鍵詞:基于地理本體的同名實體匹配技術(shù)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:341140
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/341140.html
最近更新
教材專著