網(wǎng)絡(luò)POI數(shù)據(jù)增量更新技術(shù)研究
本文關(guān)鍵詞:網(wǎng)絡(luò)POI數(shù)據(jù)增量更新技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:伴隨著以位置服務(wù)為核心的“信息時(shí)代”的到來,位置服務(wù)成為學(xué)術(shù)界和產(chǎn)業(yè)界的研究熱點(diǎn);與此同時(shí),位置服務(wù)的內(nèi)容與模式正在產(chǎn)生深刻變化。利用互聯(lián)網(wǎng)改變傳統(tǒng)位置服務(wù)數(shù)據(jù)的更新模式已成為本學(xué)科發(fā)展的重要趨勢,位置服務(wù)數(shù)據(jù)的更新技術(shù)也成為各大商家競相爭奪的技術(shù)陣地。位置服務(wù)中最重要的組成部分是興趣點(diǎn)(POI),POI數(shù)據(jù)的現(xiàn)勢性直接關(guān)系到位置服務(wù)的質(zhì)量。互聯(lián)網(wǎng)中存在大量的POI數(shù)據(jù)資源,因此利用互聯(lián)網(wǎng)更新POI數(shù)據(jù)是一種切實(shí)可行的方法。但是,互聯(lián)網(wǎng)中的POI存在結(jié)構(gòu)多樣化、類型繁雜、有效信息缺失等問題,給數(shù)據(jù)的更新帶來很大的困難。有效地更新POI數(shù)據(jù)庫,實(shí)現(xiàn)多源POI信息的在線獲取、地址標(biāo)準(zhǔn)化以及匹配更新,可以滿足公眾對位置服務(wù)的多樣化要求。這不僅為推動(dòng)我國位置服務(wù)進(jìn)入內(nèi)容豐富、服務(wù)精準(zhǔn)和便捷高效的新階段提供了技術(shù)支持,也促進(jìn)“信息時(shí)代”整體服務(wù)水平。針對網(wǎng)絡(luò)POI數(shù)據(jù)增量的更新問題,研究內(nèi)容主要包括以下幾方面:(1)網(wǎng)絡(luò)POI數(shù)據(jù)采集與預(yù)處理。在網(wǎng)頁數(shù)據(jù)獲取技術(shù)的基礎(chǔ)上,從通用網(wǎng)絡(luò)爬蟲入手,通過分析垂直網(wǎng)頁和各類地圖服務(wù)應(yīng)用的結(jié)構(gòu)特點(diǎn),設(shè)計(jì)了網(wǎng)絡(luò)爬蟲算法,對網(wǎng)絡(luò)上的POI數(shù)據(jù)進(jìn)行爬取。同時(shí),對爬取下來的數(shù)據(jù)進(jìn)行預(yù)處理,去除格式、內(nèi)容有問題的數(shù)據(jù),并對數(shù)據(jù)進(jìn)行單元網(wǎng)格的劃分,選取一定數(shù)量的控制點(diǎn)和檢驗(yàn)點(diǎn),糾正來源于不同網(wǎng)頁數(shù)據(jù)的坐標(biāo),使其具有同一坐標(biāo)系。(2)基于空間約束關(guān)系的POI地址標(biāo)準(zhǔn)化方法。為了提高POI數(shù)據(jù)增量更新時(shí)同名實(shí)體識(shí)別的準(zhǔn)確性,需要首先對地址進(jìn)行標(biāo)準(zhǔn)化處理,使新增的地址與已有POI數(shù)據(jù)的地址具有相同的數(shù)據(jù)結(jié)構(gòu)。本文提出一種基于空間約束關(guān)系的地名地址標(biāo)準(zhǔn)化方法。通過分析POI作為點(diǎn)狀地物與其他地物的空間約束關(guān)系,從而選取特定的參考地物對待標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行地址標(biāo)準(zhǔn)化處理。(3)基于加權(quán)的多屬性相似度匹配更新方法。針對地址標(biāo)準(zhǔn)化處理后的POI數(shù)據(jù),本文提出一種加權(quán)的多屬性相似度匹配方法,分析POI數(shù)據(jù)名稱、地址、經(jīng)緯度的匹配算法,計(jì)算相似度并分配權(quán)重,過濾掉相似度高的數(shù)據(jù),將剩余數(shù)據(jù)更新至數(shù)據(jù)庫,最終實(shí)現(xiàn)網(wǎng)絡(luò)POI數(shù)據(jù)增量更新。實(shí)驗(yàn)結(jié)果表明,本文提出的地址標(biāo)準(zhǔn)化方法具有較高的地址標(biāo)準(zhǔn)化準(zhǔn)確率,同時(shí),基于加權(quán)的多屬性相似度POI匹配方法也可以有效地完成POI數(shù)據(jù)增量的更新。
【關(guān)鍵詞】:POI 增量更新 地址標(biāo)準(zhǔn)化 相似度匹配
【學(xué)位授予單位】:蘭州交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:P208
【目錄】:
- 摘要4-6
- Abstract6-10
- 1 緒論10-16
- 1.1 研究背景及意義10-11
- 1.1.1 研究背景10
- 1.1.2 研究意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-14
- 1.2.1 同名要素匹配研究現(xiàn)狀11-12
- 1.2.2 空間數(shù)據(jù)更新研究現(xiàn)狀12-14
- 1.3 主要研究內(nèi)容14-15
- 1.4 論文組織結(jié)構(gòu)15-16
- 2 相關(guān)理論基礎(chǔ)16-26
- 2.1 網(wǎng)頁數(shù)據(jù)獲取技術(shù)16-19
- 2.1.1 搜索引擎原理16-17
- 2.1.2 網(wǎng)絡(luò)爬蟲原理17
- 2.1.3 網(wǎng)絡(luò)爬蟲搜索策略17-19
- 2.2 地名地址標(biāo)準(zhǔn)化技術(shù)19-21
- 2.2.1 錯(cuò)誤地址類型19-20
- 2.2.2 標(biāo)準(zhǔn)地址模型20-21
- 2.3 POI數(shù)據(jù)融合技術(shù)21-25
- 2.3.1 基于空間位置的POI融合技術(shù)21-24
- 2.3.2 基于非空間特征屬性的POI融合技術(shù)24-25
- 2.4 本章小結(jié)25-26
- 3 網(wǎng)絡(luò)POI數(shù)據(jù)的采集與預(yù)處理26-36
- 3.1 網(wǎng)絡(luò)POI數(shù)據(jù)研究區(qū)域26
- 3.2 網(wǎng)絡(luò)POI數(shù)據(jù)的采集26-28
- 3.3 網(wǎng)絡(luò)POI數(shù)據(jù)的預(yù)處理28-35
- 3.3.1 網(wǎng)絡(luò)POI數(shù)據(jù)的分類28-29
- 3.3.2 原始POI數(shù)據(jù)概況29-30
- 3.3.3 POI數(shù)據(jù)清洗30-32
- 3.3.4 POI數(shù)據(jù)的坐標(biāo)糾正32-35
- 3.4 本章小結(jié)35-36
- 4 基于空間約束關(guān)系的POI地址標(biāo)準(zhǔn)化36-44
- 4.1 POI空間約束關(guān)系的計(jì)算37-40
- 4.1.1 POI與點(diǎn)狀參考地物空間約束關(guān)系計(jì)算37-38
- 4.1.2 POI與線狀參考地物空間約束關(guān)系計(jì)算38-39
- 4.1.3 POI與面狀參考地物空間約束關(guān)系計(jì)算39-40
- 4.2 POI地址標(biāo)準(zhǔn)化40-43
- 4.2.1 基于共點(diǎn)空間約束關(guān)系的地址標(biāo)準(zhǔn)化40
- 4.2.2 基于共線空間約束關(guān)系的地址標(biāo)準(zhǔn)化40-42
- 4.2.3 基于共面空間約束關(guān)系的地址標(biāo)準(zhǔn)化42
- 4.2.4 多種空間關(guān)系協(xié)作式的地址標(biāo)準(zhǔn)化42-43
- 4.3 本章小結(jié)43-44
- 5 網(wǎng)絡(luò)POI數(shù)據(jù)增量更新技術(shù)44-49
- 5.1 基于名稱相似度的POI匹配44-45
- 5.2 基于中文地址相似度的POI匹配45-46
- 5.3 基于空間位置相似度的POI匹配46-47
- 5.4 基于加權(quán)的多屬性相似度POI匹配更新47-48
- 5.5 本章小結(jié)48-49
- 6 實(shí)驗(yàn)與分析49-53
- 6.1 網(wǎng)絡(luò)POI數(shù)據(jù)的獲取軟件49
- 6.2 POI地名地址標(biāo)準(zhǔn)化實(shí)驗(yàn)與分析49-52
- 6.3 POI數(shù)據(jù)更新實(shí)驗(yàn)與分析52
- 6.4 本章小結(jié)52-53
- 7 結(jié)論與展望53-54
- 致謝54-55
- 參考文獻(xiàn)55-60
- 攻讀學(xué)位期間的研究成果60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李偉;陳毓芬;李萌;錢凌韜;方瀟;;基于情境的POI個(gè)性化推薦方法研究[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2015年06期
2 禹文豪;艾廷華;;核密度估計(jì)法支持下的網(wǎng)絡(luò)空間POI點(diǎn)可視化與分析[J];測繪學(xué)報(bào);2015年01期
3 亢孟軍;杜清運(yùn);王明軍;;地址樹模型的中文地址提取方法[J];測繪學(xué)報(bào);2015年01期
4 呂歡歡;宋偉東;;多元地址要素組合的地址匹配方法[J];測繪科學(xué);2015年03期
5 魏金明;仲偉政;;基于置信度的地址匹配方法初探[J];測繪科學(xué);2015年01期
6 張巍;高新院;李瑞姍;;空間位置信息的多源POI數(shù)據(jù)融合[J];中國海洋大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年07期
7 陳瑞;劉紀(jì)平;王勇;羅安;;一種自動(dòng)提取控制點(diǎn)的多源興趣點(diǎn)位置糾正方法[J];測繪科學(xué);2014年05期
8 邢廷炎;陶留鋒;繆謹(jǐn)勵(lì);何貞銘;;POI數(shù)據(jù)Wiki更新模式研究與實(shí)踐[J];測繪通報(bào);2014年04期
9 劉經(jīng)南;方媛;郭遲;高柯夫;;位置大數(shù)據(jù)的分析處理研究進(jìn)展[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年04期
10 王席席;李云嶺;;地名地址數(shù)據(jù)中興趣點(diǎn)的建設(shè)研究[J];地理信息世界;2013年05期
本文關(guān)鍵詞:網(wǎng)絡(luò)POI數(shù)據(jù)增量更新技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):299653
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/299653.html