天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于網(wǎng)絡爬蟲的地理信息獲取技術的研究

發(fā)布時間:2019-09-03 10:26
【摘要】:隨著計算機網(wǎng)絡技術和地理信息技術的迅猛發(fā)展,地理信息數(shù)據(jù)作為一種重要的基礎信息數(shù)據(jù)資源,使其不僅在城市規(guī)劃、交通導航、災害監(jiān)測、國防軍事等國家建設領域得到了廣泛的運用,而且,與人們的日常生活聯(lián)系的也越來越緊密。特別是Google向公眾推出了基于空間位置服務(Location Based Services, LBS)用戶體驗之后,給人們的工作和生活帶來了很大的便利。地理信息數(shù)據(jù)在促進國家經(jīng)濟社會發(fā)展,給人們?nèi)粘I詈凸ぷ鲙砗艽蟊憷耐瑫r,同樣也有一些亟待解決的問題。其中比較突出的是地理信息獲取問題,傳統(tǒng)的地理信息獲取主要通過實地測繪和遙感等手段,這些方法都存在著成本高、精度低、無法實時更新等弊端。同時,網(wǎng)絡地理空間的虛擬性、共享性、無國界性等特點,特別是現(xiàn)在網(wǎng)絡中散布著很多地理信息數(shù)據(jù),這都為地理信息獲取提出了一種新的途徑和來源,研究如何從網(wǎng)絡中獲取地理信息數(shù)據(jù)具有重要意義。本文主要研究了從網(wǎng)絡中獲取地理信息數(shù)據(jù)的關鍵技術。分別針對文本、柵格等不同類型的地理信息數(shù)據(jù)提出了不同的獲取方法。對于文本地理信息數(shù)據(jù)獲取技術,主要通過網(wǎng)絡爬蟲(Web Crawler)技術來獲取,本文重點研究了多種網(wǎng)絡爬蟲算法,將基于內(nèi)容的Shark Search算法和基于鏈接的HITS算法相結(jié)合,提出一種新的網(wǎng)絡爬蟲算法,即SS-HITS算法,該算法不但可以減少基于內(nèi)容算法的局部性問題和基于鏈接算法的主題漂移現(xiàn)象,而且提高了網(wǎng)絡爬蟲的頁面回調(diào)率、查準率和主題相關度。對于柵格地理信息數(shù)據(jù)獲取技術,本文主要通過分析其投影方式、數(shù)據(jù)組織和管理模型等關鍵技術,提出了一種柵格地理信息獲取方案,通過該方案可以獲取全球范圍高精度的柵格地理信息數(shù)據(jù);另外,本文還提出了一種地圖拼接、漫游和縮放算法,該算法不僅可以將獲取到的柵格地理信息數(shù)據(jù)拼接成完整的影像地圖,而且拼接后的地圖還支持地圖漫游和地圖縮放功能。
【圖文】:

應用程序接口,數(shù)據(jù)查詢,拓撲空間,編程功能


據(jù)GIS里面的數(shù)據(jù)進行數(shù)據(jù)查詢和分析,比如拓撲空間查詢、地形分模型等。逡逑息系統(tǒng)具有空間地理信息數(shù)據(jù)查詢和分析的能力,可以根據(jù)用戶需求間拓撲關系查詢、建立高程模型等。逡逑開發(fā)和編程功能逡逑息系統(tǒng)一般都通過提供應用程序接口(API)的形式來為用戶提供二可以通過這些應用程序接口來調(diào)用地理信息系統(tǒng)的服務,來開發(fā)其領應用程序。逡逑據(jù)組織與結(jié)構逡逑理信息數(shù)據(jù)作為地理信息系統(tǒng)的重要組成部分,地理信息系統(tǒng)的重要數(shù)據(jù)的采集、分析、存儲和加工,地理空間數(shù)據(jù)是對地球表面自然、數(shù)據(jù)的抽象化描述。逡逑

序列,網(wǎng)絡爬蟲,基本原理,隊列


2.2.2網(wǎng)絡爬蟲的體系結(jié)構逡逑如圖2.5所示,,圖中描繪了通用網(wǎng)絡爬蟲的體系結(jié)構,通用網(wǎng)絡爬蟲涉及到的數(shù)據(jù)逡逑結(jié)構主要包括初始化URL隊列、待抓。眨遥剃犃、解析出來URL隊列等,并且,通逡逑用網(wǎng)絡爬蟲的體系結(jié)構一般包括以下幾個模塊:逡逑1)初始化模塊逡逑初始化模塊主要完成對于給定的初始化URL序列,將初始化URL隊列中的URL逡逑加入到待抓。眨遥剃犃兄,為進一步抓。祝澹忭撁孀鰷蕚。逡逑2)邐Web頁面獲取模塊逡逑Web頁面獲取模塊主要完成下載待抓。眨遥剃犃兄校眨遥虒模祝澹忭撁。該模逡逑塊首先按照隊列先進先出的順序從待抓取URL隊列中取出URL,并且調(diào)用DNS服務將逡逑URL解析成IP地址,訪問IP地址對應的服務器,將URL對應的Web頁面下載到本地。逡逑3)邐Web頁面解析模塊逡逑Web頁面解析模塊主要功能是對下載到本地的Web頁面進行解析,解析出Web頁逡逑
【學位授予單位】:哈爾濱工程大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:P208;TP391.1

【參考文獻】

相關期刊論文 前10條

1 俞鍵;俞曉松;江玉成;;配電線路智能巡檢系統(tǒng)web離線地圖的技術研究[J];通信電源技術;2015年02期

2 閆佳;閆楓;;基于XNA的地理信息系統(tǒng)的研究與實現(xiàn)[J];測繪與空間地理信息;2014年11期

3 喻依;甘若迅;樊鎖海;劉慶;邵晴;;基于PageRank算法和HITS算法的期刊評價研究[J];計算機科學;2014年S1期

4 羅林波;陳綺;吳清秀;;基于Shark-Search和Hits算法的主題爬蟲研究[J];計算機技術與發(fā)展;2010年11期

5 楊仁廣;宋宇;孟祥增;;一種改進Shark-Search的多媒體主題搜索算法[J];計算機工程與應用;2010年14期

6 范聰賢;徐汀榮;范強賢;;Web結(jié)構挖掘中HITS算法改進的研究[J];微計算機信息;2010年03期

7 王冬;雷景生;;一種基于PageRank的頁面排序改進算法[J];微電子學與計算機;2009年04期

8 楊云源;何禮平;;基于Goolge Maps API的WebGIS應用研究[J];電腦開發(fā)與應用;2009年01期

9 宋宇;孟祥增;;基于改進Fish-search算法的多媒體檢索[J];計算機工程;2008年11期

10 陳軍;陳竹敏;;基于網(wǎng)頁分塊的Shark-Search算法[J];山東大學學報(理學版);2007年09期

相關碩士學位論文 前10條

1 謝月;網(wǎng)頁排序中PageRank算法和HITS算法的研究[D];電子科技大學;2012年

2 林捷;主題網(wǎng)絡爬蟲的研究和實現(xiàn)[D];武漢理工大學;2011年

3 陳輝;Web方式下電子海圖的顯示技術研究與應用[D];武漢理工大學;2011年

4 李新鋼;基于GIS的流域整治查詢管理系統(tǒng)的建設[D];中國海洋大學;2011年

5 劉馳;基于Google maps的交通信息服務平臺研究與設計[D];華南理工大學;2010年

6 邵晶晶;基于PageRank排序算法改進的若干研究[D];華中師范大學;2009年

7 張阿紅;Web鏈接結(jié)構挖掘中HITS算法的分析與改進[D];西北師范大學;2009年

8 劉軍;基于Web結(jié)構挖掘的HITS算法研究[D];中南大學;2008年

9 朱良峰;主題網(wǎng)絡爬蟲的研究與設計[D];南京理工大學;2008年

10 華f;基于GIS的長沙市景觀格局定量分析與優(yōu)化研究[D];湖南大學;2008年



本文編號:2531287

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2531287.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b3a64***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com