天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 測繪論文 >

面向網(wǎng)頁文本的地理信息要素提取與空間定位方法研究

發(fā)布時間:2018-03-04 13:31

  本文選題:地理信息要素 切入點:提取 出處:《山東農(nóng)業(yè)大學(xué)》2015年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著互聯(lián)網(wǎng)技術(shù)與計算機技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)信息中涉及的地理信息內(nèi)容越來越多,并逐漸呈現(xiàn)出一種指數(shù)爆炸增長趨勢,成為地理信息獲取與更新的重要的途徑;ヂ(lián)網(wǎng)信息中的地理信息與其他網(wǎng)頁內(nèi)容一樣,以文本的形式存在,非結(jié)構(gòu)性化特征使這些信息不容易被機器自動識別提取出來,無法作為GIS重要數(shù)據(jù)源進行進一步的統(tǒng)計和分析,同時海量互聯(lián)網(wǎng)網(wǎng)頁文本中也不乏存在一些泄露國家機密、危害國家安全的地理信息數(shù)據(jù),互聯(lián)網(wǎng)中存在的海量地理信息要素數(shù)據(jù)亟需被自動提取出來并轉(zhuǎn)換為具有地理坐標(biāo)的空間數(shù)據(jù)進行分析。對網(wǎng)頁文本的地理信息要素提取與地理信息空間定位是解決這些問題的有效方法。網(wǎng)頁地理信息要素提取是將網(wǎng)絡(luò)爬蟲所獲取的文本進行語義分析處理,并將其中所包含的地名地址與地理實體有效提取。地理信息要素空間定位則是對提取出的要素通過相似度計算、標(biāo)準(zhǔn)化、地理信息要素匹配處理等方法賦予空間坐標(biāo),以便GIS分析工具并進行分析處理。針對網(wǎng)頁文本中地理信息的識別提取與空間定位問題,研究結(jié)果主要包括以下幾個方面:(1)網(wǎng)頁文本中地理信息要素提取方法。在國內(nèi)外研究現(xiàn)狀基礎(chǔ)上,利用隱馬爾可夫模型機器學(xué)習(xí)的方法對網(wǎng)頁文本數(shù)據(jù)進行詞性標(biāo)注預(yù)處理。通過地名地址前后綴特征詞識別窗口提取候選地名地址,根據(jù)制定的規(guī)則對候選地名地址進行匹配過濾,提取地名地址;通過HMM詞性標(biāo)注與詞性識別窗口相結(jié)合提取候選地理實體,根據(jù)地理實體的驗證規(guī)則進行過濾,提取地理實體。最后利用網(wǎng)頁文本數(shù)據(jù)進行實驗驗證。(2)提出地名地址與地理實體空間定位策略。地名地址在空間定位之前,首先根據(jù)地名地址標(biāo)準(zhǔn)結(jié)構(gòu)體進行標(biāo)準(zhǔn)化處理,并且根據(jù)地名地址的前后文信息確定其的大體區(qū)域范圍,然后通過與定位參考庫中的地名地址進行匹配比對,匹配成功的確定空間地理坐標(biāo),匹配失敗無法確定位置的按空間定位模糊策略進行處理。地理實體空間定位采用實體名稱相似度計算的方法,取與地理實體庫中相似度最高的地理實體空間坐標(biāo)作為待定位實體坐標(biāo),如果相似度均不在設(shè)定閾值范圍,則無法對待定位地理實體進行定位。(3)根據(jù)文中地理信息識別提取與空間定位方法,對互聯(lián)網(wǎng)中的多個網(wǎng)站進行地理信息要素提取與空間定位,并在原型系統(tǒng)的前端界面進行了直觀的展現(xiàn)。
[Abstract]:With the rapid development of Internet technology and computer technology, geographic information content is more and more involved in the information network, and gradually showing a exponential growth trend, become an important way of geographic information acquisition and update the information in the Internet. The geographic information and other web content, in the form of text, non structural. These characteristics make the information is not easy to be identified automatically extracted, not GIS as an important data source for further statistics and analysis, while the mass of Internet web page text there are some state secrets, the geographic information data of endangering national security, elements of massive geographic data to exist in the Internet are automatically extracted and conversion of spatial data with geographic coordinates were analyzed. The extraction of geographic information elements on the web page text and geographic information Spatial localization is an effective method to solve these problems. Elements extraction of Web Geographic information is the text web crawler acquired semantic analysis processing, which contains the address and geographical entity extraction. Spatial geographic information elements of the elements extracted by calculating similarity, standardization, geographical elements the matching processing method gives the space coordinates, so that the GIS analysis tools and analysis. Aiming at the problem of recognition and spatial localization of geographic information in the page text, the results of this study include the following aspects: (1) extracting geographic information elements "in the text. The research status at home and abroad based on part of speech tagging pre processing of Web text data using the method of hidden Markov model of machine learning. Through the address before the suffix word recognition feature extraction of candidate window The address, according to the rules matching to filter candidate address, address extraction; by HMM combined with POS tagging recognition window to extract candidate geographic entity, filtered according to the validation rules of geographical entities, from the geographical entity. Then using the web text data is verified by experiment. (2) proposed names and address geographical spatial positioning strategy. In the address space before locating were standardized according to the standard address structure first, and large area is determined according to the scope of its name address context information, and then through the positioning and reference library in the address matching alignment, matching the spatial geographic coordinates determine the success, failure, unable to determine the location of the space location according to the fuzzy strategy for processing. The spatial location of geographical entity entity name similarity calculation. Method and similarity of geographical entity library highest geographical spatial coordinates as to position the entity coordinates, which are not in the set if the similarity threshold cannot be located the geographical entity positioning. (3) according to the recognition of geographic information extraction and spatial positioning method, geographic information extraction and spatial positioning of elements many websites in the Internet, and the visual display in front of the interface of the prototype system.

【學(xué)位授予單位】:山東農(nóng)業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:P208;P209

【相似文獻】

相關(guān)期刊論文 前10條

1 樊廷杰;基礎(chǔ)地理信息的安全管理[J];三晉測繪;2000年02期

2 苗前軍;加快科技創(chuàng)新 推進地理信息的產(chǎn)品化和社會化[J];測繪通報;2002年06期

3 顧納,周星,劉麗芬,吳劍鋒;關(guān)于美中基礎(chǔ)地理信息產(chǎn)品及其分發(fā)模式的思考[J];北京測繪;2003年04期

4 何建邦;《地理信息國際標(biāo)準(zhǔn)手冊》即將出版[J];地球信息科學(xué);2003年02期

5 ;全國地理信息標(biāo)準(zhǔn)化技術(shù)委員會第二屆委員會近期成立[J];地理信息世界;2004年02期

6 西風(fēng);走在地理信息世界[J];地理信息世界;2005年04期

7 本刊編輯部;;《地理信息世界》豐富多彩[J];地理信息世界;2005年06期

8 本刊編輯部;;《地理信息世界》編輯委員會第三次會議召開[J];地理信息世界;2006年03期

9 ;省局與省交通廳簽訂地理信息數(shù)據(jù)資源共享與合作的協(xié)議書[J];江西測繪;2006年04期

10 ;黑龍江省地理信息產(chǎn)業(yè)園一期工程竣工 海天地理信息公司等首批企業(yè)遷入運營[J];測繪與空間地理信息;2007年01期

相關(guān)會議論文 前10條

1 陳建華;;GIS地理信息與虛擬仿真規(guī)劃生態(tài)美麗城鎮(zhèn)的作用[A];廣東省測繪學(xué)會第九次會員代表大會暨學(xué)術(shù)交流會論文集[C];2010年

2 張獻;田震;肖京國;賈建軍;李改肖;;面向水下應(yīng)用的海洋地理信息制圖表示研究[A];第二十一屆海洋測繪綜合性學(xué)術(shù)研討會論文集[C];2009年

3 齊清文;;地理信息科學(xué)方法論研究[A];中國地理學(xué)會百年慶典學(xué)術(shù)論文摘要集[C];2009年

4 羅名海;;武漢市地理信息公共服務(wù)平臺建設(shè)實踐[A];科技支撐 科學(xué)發(fā)展——2009年促進中部崛起專家論壇暨第五屆湖北科技論壇文集[C];2009年

5 申健;生力杰;平安;張霞;;基于地理信息的電信設(shè)備管理系統(tǒng)的設(shè)計與實現(xiàn)[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年

6 張紅衛(wèi);陳懷亮;張弘;劉愛華;;基于地理信息的河南省風(fēng)能資源時空分布及利用分析[A];第27屆中國氣象學(xué)會年會氣候資源應(yīng)用研究分會場論文集[C];2010年

7 甘泉;劉建川;;四川省測繪地理信息應(yīng)急保障體系建設(shè)與實踐[A];第十三屆中國科協(xié)年會第12分會場-測繪服務(wù)災(zāi)害與應(yīng)急管理學(xué)術(shù)研討會論文集[C];2011年

8 蔣景瞳;劉若梅;;國際地理信息標(biāo)準(zhǔn)化進展[A];紀(jì)念中國測繪學(xué)會成立四十周年論文集[C];1999年

9 顧學(xué)明;;地理信息的社會化和系統(tǒng)互操作性[A];中國地理信息系統(tǒng)協(xié)會第三次代表大會暨第七屆年會論文集[C];2003年

10 李建利;;激光雷達(dá)快速獲取地理信息的應(yīng)用研究[A];中國地理信息系統(tǒng)協(xié)會第三次代表大會暨第七屆年會論文集[C];2003年

相關(guān)重要報紙文章 前10條

1 王春卿邋張秋義;全國地理信息標(biāo)準(zhǔn)化技術(shù)委員會確定今年工作要點[N];中國測繪報;2008年

2 丁全利 高原;七部門聯(lián)合開展地理信息市場專項整治[N];中國國土資源報;2009年

3 吳向東 王永太 (記者 吳向東);吉林海南啟動地理信息市場專項整治工作[N];中國測繪報;2009年

4 徐小風(fēng) 姚樹根 擺文清 王志寧 劉中蘇 (記者 徐小風(fēng) 擺文清 王志寧 劉中蘇);陜西 江蘇 吉林 寧夏 部署地理信息市場整治工作[N];中國測繪報;2009年

5 本報記者 紅艷;整頓地理信息市場秩序 保障國家安全和利益[N];內(nèi)蒙古日報(漢);2009年

6 記者 興科 實習(xí)生 覃志彬;我區(qū)開展地理信息市場專項整治行動[N];新疆日報(漢);2009年

7 記者 孫延峰;認(rèn)真履行職責(zé) 嚴(yán)肅查處地理信息市場違法行為[N];中國工商報;2009年

8 劉江;貴州出臺整頓和規(guī)范地理信息市場秩序工作意見[N];中國測繪報;2009年

9 樊省狀;確保順利完成地理信息市場專項整治[N];濟寧日報;2009年

10 記者 閆靜霞;寧夏八部門聯(lián)合整治地理信息市場[N];人民郵電;2009年

相關(guān)博士學(xué)位論文 前8條

1 成燕輝;符合共享和一致性原則的地理信息標(biāo)準(zhǔn)體系研究[D];武漢大學(xué);2005年

2 劉嶸;集群式網(wǎng)格地理信息服務(wù)注冊中心的構(gòu)建研究[D];解放軍信息工程大學(xué);2011年

3 田文文;基于自發(fā)地理信息的空間數(shù)據(jù)變化發(fā)現(xiàn)與更新方法研究[D];武漢大學(xué);2013年

4 王紅;基礎(chǔ)地理信息地形數(shù)據(jù)庫信息量度量方法研究[D];遼寧工程技術(shù)大學(xué);2010年

5 吳升;分布式GIS組件平臺的研究與實踐[D];解放軍信息工程大學(xué);2001年

6 王興玲;基于XML的地理信息Web服務(wù)研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2002年

7 李勤超;基于本體的地理信息語義轉(zhuǎn)換模型與方法研究[D];解放軍信息工程大學(xué);2011年

8 邢漢發(fā);面向更新的網(wǎng)絡(luò)化空間標(biāo)報模型研究[D];中南大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 沈?qū)汖?內(nèi)蒙古測繪地理信息行政管理問題與對策研究[D];內(nèi)蒙古大學(xué);2015年

2 任俊儒;基于FME的GIS數(shù)據(jù)處理研究[D];中國地質(zhì)大學(xué)(北京);2015年

3 華劍鋒;“清三河”地理信息數(shù)據(jù)集成與全景服務(wù)技術(shù)研究[D];浙江大學(xué);2015年

4 陳帥;數(shù)字喀什公共信息平臺的設(shè)計與實現(xiàn)[D];北京工業(yè)大學(xué);2015年

5 王克永;面向網(wǎng)頁文本的地理信息要素提取與空間定位方法研究[D];山東農(nóng)業(yè)大學(xué);2015年

6 李敏;面向公眾服務(wù)的基礎(chǔ)地理信息細(xì)化研究[D];山東科技大學(xué);2009年

7 王劍鋼;基于增強現(xiàn)實的地理信息指引系統(tǒng)[D];西安電子科技大學(xué);2011年

8 徐青偉;基于地理信息的軍用標(biāo)繪平臺的設(shè)計與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2003年

9 楊帆;基于本體的地理信息表示與檢索[D];江蘇科技大學(xué);2011年

10 易茹蘭;基于地理本體的地理信息語義表達(dá)與查詢方法研究[D];中南大學(xué);2009年

,

本文編號:1565843

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/1565843.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dfcee***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com