基于條件隨機(jī)場和空間推理的地理編碼方法
本文關(guān)鍵詞:基于條件隨機(jī)場和空間推理的地理編碼方法,,由筆耕文化傳播整理發(fā)布。
【摘要】:地址信息與人類社會(huì)經(jīng)濟(jì)活動(dòng)密切相關(guān),在中國,工商、統(tǒng)計(jì)、公安等部門記錄和保存了海量的地址信息。地理編碼技術(shù)能夠?qū)臻g位置的文本信息與空間信息建立關(guān)聯(lián),整合社會(huì)經(jīng)濟(jì)信息和空間信息,為社會(huì)經(jīng)濟(jì)信息提供定位、分析、可視化和制圖等功能。從而在國民經(jīng)濟(jì)建設(shè)和人們社會(huì)生活中發(fā)揮不可或缺的作用。地理編碼(GeoCoding),又稱地址匹配(address-matching),是將文字描述的地址信息映射到地理空間中的過程,這個(gè)過程完成了具有空間位置的文字地址到地理坐標(biāo)的定量轉(zhuǎn)換。地理編碼的核心是基于自然語言處理技術(shù)的地址語義解析和地址匹配。因此如何利用自然語言處理技術(shù)完成地址精確解析,并利用解析成果進(jìn)行地址匹配是提高地理編碼準(zhǔn)確性的關(guān)鍵。本文以非規(guī)范中文地址為研究對(duì)象,將條件隨機(jī)場模型運(yùn)用到地址解析中,對(duì)地址中的空間關(guān)系進(jìn)行總結(jié)并應(yīng)用到地址匹配中。為非規(guī)范中文地理編碼找到一條可行途徑,也為中文文本空間信息處理、自然語言空間查詢等研究提供了理論和技術(shù)借鑒。論文主要研究內(nèi)容包括:1.通過介紹地理編碼的需求背景和應(yīng)用領(lǐng)域,闡述了本文的研究背景和研究意義;從地址標(biāo)準(zhǔn)規(guī)范、地址模型、地理編碼系統(tǒng)構(gòu)建和地理編碼方法四個(gè)方面分析了地理編碼的研究現(xiàn)狀;針對(duì)存在的問題確定了本文的研究內(nèi)容和研究思路。2.闡述了地理編碼的概念和一般過程,指出地理編碼中兩個(gè)核心過程——地址解析和地址匹配;總結(jié)了地址解析三種方法體系——基于詞典(規(guī)則)、基于理解和基于統(tǒng)計(jì),提出基于條件隨機(jī)場的地址解析;分析了地址匹配的三種方法體系——模糊匹配、層級(jí)地址精確匹配和空間推理匹配。3.構(gòu)建了空間關(guān)系地址模型及其標(biāo)注體系。在層級(jí)模型、有限自動(dòng)機(jī)模型的基礎(chǔ)上,提出了空間關(guān)系地址模型,并分析了該模型的優(yōu)勢;闡述了空間關(guān)系地址模型的結(jié)構(gòu),分析了各種空間關(guān)系的表達(dá);基于HashTable構(gòu)建了地址模型哈希樹,并對(duì)地址標(biāo)注語料庫進(jìn)行了地址模式統(tǒng)計(jì)分析。4.提出了基于條件隨機(jī)場模型的中文地址解析方法。將條件隨機(jī)場模型應(yīng)用到地址解析中,提出了基于條件隨機(jī)場的地址解析方法,并著重研究了地址標(biāo)注語料庫構(gòu)建和地址特征選取。該方法不依賴于詞典,避免了其他方法的標(biāo)注偏置問題,并允許靈活加入各種特征,對(duì)非規(guī)范地址的地址解析和結(jié)構(gòu)化具有較好效果。5.研究了基于空間推理的地址匹配方法。在地址解析的基礎(chǔ)上,探討了利用地址中的空間關(guān)系進(jìn)行地址推理匹配,并重點(diǎn)介紹了針對(duì)幾種地址表達(dá)模式的匹配策略和方法。該方法充分利用了地址中的空間關(guān)系信息,提高地址匹配精度。
【關(guān)鍵詞】:地址解析 地址匹配 地址空間關(guān)系模型 條件隨機(jī)場模型 地址模式統(tǒng)計(jì)
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:P208
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 緒論11-22
- 1.1 研究背景與意義11-12
- 1.2 研究現(xiàn)狀12-18
- 1.2.1 地址標(biāo)準(zhǔn)及規(guī)范12-13
- 1.2.2 地址模型13-14
- 1.2.3 地址編碼方法14-17
- 1.2.4 地址編碼系統(tǒng)構(gòu)建17-18
- 1.3 問題分析18
- 1.4 研究內(nèi)容及研究思路18-20
- 1.4.1 研究內(nèi)容18-19
- 1.4.2 論文研究思路19-20
- 1.5 論文結(jié)構(gòu)安排20-21
- 1.6 本章小結(jié)21-22
- 第二章 中文地址解析與地址匹配的基本理論與方法22-35
- 2.1 地理編碼22-23
- 2.1.1 地理編碼的定義22
- 2.1.2 地址解析與地址匹配22-23
- 2.2 中文地址解析的相關(guān)方法23-31
- 2.2.1 基于詞典(規(guī)則)的方法23-24
- 2.2.2 基于理解的方法24-25
- 2.2.3 基于統(tǒng)計(jì)的方法25-28
- 2.2.4 條件隨機(jī)場模型28-31
- 2.3 中文地址匹配的相關(guān)方法31-34
- 2.3.1 模糊匹配32
- 2.3.2 層級(jí)地址精確匹配32-33
- 2.3.3 基于空間推理的匹配33-34
- 2.4 本章小結(jié)34-35
- 第三章 空間關(guān)系地址模型及其標(biāo)注體系構(gòu)建35-50
- 3.1 空間關(guān)系地址模型的意義35-36
- 3.2 空間關(guān)系地址模型結(jié)構(gòu)36-38
- 3.3 地址中空間關(guān)系表達(dá)38-43
- 3.3.1 拓?fù)潢P(guān)系表達(dá)38-40
- 3.3.2 方向關(guān)系表達(dá)40-42
- 3.3.3 距離關(guān)系表達(dá)42-43
- 3.4 地址標(biāo)注體系設(shè)計(jì)43-45
- 3.5 基于統(tǒng)計(jì)的地址模型識(shí)別實(shí)驗(yàn)45-49
- 3.5.1 地址模型統(tǒng)計(jì)原理45-46
- 3.5.2 基于統(tǒng)計(jì)的地址模型構(gòu)建算法46-47
- 3.5.3 實(shí)驗(yàn)及分析47-49
- 3.6 本章小結(jié)49-50
- 第四章 基于條件隨機(jī)場的中文地址解析50-68
- 4.1 地址標(biāo)注的一般過程50-51
- 4.2 地址數(shù)據(jù)預(yù)處理51-55
- 4.2.1 地址標(biāo)注語料庫51-53
- 4.2.2 地址標(biāo)注方法及結(jié)果53-54
- 4.2.3 標(biāo)注語料數(shù)據(jù)轉(zhuǎn)換54-55
- 4.3 模型中的地址特征55-59
- 4.3.1 地址的語言學(xué)特征55-56
- 4.3.2 地址用字特征56-59
- 4.3.3 地址的框架特征59
- 4.4 特征模板設(shè)計(jì)59-60
- 4.5 實(shí)驗(yàn)驗(yàn)證及結(jié)果分析60-67
- 4.5.1 評(píng)價(jià)指標(biāo)及實(shí)驗(yàn)數(shù)據(jù)60-61
- 4.5.2 實(shí)驗(yàn)及分析61-67
- 4.6 本章小結(jié)67-68
- 第五章 基于空間推理的地址匹配68-82
- 5.1 地址推理匹配的一般過程68-70
- 5.2 地址庫邏輯模型70-73
- 5.2.1 行政區(qū)劃數(shù)據(jù)的組織70-71
- 5.2.2 道路數(shù)據(jù)的組織71-72
- 5.2.3 居民小區(qū)、標(biāo)志物及興趣點(diǎn)數(shù)據(jù)的組織72-73
- 5.3 幾種地址模式及其推理匹配策略73-76
- 5.3.1 層級(jí)模式地址73
- 5.3.2 道路交叉口地址73-74
- 5.3.3 精確偏移地址74-75
- 5.3.4 模糊偏移地址75-76
- 5.4 地址推理匹配算法76-77
- 5.5 實(shí)驗(yàn)結(jié)果與分析77-81
- 5.5.1 中文地址推理匹配原型系統(tǒng)77-79
- 5.5.2 實(shí)驗(yàn)結(jié)果79-81
- 5.5.3 結(jié)果分析81
- 5.6 本章小結(jié)81-82
- 第六章 總結(jié)與展望82-84
- 6.1 論文主要工作82
- 6.2 存在問題及展望82-84
- 致謝84-85
- 參考文獻(xiàn)85-90
- 作者簡歷90
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 亢孟軍;杜清運(yùn);王明軍;;地址樹模型的中文地址提取方法[J];測繪學(xué)報(bào);2015年01期
2 肖計(jì)劃;;地名識(shí)別與匹配的概率統(tǒng)計(jì)方法[J];測繪科學(xué)技術(shù)學(xué)報(bào);2014年04期
3 魏金明;仲偉政;;基于置信度的地址匹配方法初探[J];測繪科學(xué);2015年01期
4 范立新;黃龍軍;;基于近似串匹配的地名數(shù)據(jù)庫建設(shè)探析[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2014年06期
5 徐聰;張豐;杜震洪;張逸然;陳明;劉仁義;;基于哈希和雙數(shù)組trie樹的多層次地址匹配算法[J];浙江大學(xué)學(xué)報(bào)(理學(xué)版);2014年02期
6 彭穎霞;吳升;;一種適于地理編碼的地址數(shù)據(jù)規(guī)范化方法[J];測繪科學(xué)技術(shù)學(xué)報(bào);2013年05期
7 莊海東;張鴻恩;;基于規(guī)則的中文地址匹配系統(tǒng)[J];福建電腦;2013年09期
8 于煥菊;李云嶺;齊清文;;顧及實(shí)體空間關(guān)系的地址編碼方法研究[J];地理與地理信息科學(xué);2013年05期
9 宋子輝;;自然語言理解的中文地址匹配算法[J];遙感學(xué)報(bào);2013年04期
10 趙陽陽;王亮;仇阿根;;地址要素識(shí)別機(jī)制的地名地址分詞算法[J];測繪科學(xué);2013年05期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 唐旭日;陳小荷;;中文地名結(jié)構(gòu)的定性與定量分析[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
本文關(guān)鍵詞:基于條件隨機(jī)場和空間推理的地理編碼方法,由筆耕文化傳播整理發(fā)布。
本文編號(hào):356304
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/356304.html