天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 測繪論文 >

基于互聯(lián)網(wǎng)POI的中文地址要素庫自學(xué)習(xí)構(gòu)建方法研究

發(fā)布時間:2021-02-21 01:08
  隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)頁中所涉及有關(guān)空間位置的信息也越來越多,使其成為地理信息數(shù)據(jù)獲取和更新的重要數(shù)據(jù)來源之一。但是,由于互聯(lián)網(wǎng)數(shù)據(jù)的多樣性、復(fù)雜性和異構(gòu)性等特征,使得對于它們的挖掘與分析變成了一個新問題。關(guān)于中文地址要素庫構(gòu)建方法的研究就是其中問題之一,地址要素庫作為地址信息資源集成、融合與管理的核心樞紐,承擔(dān)著地址信息資源整合、支撐技術(shù)應(yīng)用的職能,為社會公眾和政府各職能部門提供可靠、高效、準(zhǔn)確的地理位置定位服務(wù)。針對中文地址文本信息的描述特點和地址要素匹配服務(wù)的需求,本文從中文地址要素切分、語義標(biāo)注及層級關(guān)系構(gòu)建等方面進行了較為系統(tǒng)地研究,并設(shè)計開發(fā)了原型系統(tǒng)。主要的研究工作內(nèi)容及創(chuàng)新點如下:(1)基于GRU神經(jīng)網(wǎng)絡(luò)的中文地址要素切分方法研究:針對傳統(tǒng)機器學(xué)習(xí)模型對中文地址要素切分,需要人為的提取特征以及模型訓(xùn)練時間較長的缺點。提出了基于門控循環(huán)單元(Gated Recurrent Unit,GRU)神經(jīng)網(wǎng)絡(luò)的中文地址要素切分方法,并采用三詞位標(biāo)注法對切分字符進行標(biāo)注。該神經(jīng)網(wǎng)絡(luò)具備自動學(xué)習(xí)特征,避免了人工特征選擇對中文地址要素切分的影響。同時,三詞位標(biāo)注法提升了中文地址要素切分... 

【文章來源】:蘭州交通大學(xué)甘肅省

【文章頁數(shù)】:61 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于互聯(lián)網(wǎng)POI的中文地址要素庫自學(xué)習(xí)構(gòu)建方法研究


圖2.?2?LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??圖2.2,描長短時記憶經(jīng)網(wǎng)絡(luò)的隱藏層中各個門的操作過,

取值范圍,狀態(tài),表示矩陣,權(quán)重矩陣


Xt??圖2.3?GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??圖2.3中,z,表示更新門;r,表示重置門;&表示當(dāng)前隱藏節(jié)點的候選隱藏狀態(tài);/7,??表示當(dāng)前隱藏狀態(tài);X,表示當(dāng)前神經(jīng)網(wǎng)絡(luò)的輸入;心!表示當(dāng)前節(jié)點的上一層隱藏狀態(tài);??詳細的計算公式如下:??2,=表'+%九)?(2.7)??r,?=?a(fVrx-x,?+?PVr/l?(2.8)??石,=t—dx,?+?r,?*K丨)?(2.9)??h,?=(\-zl)*hl+zl*hl_i?(2.?10)??其中,o■表示激活函數(shù)sigmoid,取值范圍在0到1之間;〇表示矩陣的Hadamard??乘積;冰和^是需要學(xué)習(xí)的權(quán)重矩陣。和r,的取值范圍在0到1之間。在候選隱藏狀??態(tài)值&中

序列,字符,中文分詞,模型框架


表示一個地址元素的中間字符,E?(End)表示一個地址元素的結(jié)束字符。??基于神經(jīng)網(wǎng)絡(luò)的中文分詞模型通常分為三個部分:(1)文本向量化層;(2)神經(jīng)網(wǎng)??絡(luò)轉(zhuǎn)化層;(3)標(biāo)簽推理層。具體框架如圖2.4所示:??f?^??輸入窗Q??,符?Ct?+?l?Ct*2??j?二IZ?二二ZII?二??查找表?g?nz?nz?m:?=??d-i?|" ̄? ̄|??????????v?a?bzd?bid?g?匕j?td?y??■〇■連接??r ̄ ̄ ̄- ̄-? ̄ ̄ ̄??線性轉(zhuǎn)換?I?I?I?I?I?|?ill??2t?=?Wlxxt?+?bl?I?I?|?丨丨卜?I?I?I?I?Xt??\???J??Sigmod?ht?=?(?(zt)??r—? ̄ ̄—???^??????——■—- ̄—^??錢性轉(zhuǎn)換?mm?rTT??yt?=?w2?x?ht?^b2??\?y??O??r?rrm?^??標(biāo)簽推理?11111??B??M?ofo^o^o^o^o??E?V^O^O^o^o??,?yi?yz?ya?y*?y&?y??圖2.?4中文分詞模型框架??字符標(biāo)注的方法是基于本地窗口,即假設(shè)窗口中一個字符極大的依賴于其他相鄰的??字符。給定一個長度為〃的文本序列印,《」,大小為&的窗口從文本序列的第一個字符〇,??一直滑到最后一個字cn。如圖2.4所示,設(shè)置窗口的大小為5,對于輸入的每一個字符??都會有其上下文中5個相鄰的字符(似^⑴^+^以輸入到查找表中進行??字符向量化。而對于超出序列邊界范圍的字符,用特征字符“Start”和“End”進行標(biāo)記。然??后

【參考文獻】:
期刊論文
[1]淺談數(shù)據(jù)庫設(shè)計在系統(tǒng)設(shè)計中的重要性[J]. 傘穎,高輝.  中國校外教育. 2013(24)
[2]空間ETL技術(shù)在省級標(biāo)準(zhǔn)地址庫建設(shè)中的應(yīng)用研究[J]. 唐權(quán),吳勤書,曹全龍.  測繪通報. 2013(05)
[3]地址要素識別機制的地名地址分詞算法[J]. 趙陽陽,王亮,仇阿根.  測繪科學(xué). 2013(05)
[4]基于有限狀態(tài)機和Trie數(shù)的分級地址模型[J]. 張倩,郭嗣琮.  計算機應(yīng)用. 2013(03)
[5]POI的分類標(biāo)準(zhǔn)研究[J]. 張玲.  測繪通報. 2012(10)
[6]中文文本的地理空間關(guān)系標(biāo)注[J]. 張雪英,張春菊,朱少楠.  測繪學(xué)報. 2012(03)
[7]中文文本的地理命名實體標(biāo)注[J]. 張雪英,朱少楠,張春菊.  測繪學(xué)報. 2012(01)
[8]標(biāo)準(zhǔn)地址庫系統(tǒng)的設(shè)計與實現(xiàn)[J]. 袁園.  地理空間信息. 2009(06)
[9]地理編碼系統(tǒng)設(shè)計與實現(xiàn)[J]. 郭會,宋關(guān)福,馬柳青,王少華.  計算機工程. 2009(01)
[10]城市地址編碼發(fā)展歷史及現(xiàn)狀分析[J]. 張鶴,孔令彥,陳倬,孫樂兵.  測繪通報. 2008(07)

碩士論文
[1]面向互聯(lián)網(wǎng)的中文地址語義解析方法研究[D]. 謝婷婷.武漢工程大學(xué) 2017
[2]中文地址位置語義解析方法的研究[D]. 黃爽.武漢工程大學(xué) 2017
[3]基于地理編碼的社會型地理空間框架研究[D]. 惠哲.西安科技大學(xué) 2015
[4]中文標(biāo)準(zhǔn)地址庫構(gòu)建關(guān)鍵技術(shù)研究[D]. 朱俊.南京師范大學(xué) 2013
[5]面向經(jīng)濟普查項目需求的模糊中文地址匹配方法研究[D]. 于濱.中南大學(xué) 2010
[6]城市地址編碼的技術(shù)及應(yīng)用[D]. 葉海波.中國石油大學(xué) 2009



本文編號:3043619

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/3043619.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ccb1d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com