地理資源知識(shí)關(guān)聯(lián)工具研究與實(shí)現(xiàn)
【學(xué)位單位】:中國(guó)礦業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:P208
【部分圖文】:
是地理資源信息的中文自然語(yǔ)言表現(xiàn)形式之一,為此對(duì)中文地名地址進(jìn)行關(guān)聯(lián)分析和計(jì)算,特別是地名地址匹配問(wèn)題的解決,對(duì)建立地理資源知識(shí)關(guān)聯(lián)工具具有非常重要的意義。與英文地名地址不同,中文地名地址是連續(xù)的字符串,但也具有一定的結(jié)構(gòu),由一些地址要素組成,分析中文地名地址要素構(gòu)成,有利于采用合理的中文地名地址匹配方法。2.4.1 中文地名地址要素解析中文地名地址一般主要由行政要素、基本約束信息和位置信息等要素構(gòu)成,具體表述如下[68]:標(biāo)準(zhǔn)地址 :: 行政要素 基本約束信息 位置信息行政要素 : 國(guó)家 城市 行政區(qū)縣基本約束信息 : 街道 集鎮(zhèn) 工業(yè)區(qū) 自然村位置信息 : 建筑物編號(hào) 門牌號(hào) 標(biāo)志物如圖 2-5 所示,以“江蘇省徐州市泉山區(qū)大學(xué)路一號(hào)中國(guó)礦業(yè)大學(xué)南湖校區(qū)環(huán)境與測(cè)繪學(xué)院 C404”為實(shí)例說(shuō)明中文地址的結(jié)構(gòu)要素。行政要素 基本約束信息 位置信息
圖 4-5 萬(wàn)方平臺(tái)機(jī)構(gòu)數(shù)據(jù)示例Figure 4-5 Sample of organization data by WanFang對(duì)萬(wàn)方平臺(tái)的 3654 條未經(jīng)處理的機(jī)構(gòu)數(shù)據(jù),以地址匹配、機(jī)構(gòu)成立時(shí)間、機(jī)構(gòu)簡(jiǎn)介信息等為基本關(guān)聯(lián)對(duì)象進(jìn)行結(jié)果計(jì)算,并建立標(biāo)準(zhǔn)機(jī)構(gòu)庫(kù)和地址庫(kù)作為匹配源進(jìn)行關(guān)聯(lián)度匹配計(jì)算,結(jié)果如表 4-2 所示。表 4-2 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)Table 4-2 Statistic of experiment results關(guān)聯(lián)類型 關(guān)聯(lián)結(jié)果 單項(xiàng)占比(%) 總占比(%)成功匹配結(jié)果 完全匹配 2594 條 71.083.9(共 3067 條) 模糊匹配 473 條 12.9無(wú)法匹配結(jié)果 過(guò)于模糊 539 條 14.816.1(共 587 條) 錯(cuò)誤結(jié)果 48 條 1.3根據(jù)實(shí)驗(yàn)結(jié)果可以得出,成功匹配結(jié)果的成功率達(dá)到了 83.9%,說(shuō)明該算法基本能夠滿足知識(shí)關(guān)聯(lián)計(jì)算的要求,能夠滿足項(xiàng)目的基本需要。在成功處理結(jié)果中,完全匹配結(jié)果占比 71.0%,主要是因?yàn)橐匦畔⒈容^完整,比較容易得到正確結(jié)果;對(duì)于模糊結(jié)果占比 12.9%,大多是因?yàn)槊枋鲂畔⒋嬖谄缌x或者少量要素
圖 5-4 用戶界面Figure 5-4 User interface(2)用戶數(shù)據(jù)模塊:該模塊運(yùn)行與服務(wù)器端。接收到用戶數(shù)據(jù)后,將數(shù)據(jù)進(jìn)行存儲(chǔ)和格式轉(zhuǎn)換,形成資源數(shù)據(jù)集。此外對(duì)用戶數(shù)據(jù)進(jìn)行初步的數(shù)據(jù)分析,為下一步數(shù)據(jù)搜索做準(zhǔn)備。(3)數(shù)據(jù)搜索模塊:數(shù)據(jù)搜索模塊是從 LinkedData 中獲取目標(biāo)數(shù)據(jù)集。由于 Linked Data 數(shù)據(jù)眾多,需要從當(dāng)中篩選所需要的數(shù)據(jù)集。根據(jù)上一步中獲得的用戶數(shù)據(jù)信息,編寫 SPARQL 語(yǔ)言搜索。搜索結(jié)果形成目標(biāo)數(shù)據(jù)集。知識(shí)檢索模塊如圖 5-5 所示。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高繼平;丁堃;潘云濤;袁軍鵬;;知識(shí)關(guān)聯(lián)研究述評(píng)[J];情報(bào)理論與實(shí)踐;2015年08期
2 張藝雪;黃毅杰;;一種基于MapReduce的Apriori改進(jìn)算法研究[J];蘭州工業(yè)學(xué)院學(xué)報(bào);2014年06期
3 吳燁;陳犖;熊偉;鐘志農(nóng);景寧;;面向高效檢索的多源地理空間數(shù)據(jù)關(guān)聯(lián)模型[J];計(jì)算機(jī)學(xué)報(bào);2014年09期
4 呂歡歡;宋偉東;;多元地址要素組合的地址匹配方法[J];測(cè)繪科學(xué);2015年03期
5 李清泉;李德仁;;大數(shù)據(jù)GIS[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年06期
6 劉紀(jì)平;張福浩;王亮;董春;王勇;徐勝華;錢新林;;面向大數(shù)據(jù)的空間信息決策支持服務(wù)研究與展望[J];測(cè)繪科學(xué);2014年05期
7 吉根林;趙斌;;面向大數(shù)據(jù)的時(shí)空數(shù)據(jù)挖掘綜述[J];南京師大學(xué)報(bào)(自然科學(xué)版);2014年01期
8 李楠;張學(xué)福;;基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)發(fā)現(xiàn)模型研究[J];圖書館學(xué)研究;2013年01期
9 劉大有;陳慧靈;齊紅;楊博;;時(shí)空數(shù)據(jù)挖掘研究進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2013年02期
10 羅名海;;信息時(shí)代地理信息服務(wù)方式的轉(zhuǎn)變[J];地理空間信息;2011年06期
本文編號(hào):2848922
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/2848922.html