前后綴與特征詞相結(jié)合的地名地址提取
本文關(guān)鍵詞:前后綴與特征詞相結(jié)合的地名地址提取
更多相關(guān)文章: 前后綴 特征詞 HMM分詞 地名地址
【摘要】:隨著地理信息與計算機技術(shù)的發(fā)展,網(wǎng)絡(luò)中的非結(jié)構(gòu)化地名地址數(shù)據(jù)越來越多,逐步成為地理信息更新的重要途徑之一。針對互聯(lián)網(wǎng)中地名地址的存在方式及結(jié)構(gòu)特點,本文提出了一種前后綴與特征詞相結(jié)合的地名地址識別提取方法。首先利用HMM訓(xùn)練進(jìn)行分詞,接著通過地名地址前后綴詞庫進(jìn)行候選地名切分與預(yù)提取,最后根據(jù)特征詞進(jìn)行匹配過濾,實現(xiàn)對地名地址的準(zhǔn)確提取。試驗結(jié)果證明,本文方法提高了地名地址識別的準(zhǔn)確率和召回率,很大程度上解決了未登錄地址提取問題。
【作者單位】: 山東農(nóng)業(yè)大學(xué);中國測繪科學(xué)研究院;
【關(guān)鍵詞】: 前后綴 特征詞 HMM分詞 地名地址
【基金】:國家863計劃(2012AA12A402;2013AA12A403) 中國測繪科學(xué)研究院基本科研業(yè)務(wù)費(7771403)
【分類號】:P208
【正文快照】: 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,多源網(wǎng)絡(luò)中廣泛存在數(shù)量龐大、種類繁多的新聞、報道、軍事、生活信息,它們大多是文本數(shù)據(jù),不容易被自動挖掘與提取。然而,蘊藏在文本中的地理信息不僅能為政府關(guān)注各類事件的分析、研究和決策提供支撐,而且還可以豐富地理信息的內(nèi)容[1],可以利用GIS軟件
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 趙陽陽;王亮;仇阿根;;地址要素識別機制的地名地址分詞算法[J];測繪科學(xué);2013年05期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 史鵬龍;軍網(wǎng)輿情監(jiān)測與信息處理平臺的開發(fā)研究[D];蘭州大學(xué);2012年
2 羅灝;基于語義的科技項目相似度計算研究[D];杭州電子科技大學(xué);2013年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 胡錫衡;;正向最大匹配法在中文分詞技術(shù)中的應(yīng)用[J];鞍山師范學(xué)院學(xué)報;2008年02期
2 張國煊,王小華,周必水;快速書面漢語自動分詞系統(tǒng)及其算法設(shè)計[J];計算機研究與發(fā)展;1993年01期
3 鄒海山,吳勇,吳月珠,陳陣;中文搜索引擎中的中文信息處理技術(shù)[J];計算機應(yīng)用研究;2000年12期
4 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機制——雙字哈希機制[J];中文信息學(xué)報;2003年04期
5 閆引堂,周曉強;交集型歧義字段切分方法研究[J];情報學(xué)報;2000年06期
6 周麗琴,楊季文,呂強;基于Web的字詞頻統(tǒng)計程序的設(shè)計與應(yīng)用[J];蘇州大學(xué)學(xué)報(自然科學(xué));2002年01期
7 鄭家恒;張劍鋒;譚紅葉;;中文分詞中歧義切分處理策略[J];山西大學(xué)學(xué)報(自然科學(xué)版);2007年02期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 余明朗;明小娜;龍毅;張雪英;;GIS環(huán)境下中文命令的規(guī)則匹配與語義解析[J];地理與地理信息科學(xué);2012年06期
,本文編號:900158
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/900158.html