非結(jié)構(gòu)化中文自然語言地址描述的自動(dòng)識別
本文關(guān)鍵詞:非結(jié)構(gòu)化中文自然語言地址描述的自動(dòng)識別
更多相關(guān)文章: 地址描述 自然語言 中文分詞 句法識別
【摘要】:互聯(lián)網(wǎng)中存在海量易獲取的自然語言形式地址描述文本,其中蘊(yùn)含豐富的空間信息。針對其非結(jié)構(gòu)化特點(diǎn),提出了自動(dòng)提取中文自然語言地址描述中詞語和句法信息的方法,以便深度挖掘空間知識。首先,根據(jù)地址語料中字串共現(xiàn)的統(tǒng)計(jì)規(guī)律設(shè)計(jì)一種不依賴地名詞典的中文分詞算法,并利用在地址文本中起指示、限定作用的常見詞語組成的預(yù)定義詞表改善分詞效果及輔助詞性標(biāo)注。分詞完成后,定義能夠表達(dá)中文地址描述常用句法的有限狀態(tài)機(jī)模型,進(jìn)而利用其自動(dòng)匹配與識別地址文本的句法結(jié)構(gòu)。最后,基于大規(guī)模真實(shí)語料的統(tǒng)計(jì)分詞及句法識別實(shí)驗(yàn)表明了該方法的可用性及有效性。
【作者單位】: 長安大學(xué)地質(zhì)工程與測繪學(xué)院;地理信息工程國家重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 地址描述 自然語言 中文分詞 句法識別
【基金】:國家自然科學(xué)基金(No.41301513) 地理信息工程國家重點(diǎn)實(shí)驗(yàn)室開放研究基金(No.SKLGIE 2014-M-4-2) 中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(No.2014G1261056)
【分類號】:TP391.1
【正文快照】: 1引言自然語言是人們進(jìn)行通信和交流的主要工具,自然語言處理是現(xiàn)代信息科學(xué)和技術(shù)研究不可或缺的重要內(nèi)容[1]。在互聯(lián)網(wǎng)與大數(shù)據(jù)時(shí)代,存在海量易獲取的中文自然語言地址描述數(shù)據(jù),如生活服務(wù)類網(wǎng)站中說明各類興趣點(diǎn)(即商戶、學(xué)校、銀行、加油站、醫(yī)院等地理對象)位置的語句。
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 譚俊明;;自然語言的理解綜述[J];科技廣場;2008年05期
2 何祖軍;胡靜;;自然語言的規(guī)范與轉(zhuǎn)化——基于嵌入式系統(tǒng)的描述[J];計(jì)算機(jī)與現(xiàn)代化;2008年11期
3 劉海濤;關(guān)于自然語言計(jì)算機(jī)處理的幾點(diǎn)思考[J];術(shù)語標(biāo)準(zhǔn)化與信息技術(shù);2001年01期
4 劉三滿,劉荷花;論計(jì)算機(jī)處理自然語言的新趨向[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2002年04期
5 胡廣朋;用于計(jì)算機(jī)輔助教學(xué)的自然語言接口[J];微計(jì)算機(jī)應(yīng)用;2003年05期
6 張世紅;胡佳佳;宋繼華;劉會(huì)霞;琚文勝;;網(wǎng)絡(luò)環(huán)境下的自然語言檢索[J];醫(yī)學(xué)情報(bào)工作;2005年06期
7 胡廣朋;錢遙立;沈繼峰;;一種應(yīng)用規(guī)劃識別建立自然語言接口的方法[J];江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年03期
8 杜津;楊一平;曾雋芳;;自然語言時(shí)間信息的模擬與計(jì)算[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年13期
9 張雪英;閭國年;宦建;;面向漢語的自然語言路徑描述方法[J];地球信息科學(xué);2008年06期
10 彭程;;基于本體論的電子商務(wù)自然語言研究[J];微計(jì)算機(jī)信息;2008年18期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條
1 胡健;黃麗華;劉杰;;基于自然語言的智能決策支持系統(tǒng)人機(jī)接口[A];管理科學(xué)與系統(tǒng)科學(xué)進(jìn)展——全國青年管理科學(xué)與系統(tǒng)科學(xué)論文集(第4卷)[C];1997年
2 盛新華;柳勁;;自然語言否定的語用功能與交際策略[A];改革開放以來邏輯的歷程——中國邏輯學(xué)會(huì)成立30周年紀(jì)念文集(上卷)[C];2009年
3 李靈輝;林爾正;林玉婷;林丹紅;;基于自然語言檢索的中醫(yī)中風(fēng)康復(fù)古代文獻(xiàn)數(shù)據(jù)庫構(gòu)建[A];福建省圖書館學(xué)會(huì)2011年學(xué)術(shù)年會(huì)論文集[C];2011年
4 谷明哲;孟小峰;周勇;;中文自然語言查詢界面NChiql的Java設(shè)計(jì)實(shí)現(xiàn)[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1999年
5 周勇;孟小峰;劉爽;王珊;;數(shù)據(jù)庫自然語言查詢系統(tǒng)NChiql中語義依存樹向SQL的轉(zhuǎn)換[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1999年
6 萬繼華;;基于哲學(xué)本體論的真值演算系統(tǒng)——實(shí)現(xiàn)計(jì)算機(jī)理解自然語言的邏輯方法[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年
7 才讓加;吉太加;;藏語語料庫中詞性分類代碼的確定[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 田飛;用于自然語言分布式表達(dá)的聯(lián)合學(xué)習(xí)方法研究[D];中國科學(xué)技術(shù)大學(xué);2016年
2 李虎;基于本體和規(guī)則的受控自然語言系統(tǒng)模型研究[D];華中科技大學(xué);2010年
3 孟小峰;中文數(shù)據(jù)庫自然語言查詢處理研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);1999年
4 朱少楠;面向地理場景的“文—圖—景”轉(zhuǎn)換方法研究[D];南京師范大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 石亞坤;自然語言的人類理解與機(jī)器“理解”對比研究[D];陜西師范大學(xué);2011年
2 劉曉;面向高德地圖的自然語言接口語義解析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];南京師范大學(xué);2015年
3 孫婷婷;漢語搭配獲取方法研究[D];江蘇科技大學(xué);2015年
4 徐娟;面向地圖搜索領(lǐng)域的自然語言句子g鏌逡饌祭斫夥椒ㄑ芯縖D];復(fù)旦大學(xué);2014年
5 蔡靜怡;基于概念圖的關(guān)聯(lián)規(guī)則的自然語言表示方法[D];河北師范大學(xué);2015年
6 柳勁;自然語言否定的邏輯思考[D];湘潭大學(xué);2009年
7 裴君波;信息分發(fā)中自然語言訂閱接口的研究[D];北京郵電大學(xué);2015年
8 付勝博;基于自然語言的空間數(shù)據(jù)檢索研究[D];西北工業(yè)大學(xué);2007年
9 武睿峰;自然語言密寫分析及密寫量檢測[D];西北大學(xué);2014年
10 李霞;自然語言篇章中時(shí)間信息的研究及在產(chǎn)品設(shè)計(jì)領(lǐng)域中的應(yīng)用[D];西安電子科技大學(xué);2013年
,本文編號:843404
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/843404.html