開放式地理實體關(guān)系抽取的Bootstrapping方法
本文關(guān)鍵詞:開放式地理實體關(guān)系抽取的Bootstrapping方法
更多相關(guān)文章: 文本挖掘 地理實體 關(guān)系抽取 定量評價 bootstrapping
【摘要】:從網(wǎng)絡(luò)文本中抽取地理實體間空間關(guān)系和語義關(guān)系要求高時效性和強魯棒性。本文提出一種開放式地理實體關(guān)系的自動抽取方法,通過bootstrapping技術(shù)統(tǒng)計詞語的詞性、位置和距離特征來計算語境中詞語權(quán)值,據(jù)此確定描述地理實體關(guān)系的關(guān)鍵詞,最終組織成結(jié)構(gòu)化實例,并使用百度百科和Stanford CoreNLP開展了試驗。研究結(jié)果表明,本文方法能自動挖掘自然語言的部分詞法特征,無須領(lǐng)域?qū)<抑R和大規(guī)模標(biāo)注語料,適用于未知關(guān)系類型的信息抽取任務(wù);較之經(jīng)典的Frequency、TFIDF和PPMI頻率統(tǒng)計方法,精度和召回率分別提升約5%和23%。
【作者單位】: 中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室;中國科學(xué)院大學(xué);江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心;
【基金】:國家自然科學(xué)基金(41271408) 國家863計劃(2013AA120305)~~
【分類號】:P208
【正文快照】: 包含地理實體(如地名、組織機構(gòu)、地緣政治實體)間語義關(guān)系(如從屬、合作、繼承關(guān)系)和空間關(guān)系(如拓?fù)洹⒎轿、距離關(guān)系)的文本資源在廣義地理信息采集與服務(wù)中占據(jù)重要地位[1-2],為地圖數(shù)據(jù)庫更新提供了巨大潛能,催生了開放式地理實體關(guān)系抽取研究[3-5]。開放式地理實體關(guān)系
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 趙軍;劉康;周光有;蔡黎;;開放式文本信息抽取[J];中文信息學(xué)報;2011年06期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 曾道建;來斯惟;張元哲;劉康;趙軍;;面向非結(jié)構(gòu)化文本的開放式實體屬性抽取[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2013年03期
2 賈真;楊宇飛;何大可;劉勝久;尹紅風(fēng);;面向中文網(wǎng)絡(luò)百科的屬性和屬性值抽取[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
3 朱敏;賈真;左玲;吳安峻;陳方正;柏玉;;中文微博實體鏈接研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
4 譚詠梅;楊雪;;結(jié)合實體鏈接與實體聚類的命名實體消歧[J];北京郵電大學(xué)學(xué)報;2014年05期
5 李暢;;信息抽取和實體消歧[J];福建電腦;2014年11期
6 余麗;陸鋒;張恒才;;網(wǎng)絡(luò)文本蘊涵地理信息抽取:研究進展與展望[J];地球信息科學(xué)學(xué)報;2015年02期
7 饒齊;王裴巖;張桂平;;面向中文專利SAO結(jié)構(gòu)抽取的文本特征比較研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2015年02期
8 陳晨;王厚峰;;中文跨文本人名同名同指消解研究[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2015年02期
9 唐偉;洪宇;馮艷卉;姚建民;朱巧明;;網(wǎng)頁中商品“屬性—值”關(guān)系的自動抽取方法研究[J];中文信息學(xué)報;2013年01期
10 肖升;何炎祥;;事件超圖模型及類型識別[J];中文信息學(xué)報;2013年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 劉娜;文本自動摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年
2 賈真;面向中文網(wǎng)絡(luò)百科的本體學(xué)習(xí)與知識獲取研究[D];西南交通大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉晶;基于相關(guān)性特征權(quán)重選擇決策樹算法的學(xué)術(shù)關(guān)系分類規(guī)則提取[D];中南大學(xué);2012年
2 李紅亮;基于規(guī)則的百科人物屬性抽取算法的研究[D];西南交通大學(xué);2013年
3 謝振立;基于觀點挖掘的用戶情感傾向性分析[D];華南理工大學(xué);2013年
4 鄭珊珊;基于中文語法特征的開放領(lǐng)域?qū)嶓w關(guān)系抽取[D];華東師范大學(xué);2013年
5 楊春磊;基于模式匹配的結(jié)構(gòu)化信息抽取研究[D];合肥工業(yè)大學(xué);2013年
6 謝秋妹;故事事件語義建模及其應(yīng)用研究[D];湖南大學(xué);2013年
7 楊宇飛;面向中文網(wǎng)絡(luò)百科的屬性關(guān)系抽取研究[D];西南交通大學(xué);2014年
8 韓照民;社會化媒體事件挖掘與應(yīng)用研究[D];華北電力大學(xué);2014年
9 廖夢;面向問答系統(tǒng)的金融本體構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
10 官山山;中文微博實體鏈接方法研究[D];哈爾濱工業(yè)大學(xué);2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 趙軍;;命名實體識別、排歧和跨語言關(guān)聯(lián)[J];中文信息學(xué)報;2009年02期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 齊振宇;趙軍;楊帆;;一種開放式中文命名實體識別的新方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 姜琳;李宇;盧漢;曹存根;;地理實體概念及其位置關(guān)系的獲取和驗證[J];計算機科學(xué);2007年12期
2 龐森權(quán);;淺談對地理實體實施命名的方法[J];中國地名;2012年02期
3 馮曉,,李方;地理實體的定義與存在方式[J];計算機輔助工程;1995年01期
4 李四海;李艷雯;邢U
本文編號:1239316
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/1239316.html