開(kāi)放式地理實(shí)體關(guān)系抽取的Bootstrapping方法
本文關(guān)鍵詞:開(kāi)放式地理實(shí)體關(guān)系抽取的Bootstrapping方法
更多相關(guān)文章: 文本挖掘 地理實(shí)體 關(guān)系抽取 定量評(píng)價(jià) bootstrapping
【摘要】:從網(wǎng)絡(luò)文本中抽取地理實(shí)體間空間關(guān)系和語(yǔ)義關(guān)系要求高時(shí)效性和強(qiáng)魯棒性。本文提出一種開(kāi)放式地理實(shí)體關(guān)系的自動(dòng)抽取方法,通過(guò)bootstrapping技術(shù)統(tǒng)計(jì)詞語(yǔ)的詞性、位置和距離特征來(lái)計(jì)算語(yǔ)境中詞語(yǔ)權(quán)值,據(jù)此確定描述地理實(shí)體關(guān)系的關(guān)鍵詞,最終組織成結(jié)構(gòu)化實(shí)例,并使用百度百科和Stanford CoreNLP開(kāi)展了試驗(yàn)。研究結(jié)果表明,本文方法能自動(dòng)挖掘自然語(yǔ)言的部分詞法特征,無(wú)須領(lǐng)域?qū)<抑R(shí)和大規(guī)模標(biāo)注語(yǔ)料,適用于未知關(guān)系類型的信息抽取任務(wù);較之經(jīng)典的Frequency、TFIDF和PPMI頻率統(tǒng)計(jì)方法,精度和召回率分別提升約5%和23%。
【作者單位】: 中國(guó)科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室;中國(guó)科學(xué)院大學(xué);江蘇省地理信息資源開(kāi)發(fā)與利用協(xié)同創(chuàng)新中心;
【基金】:國(guó)家自然科學(xué)基金(41271408) 國(guó)家863計(jì)劃(2013AA120305)~~
【分類號(hào)】:P208
【正文快照】: 包含地理實(shí)體(如地名、組織機(jī)構(gòu)、地緣政治實(shí)體)間語(yǔ)義關(guān)系(如從屬、合作、繼承關(guān)系)和空間關(guān)系(如拓?fù)、方位、距離關(guān)系)的文本資源在廣義地理信息采集與服務(wù)中占據(jù)重要地位[1-2],為地圖數(shù)據(jù)庫(kù)更新提供了巨大潛能,催生了開(kāi)放式地理實(shí)體關(guān)系抽取研究[3-5]。開(kāi)放式地理實(shí)體關(guān)系
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 趙軍;劉康;周光有;蔡黎;;開(kāi)放式文本信息抽取[J];中文信息學(xué)報(bào);2011年06期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 曾道建;來(lái)斯惟;張?jiān)?劉康;趙軍;;面向非結(jié)構(gòu)化文本的開(kāi)放式實(shí)體屬性抽取[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年03期
2 賈真;楊宇飛;何大可;劉勝久;尹紅風(fēng);;面向中文網(wǎng)絡(luò)百科的屬性和屬性值抽取[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
3 朱敏;賈真;左玲;吳安峻;陳方正;柏玉;;中文微博實(shí)體鏈接研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
4 譚詠梅;楊雪;;結(jié)合實(shí)體鏈接與實(shí)體聚類的命名實(shí)體消歧[J];北京郵電大學(xué)學(xué)報(bào);2014年05期
5 李暢;;信息抽取和實(shí)體消歧[J];福建電腦;2014年11期
6 余麗;陸鋒;張恒才;;網(wǎng)絡(luò)文本蘊(yùn)涵地理信息抽取:研究進(jìn)展與展望[J];地球信息科學(xué)學(xué)報(bào);2015年02期
7 饒齊;王裴巖;張桂平;;面向中文專利SAO結(jié)構(gòu)抽取的文本特征比較研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年02期
8 陳晨;王厚峰;;中文跨文本人名同名同指消解研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年02期
9 唐偉;洪宇;馮艷卉;姚建民;朱巧明;;網(wǎng)頁(yè)中商品“屬性—值”關(guān)系的自動(dòng)抽取方法研究[J];中文信息學(xué)報(bào);2013年01期
10 肖升;何炎祥;;事件超圖模型及類型識(shí)別[J];中文信息學(xué)報(bào);2013年01期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 劉娜;文本自動(dòng)摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年
2 賈真;面向中文網(wǎng)絡(luò)百科的本體學(xué)習(xí)與知識(shí)獲取研究[D];西南交通大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉晶;基于相關(guān)性特征權(quán)重選擇決策樹(shù)算法的學(xué)術(shù)關(guān)系分類規(guī)則提取[D];中南大學(xué);2012年
2 李紅亮;基于規(guī)則的百科人物屬性抽取算法的研究[D];西南交通大學(xué);2013年
3 謝振立;基于觀點(diǎn)挖掘的用戶情感傾向性分析[D];華南理工大學(xué);2013年
4 鄭珊珊;基于中文語(yǔ)法特征的開(kāi)放領(lǐng)域?qū)嶓w關(guān)系抽取[D];華東師范大學(xué);2013年
5 楊春磊;基于模式匹配的結(jié)構(gòu)化信息抽取研究[D];合肥工業(yè)大學(xué);2013年
6 謝秋妹;故事事件語(yǔ)義建模及其應(yīng)用研究[D];湖南大學(xué);2013年
7 楊宇飛;面向中文網(wǎng)絡(luò)百科的屬性關(guān)系抽取研究[D];西南交通大學(xué);2014年
8 韓照民;社會(huì)化媒體事件挖掘與應(yīng)用研究[D];華北電力大學(xué);2014年
9 廖夢(mèng);面向問(wèn)答系統(tǒng)的金融本體構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
10 官山山;中文微博實(shí)體鏈接方法研究[D];哈爾濱工業(yè)大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 趙軍;;命名實(shí)體識(shí)別、排歧和跨語(yǔ)言關(guān)聯(lián)[J];中文信息學(xué)報(bào);2009年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 齊振宇;趙軍;楊帆;;一種開(kāi)放式中文命名實(shí)體識(shí)別的新方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 姜琳;李宇;盧漢;曹存根;;地理實(shí)體概念及其位置關(guān)系的獲取和驗(yàn)證[J];計(jì)算機(jī)科學(xué);2007年12期
2 龐森權(quán);;淺談對(duì)地理實(shí)體實(shí)施命名的方法[J];中國(guó)地名;2012年02期
3 馮曉,,李方;地理實(shí)體的定義與存在方式[J];計(jì)算機(jī)輔助工程;1995年01期
4 李四海;李艷雯;邢U
本文編號(hào):1239316
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/1239316.html