基于多知識(shí)庫(kù)的短文本實(shí)體鏈接方法研究——以Wikipedia和Freebase為例
本文關(guān)鍵詞:基于多知識(shí)庫(kù)的短文本實(shí)體鏈接方法研究——以Wikipedia和Freebase為例
更多相關(guān)文章: 實(shí)體鏈接 知識(shí)庫(kù) Wikipedia Freebase
【摘要】:【目的】基于多知識(shí)庫(kù)進(jìn)行實(shí)體鏈接,解決基于單一知識(shí)庫(kù)的實(shí)體鏈接覆蓋度低的問(wèn)題!痉椒ā渴紫壬晌谋镜膎-gram并利用詞性和多個(gè)指稱 實(shí)體字典獲取候選指稱,然后生成指稱組合并保留覆蓋度最大且不被其他組合包含的指稱組合,接著生成候選實(shí)體序列并利用多知識(shí)庫(kù)信息計(jì)算實(shí)體序列的相關(guān)度,最后選擇相關(guān)度最大的實(shí)體序列為最終結(jié)果!窘Y(jié)果】以Wikipedia和Freebase為例的實(shí)驗(yàn)結(jié)果表明,基于Wikipedia+Freebase的實(shí)體鏈接準(zhǔn)確率、召回率、F值分別達(dá)到71.81%、76.86%、74.25%!揪窒蕖炕谠~性過(guò)濾n-gram缺乏理論依據(jù),數(shù)據(jù)集FACC1具有高準(zhǔn)確率和低召回率的特點(diǎn)!窘Y(jié)論】利用多個(gè)知識(shí)庫(kù)的實(shí)體信息,能夠提升實(shí)體鏈接效果。
【作者單位】: 武漢大學(xué)信息管理學(xué)院;武漢大學(xué)信息資源研究中心;
【關(guān)鍵詞】: 實(shí)體鏈接 知識(shí)庫(kù) Wikipedia Freebase
【基金】:國(guó)家自然科學(xué)基金面上項(xiàng)目“基于語(yǔ)言模型的通用實(shí)體檢索建模及框架實(shí)現(xiàn)研究”(項(xiàng)目編號(hào):71173164) 武漢大學(xué)與中國(guó)科技信息研究所合作項(xiàng)目“科學(xué)文獻(xiàn)的語(yǔ)義功能識(shí)別與深度利用”的研究成果之一
【分類號(hào)】:TP391.1
【正文快照】:
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 陸偉;武川;;實(shí)體鏈接研究綜述[J];情報(bào)學(xué)報(bào);2015年01期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 周鵬程;武川;陸偉;;基于多知識(shí)庫(kù)的短文本實(shí)體鏈接方法研究——以Wikipedia和Freebase為例[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2016年06期
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 孫鎮(zhèn);王惠臨;;命名實(shí)體識(shí)別研究進(jìn)展綜述[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2010年06期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 Jeremy Wagstaff;;Wikipedia:把世界變成一個(gè)網(wǎng)頁(yè)[J];中國(guó)數(shù)字電視;2007年08期
2 ;[J];;年期
,本文編號(hào):839307
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/839307.html