基于圖的中文集成實體鏈接算法
本文選題:集成實體鏈接 + 知識庫擴容; 參考:《計算機研究與發(fā)展》2016年02期
【摘要】:實體鏈接(entity linking)是知識庫擴容的核心關(guān)鍵技術(shù),傳統(tǒng)的實體鏈接方法通常受制于本地知識庫的知識水平,而且忽略共現(xiàn)實體間的語義相關(guān)性.提出了一種基于圖的中文集成實體鏈接方法,不僅能夠充分利用知識庫中實體間的結(jié)構(gòu)化關(guān)系,而且能夠通過增量證據(jù)挖掘獲取外部知識,從而實現(xiàn)對同一文本中出現(xiàn)的多個歧義實體的批量實體鏈接.在開放域公開測試語料上的實驗結(jié)果表明,所提出的實體相關(guān)圖構(gòu)造方法、增量證據(jù)挖掘方法和實體語義一致性判據(jù)是有效的,算法整體性能一致且顯著地優(yōu)于當(dāng)前的主流算法.
[Abstract]:Entity link (entity linking) is the key technology of knowledge base expansion. The traditional entity link method is usually restricted by the knowledge level of the local knowledge base and neglects the semantic correlation between the co-realistic bodies. In this paper, a graph-based Chinese integrated entity link method is proposed, which can not only make full use of the structured relationships among entities in the knowledge base, but also acquire external knowledge through incremental evidence mining. In order to realize the batch entity link to the multiple ambiguous entities that appear in the same text. Experimental results on open domain open test corpus show that the proposed method of entity correlation graph construction, incremental evidence mining and entity semantic consistency criterion are effective. The overall performance of the algorithm is consistent and significantly superior to the current mainstream algorithm.
【作者單位】: 電子科技大學(xué)信息與軟件工程學(xué)院;
【基金】:國家自然科學(xué)基金項目(61133016,61272527,61202445) 教育部-中國移動科研基金項目(MCM20121041) 中央高;究蒲袠I(yè)務(wù)費專項資金(ZYGX2014J066)~~
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 吳克忠;;中文信息技術(shù)的創(chuàng)新與發(fā)展(下)[J];辦公自動化;2003年07期
2 ;《中文信息學(xué)報》征稿簡則[J];中文信息學(xué)報;2011年02期
3 ;《中文信息學(xué)報》征稿簡則[J];中文信息學(xué)報;2011年06期
4 ;《中文信息學(xué)報》征稿簡則[J];中文信息學(xué)報;2012年01期
5 ;《中文信息學(xué)報》征稿簡則[J];中文信息學(xué)報;2013年04期
6 ;《中文信息》已于十月創(chuàng)刊[J];微計算機應(yīng)用;1984年04期
7 閻久佐;;我校首創(chuàng)“計算機中文信息庫”[J];北京師范大學(xué)學(xué)報(自然科學(xué)版);1985年04期
8 ;中文系統(tǒng)的誕生、發(fā)展和使命[J];電腦技術(shù);1995年03期
9 ;加快中文信息研究和建設(shè)——國家語委紀(jì)念文字改革和漢語規(guī)范化40周年 李嵐清副總理提出當(dāng)前應(yīng)重點抓好三項工作[J];中文信息;1996年02期
10 袁誠;關(guān)于中文軟件的思考[J];上海微型計算機;1996年21期
相關(guān)會議論文 前6條
1 劉春榮;;我國當(dāng)務(wù)之急是解決中文書寫方式的根本變革[A];中國中文信息學(xué)會漢字編碼專業(yè)委員會第九屆年會暨學(xué)術(shù)研討會論文集[C];2011年
2 陳曉鷗;;從中文電子出版到中文電子傳播[A];輝煌二十年——中國中文信息學(xué)會二十周年學(xué)術(shù)會議論文集[C];2001年
3 董強;郝長伶;董振東;;基于《知網(wǎng)》的中文語塊抽取器[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
4 王春元;張韜;;一種獲取網(wǎng)頁主要中文信息的方法[A];全國計算機安全學(xué)術(shù)交流會論文集(第二十四卷)[C];2009年
5 ;中文信息的智能處理[A];中國中文信息學(xué)會第六次全國會員代表大會暨成立二十五周年學(xué)術(shù)會議中文信息處理重大成果匯報展資料匯編[C];2006年
6 宋彥;黃昌寧;揭春雨;;中文CCG樹庫的構(gòu)建[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
相關(guān)重要報紙文章 前2條
1 侯雪林;自主創(chuàng)新 迎接拼字文明時代到來[N];大眾科技報;2007年
2 安徽 張來東;在JAVA開發(fā)中的中文處理問題及解決辦法[N];中國計算機報;2001年
相關(guān)博士學(xué)位論文 前3條
1 丁凱;基于增量學(xué)習(xí)的中文手寫書寫者自適應(yīng)技術(shù)研究[D];華南理工大學(xué);2011年
2 張海軍;基于大規(guī)模語料的中文新詞識別技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
3 張紫瓊;在線中文評論情感分類問題研究[D];哈爾濱工業(yè)大學(xué);2010年
,本文編號:2082287
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2082287.html