基于圖的中文集成實(shí)體鏈接算法
本文選題:集成實(shí)體鏈接 + 知識(shí)庫(kù)擴(kuò)容。 參考:《計(jì)算機(jī)研究與發(fā)展》2016年02期
【摘要】:實(shí)體鏈接(entity linking)是知識(shí)庫(kù)擴(kuò)容的核心關(guān)鍵技術(shù),傳統(tǒng)的實(shí)體鏈接方法通常受制于本地知識(shí)庫(kù)的知識(shí)水平,而且忽略共現(xiàn)實(shí)體間的語(yǔ)義相關(guān)性.提出了一種基于圖的中文集成實(shí)體鏈接方法,不僅能夠充分利用知識(shí)庫(kù)中實(shí)體間的結(jié)構(gòu)化關(guān)系,而且能夠通過(guò)增量證據(jù)挖掘獲取外部知識(shí),從而實(shí)現(xiàn)對(duì)同一文本中出現(xiàn)的多個(gè)歧義實(shí)體的批量實(shí)體鏈接.在開(kāi)放域公開(kāi)測(cè)試語(yǔ)料上的實(shí)驗(yàn)結(jié)果表明,所提出的實(shí)體相關(guān)圖構(gòu)造方法、增量證據(jù)挖掘方法和實(shí)體語(yǔ)義一致性判據(jù)是有效的,算法整體性能一致且顯著地優(yōu)于當(dāng)前的主流算法.
[Abstract]:Entity link (entity linking) is the key technology of knowledge base expansion. The traditional entity link method is usually restricted by the knowledge level of the local knowledge base and neglects the semantic correlation between the co-realistic bodies. In this paper, a graph-based Chinese integrated entity link method is proposed, which can not only make full use of the structured relationships among entities in the knowledge base, but also acquire external knowledge through incremental evidence mining. In order to realize the batch entity link to the multiple ambiguous entities that appear in the same text. Experimental results on open domain open test corpus show that the proposed method of entity correlation graph construction, incremental evidence mining and entity semantic consistency criterion are effective. The overall performance of the algorithm is consistent and significantly superior to the current mainstream algorithm.
【作者單位】: 電子科技大學(xué)信息與軟件工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61133016,61272527,61202445) 教育部-中國(guó)移動(dòng)科研基金項(xiàng)目(MCM20121041) 中央高;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金(ZYGX2014J066)~~
【分類(lèi)號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳克忠;;中文信息技術(shù)的創(chuàng)新與發(fā)展(下)[J];辦公自動(dòng)化;2003年07期
2 ;《中文信息學(xué)報(bào)》征稿簡(jiǎn)則[J];中文信息學(xué)報(bào);2011年02期
3 ;《中文信息學(xué)報(bào)》征稿簡(jiǎn)則[J];中文信息學(xué)報(bào);2011年06期
4 ;《中文信息學(xué)報(bào)》征稿簡(jiǎn)則[J];中文信息學(xué)報(bào);2012年01期
5 ;《中文信息學(xué)報(bào)》征稿簡(jiǎn)則[J];中文信息學(xué)報(bào);2013年04期
6 ;《中文信息》已于十月創(chuàng)刊[J];微計(jì)算機(jī)應(yīng)用;1984年04期
7 閻久佐;;我校首創(chuàng)“計(jì)算機(jī)中文信息庫(kù)”[J];北京師范大學(xué)學(xué)報(bào)(自然科學(xué)版);1985年04期
8 ;中文系統(tǒng)的誕生、發(fā)展和使命[J];電腦技術(shù);1995年03期
9 ;加快中文信息研究和建設(shè)——國(guó)家語(yǔ)委紀(jì)念文字改革和漢語(yǔ)規(guī)范化40周年 李嵐清副總理提出當(dāng)前應(yīng)重點(diǎn)抓好三項(xiàng)工作[J];中文信息;1996年02期
10 袁誠(chéng);關(guān)于中文軟件的思考[J];上海微型計(jì)算機(jī);1996年21期
相關(guān)會(huì)議論文 前6條
1 劉春榮;;我國(guó)當(dāng)務(wù)之急是解決中文書(shū)寫(xiě)方式的根本變革[A];中國(guó)中文信息學(xué)會(huì)漢字編碼專(zhuān)業(yè)委員會(huì)第九屆年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2011年
2 陳曉鷗;;從中文電子出版到中文電子傳播[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
3 董強(qiáng);郝長(zhǎng)伶;董振東;;基于《知網(wǎng)》的中文語(yǔ)塊抽取器[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
4 王春元;張韜;;一種獲取網(wǎng)頁(yè)主要中文信息的方法[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十四卷)[C];2009年
5 ;中文信息的智能處理[A];中國(guó)中文信息學(xué)會(huì)第六次全國(guó)會(huì)員代表大會(huì)暨成立二十五周年學(xué)術(shù)會(huì)議中文信息處理重大成果匯報(bào)展資料匯編[C];2006年
6 宋彥;黃昌寧;揭春雨;;中文CCG樹(shù)庫(kù)的構(gòu)建[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
相關(guān)重要報(bào)紙文章 前2條
1 侯雪林;自主創(chuàng)新 迎接拼字文明時(shí)代到來(lái)[N];大眾科技報(bào);2007年
2 安徽 張來(lái)東;在JAVA開(kāi)發(fā)中的中文處理問(wèn)題及解決辦法[N];中國(guó)計(jì)算機(jī)報(bào);2001年
相關(guān)博士學(xué)位論文 前3條
1 丁凱;基于增量學(xué)習(xí)的中文手寫(xiě)書(shū)寫(xiě)者自適應(yīng)技術(shù)研究[D];華南理工大學(xué);2011年
2 張海軍;基于大規(guī)模語(yǔ)料的中文新詞識(shí)別技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
3 張紫瓊;在線(xiàn)中文評(píng)論情感分類(lèi)問(wèn)題研究[D];哈爾濱工業(yè)大學(xué);2010年
,本文編號(hào):2082287
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2082287.html