實體詞語義信息對中文實體關(guān)系抽取的作用研究
[Abstract]:In order to explore the role of the semantic information of entity words extracted from external dictionaries in the extraction of Chinese entity relations, two new features, the semantic tree of knowledge web and the coding tree of synonym forest, are proposed, together with the existing shortest path dependency tree. The first basic semantic source, synonym forest coding, entity large class and entity subclass feature are studied together to study its influence on extraction performance. Experimental data show that, as a single feature, the performance of the proposed two new features is not as good as that of the entity class and the entity subclass, but it is better than the shortest path dependency tree, the first basic semantic element of the network, and the encoding of the synonym forest. As a combination feature, the shortest path dependency tree and the combined features of two new features achieve the best performance. It can be concluded that the features of the shortest path dependency tree, the semantic tree of the known web and the coding tree of the synonym forest obtained from the non-corpus can replace the features of the large and small classes of entities obtained from the corpus. It can be used for the next open domain relational extraction.
【作者單位】: 太原理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院;武漢大學(xué)軟件工程國家重點實驗室;
【基金】:武漢大學(xué)軟件工程國家重點實驗室開放課題(SKLSE2012-09-30) 山西省自然科學(xué)基金資助項目(2013011015-2)
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 鄧擘;鄭彥寧;傅繼彬;;漢語實體關(guān)系模式的自動獲取研究[J];計算機科學(xué);2010年02期
2 牟晉娟;包宏;;中文實體關(guān)系抽取研究[J];計算機工程與設(shè)計;2009年15期
3 朱姍;;基于規(guī)則和本體的實體關(guān)系抽取系統(tǒng)研究[J];情報雜志;2010年S2期
4 車萬翔,劉挺,李生;實體關(guān)系自動抽取[J];中文信息學(xué)報;2005年02期
5 朱鴻宇;劉瑰;陳左寧;唐福華;;實體關(guān)系識別中長距離依賴問題的研究[J];小型微型計算機系統(tǒng);2008年02期
6 周利娟;林鴻飛;羅文華;;基于實體關(guān)系的犯罪網(wǎng)絡(luò)識別機制[J];計算機應(yīng)用研究;2011年03期
7 徐健;張智雄;吳振新;;實體關(guān)系抽取的技術(shù)方法綜述[J];現(xiàn)代圖書情報技術(shù);2008年08期
8 李小紅;錢龍華;;基于自舉的弱指導(dǎo)中文實體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期
9 董靜;孫樂;馮元勇;黃瑞紅;;中文實體關(guān)系抽取中的特征選擇研究[J];中文信息學(xué)報;2007年04期
10 黃晨;錢龍華;周國棟;朱巧明;;基于卷積樹核的無指導(dǎo)中文實體關(guān)系抽取研究[J];中文信息學(xué)報;2010年04期
相關(guān)會議論文 前3條
1 車萬翔;劉挺;李生;;實體關(guān)系自動抽取[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
2 莊成龍;錢龍華;周國棟;;基于樹核函數(shù)的實體關(guān)系抽取方法研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
3 徐芬;王挺;陳火旺;;基于SVM方法的中文實體關(guān)系抽取[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前5條
1 陳忱;面向Web的實體關(guān)系查詢與分析關(guān)鍵技術(shù)研究[D];東北大學(xué);2013年
2 郭喜躍;面向開放領(lǐng)域文本的實體關(guān)系抽取[D];華中師范大學(xué);2016年
3 張奇;信息抽取中實體關(guān)系識別研究[D];中國科學(xué)技術(shù)大學(xué);2010年
4 張宏濤;面向生物文本的實體關(guān)系自動抽取問題研究[D];清華大學(xué);2012年
5 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 施琦;無監(jiān)督中文實體關(guān)系抽取研究[D];中國地質(zhì)大學(xué)(北京);2015年
2 林家欣;基于多源知識的地理選擇題答題方法研究[D];哈爾濱工業(yè)大學(xué);2015年
3 劉紹毓;實體關(guān)系抽取關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2015年
4 胡春艷;中文開放式實體關(guān)系抽取技術(shù)研究[D];東北大學(xué);2014年
5 程文亮;中文企業(yè)知識圖譜構(gòu)建與分析[D];華東師范大學(xué);2016年
6 徐力;面向Web2.0的二元人物關(guān)系抽取研究[D];華東交通大學(xué);2016年
7 韓海丹;面向智能服務(wù)機器人的家庭環(huán)境關(guān)系知識庫構(gòu)建[D];燕山大學(xué);2016年
8 孔兵;中文文本實體關(guān)系抽取方法研究[D];哈爾濱工業(yè)大學(xué);2016年
9 劉q,
本文編號:2322170
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2322170.html