基于句法語義特征的中文實體關(guān)系抽取
本文關(guān)鍵詞:基于句法語義特征的中文實體關(guān)系抽取
更多相關(guān)文章: 句法特征 語義特征 實體關(guān)系抽取 SVM
【摘要】:實體關(guān)系抽取的核心問題是實體關(guān)系特征的選擇。以往的研究通常都以詞法特征、實體原始特征等來刻畫實體關(guān)系,其抽取效果已難再提高。在傳統(tǒng)方法的基礎(chǔ)上,該文提出一種基于句法特征、語義特征的實體關(guān)系抽取方法,融入了依存句法關(guān)系、核心謂詞、語義角色標注等特征,選擇SVM作為機器學(xué)習(xí)的實現(xiàn)途徑,以真實新聞文本作為語料進行實驗。實驗結(jié)果表明該方法的F1值有明顯提升。
【作者單位】: 華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心;興義民族師范學(xué)院信息技術(shù)學(xué)院;華中師范大學(xué)計算機學(xué)院;湖北大學(xué)信息與網(wǎng)絡(luò)中心;
【關(guān)鍵詞】: 句法特征 語義特征 實體關(guān)系抽取 SVM
【基金】:國家社會科學(xué)基金重大項目(12&2D223) 國家“十二五”科技支撐計劃課題(2012BAK24B01) 國家自然科學(xué)基金(61300144) 國家語委“十二五”重點項目(ZDI125-1) 教育部/國家外國專家局高等學(xué)校學(xué)科創(chuàng)新引智計劃項目(B07042) 湖北省自然科學(xué)基金重點項目(2011CDA034) 華中師范大學(xué)中央高校基本科研業(yè)務(wù)費項目(CCNU13A05014,No.CCNU13C01001,CCNU13F010)
【分類號】:TP391.4
【正文快照】: 1引言實體關(guān)系抽取是指從自然語言描述的語料中獲取命名實體之間存在的關(guān)系,例如,人名與組織機構(gòu)之間可能存在雇傭關(guān)系等。實體關(guān)系抽取是基于命名實體識別的一種更深層次的研究,能夠為事件抽取、自動問答、機器翻譯以及自然語言處理相關(guān)領(lǐng)域的研究提供前提保障[1]。在大數(shù)據(jù)
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 劉懷軍;車萬翔;劉挺;;中文語義角色標注的特征工程[J];中文信息學(xué)報;2007年01期
2 陳鵬;郭劍毅;余正濤;線巖團;嚴馨;魏斯超;;基于凸組合核函數(shù)的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J];中文信息學(xué)報;2013年05期
3 李業(yè)剛;孫福振;李鑒柏;呂新宇;;語義角色標注研究綜述[J];山東理工大學(xué)學(xué)報(自然科學(xué)版);2011年06期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱譯翔;;中文名詞性謂詞的語義角色標注的研究[J];福建電腦;2010年09期
2 王慧蘭;;漢語句類依存樹庫的構(gòu)建研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2013年01期
3 羅森林;韓磊;潘麗敏;馮揚;劉盈盈;;漢語句義結(jié)構(gòu)模型及其驗證[J];北京理工大學(xué)學(xué)報;2013年02期
4 呂雷;;基于CRFsuite分類器的漢語框架語義角色標注[J];電腦開發(fā)與應(yīng)用;2014年04期
5 鐘志農(nóng);劉方馳;吳燁;伍江江;;主動學(xué)習(xí)與自學(xué)習(xí)的中文命名實體識別[J];國防科技大學(xué)學(xué)報;2014年04期
6 賈熹濱;張艷華;包錫元;;Kappa加權(quán)的子空間融合表情識別方法[J];北京工業(yè)大學(xué)學(xué)報;2014年06期
7 王樂;閉應(yīng)洲;;基于特征模板提取及SVM的觀點句識別[J];廣西師范學(xué)院學(xué)報(自然科學(xué)版);2014年03期
8 張吉文;陳笑蓉;;基于譜聚類的詞和文檔的聯(lián)合聚類[J];貴州大學(xué)學(xué)報(自然科學(xué)版);2014年05期
9 陳麗江;陳小荷;;統(tǒng)計和規(guī)則結(jié)合識別動詞的跨分句論元[J];計算機工程與應(yīng)用;2009年16期
10 安強強;張蕾;;基于依存樹的中文語義角色標注[J];計算機工程;2010年04期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 丁偉偉;常寶寶;;基于最大熵原則的漢語語義角色分類[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
2 彭洪保;李茹;段建勇;;基于漢語框架網(wǎng)的問句語義角色自動標注研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
3 王鑫;孫薇薇;穗志方;;基于淺層句法分析的中文語義角色標注研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
4 楊敏;常寶寶;;基于北大網(wǎng)庫的語義角色分類[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
5 曾青青;楊爾弘;朱丹青;;基于信息結(jié)構(gòu)的突發(fā)事件文本事件信息自動抽取策略研究[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李世奇;面向文景轉(zhuǎn)換的中文淺層語義分析方法研究[D];哈爾濱工業(yè)大學(xué);2011年
2 王紅玲;基于特征向量的中英文語義角色標注研究[D];蘇州大學(xué);2009年
3 李軍輝;中文句法語義分析及其聯(lián)合學(xué)習(xí)機制研究[D];蘇州大學(xué);2010年
4 李茹;漢語句子框架語義結(jié)構(gòu)分析技術(shù)研究[D];山西大學(xué);2012年
5 包曉榮;基于語料庫的蒙古語簡單句施事和當事語義角色特征研究[D];內(nèi)蒙古大學(xué);2013年
6 甘勝豐;帶鋼表面缺陷圖像檢測與分類方法研究[D];中國地質(zhì)大學(xué);2013年
7 夏戰(zhàn)國;基于高斯過程的提升機軸承性能評測方法研究[D];中國礦業(yè)大學(xué);2013年
8 張瑩;在線新聞評論的情感分析研究[D];南開大學(xué);2013年
9 盧敏;具有自然分組特性文本的分類研究[D];南開大學(xué);2013年
10 劉南南;高精度導(dǎo)星測量系統(tǒng)細分定位技術(shù)研究[D];中國科學(xué)院研究生院(長春光學(xué)精密機械與物理研究所);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 程英迅;基于軍事本體的智能檢索引擎研究[D];電子科技大學(xué);2010年
2 桑亞輝;基于模板方法的漢語語句自動改寫研究[D];解放軍信息工程大學(xué);2008年
3 王文學(xué);基于聯(lián)合方法的中文語義角色標注研究[D];上海交通大學(xué);2012年
4 劉躍紅;問句依存句法及語義分析研究[D];昆明理工大學(xué);2011年
5 丁康健;考試系統(tǒng)中智能化輔助閱卷技術(shù)研究[D];哈爾濱工程大學(xué);2011年
6 邢欣;漢語事件描述單元的自動識別[D];山西大學(xué);2011年
7 朱譯翔;中文名詞性謂詞的語義角色標注研究[D];蘇州大學(xué);2011年
8 吳方磊;基于樹核方法的中文語義角色標注研究[D];蘇州大學(xué);2011年
9 徐靖;基于特征的中文名詞性謂詞語義角色標注研究[D];蘇州大學(xué);2011年
10 曾凡超;動詞框架庫的構(gòu)建技術(shù)的研究[D];沈陽航空航天大學(xué);2012年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 于江德;樊孝忠;龐文博;;事件信息抽取中語義角色標注研究[J];計算機科學(xué);2008年03期
2 車萬翔,劉挺,李生;實體關(guān)系自動抽取[J];中文信息學(xué)報;2005年02期
3 秦兵,劉挺,李生;多文檔自動文摘綜述[J];中文信息學(xué)報;2005年06期
4 董靜;孫樂;馮元勇;黃瑞紅;;中文實體關(guān)系抽取中的特征選擇研究[J];中文信息學(xué)報;2007年04期
5 陳耀東;王挺;陳火旺;;半監(jiān)督學(xué)習(xí)和主動學(xué)習(xí)相結(jié)合的淺層語義分析[J];中文信息學(xué)報;2008年02期
6 奚斌;錢龍華;周國棟;朱巧明;錢培德;;語言學(xué)組合特征在語義關(guān)系抽取中的應(yīng)用[J];中文信息學(xué)報;2008年03期
7 黃瑞紅;孫樂;馮元勇;黃云平;;基于核方法的中文實體關(guān)系抽取研究[J];中文信息學(xué)報;2008年05期
8 郭劍毅;薛征山;余正濤;張志坤;張宜浩;姚賢明;;基于層疊條件隨機場的旅游領(lǐng)域命名實體識別[J];中文信息學(xué)報;2009年05期
9 丁偉偉;常寶寶;;基于語義組塊分析的漢語語義角色標注[J];中文信息學(xué)報;2009年05期
10 李軍輝;王紅玲;周國棟;朱巧明;錢培德;;語義角色標注中句法特征的研究[J];中文信息學(xué)報;2009年06期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄧擘;鄭彥寧;傅繼彬;;漢語實體關(guān)系模式的自動獲取研究[J];計算機科學(xué);2010年02期
2 牟晉娟;包宏;;中文實體關(guān)系抽取研究[J];計算機工程與設(shè)計;2009年15期
3 朱姍;;基于規(guī)則和本體的實體關(guān)系抽取系統(tǒng)研究[J];情報雜志;2010年S2期
4 車萬翔,劉挺,李生;實體關(guān)系自動抽取[J];中文信息學(xué)報;2005年02期
5 朱鴻宇;劉瑰;陳左寧;唐福華;;實體關(guān)系識別中長距離依賴問題的研究[J];小型微型計算機系統(tǒng);2008年02期
6 周利娟;林鴻飛;羅文華;;基于實體關(guān)系的犯罪網(wǎng)絡(luò)識別機制[J];計算機應(yīng)用研究;2011年03期
7 徐健;張智雄;吳振新;;實體關(guān)系抽取的技術(shù)方法綜述[J];現(xiàn)代圖書情報技術(shù);2008年08期
8 李小紅;錢龍華;;基于自舉的弱指導(dǎo)中文實體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期
9 董靜;孫樂;馮元勇;黃瑞紅;;中文實體關(guān)系抽取中的特征選擇研究[J];中文信息學(xué)報;2007年04期
10 黃晨;錢龍華;周國棟;朱巧明;;基于卷積樹核的無指導(dǎo)中文實體關(guān)系抽取研究[J];中文信息學(xué)報;2010年04期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 車萬翔;劉挺;李生;;實體關(guān)系自動抽取[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
2 莊成龍;錢龍華;周國棟;;基于樹核函數(shù)的實體關(guān)系抽取方法研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
3 徐芬;王挺;陳火旺;;基于SVM方法的中文實體關(guān)系抽取[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 張奇;信息抽取中實體關(guān)系識別研究[D];中國科學(xué)技術(shù)大學(xué);2010年
2 張宏濤;面向生物文本的實體關(guān)系自動抽取問題研究[D];清華大學(xué);2012年
3 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉龍;音樂領(lǐng)域全局實體關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2010年
2 雷春雅;領(lǐng)域?qū)嶓w關(guān)系自動抽取研究[D];昆明理工大學(xué);2011年
3 劉安安;開放式中文實體關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2013年
4 陳超;基于互聯(lián)網(wǎng)的二元實體關(guān)系抽取研究[D];華東師范大學(xué);2013年
5 周藍s,
本文編號:651576
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/651576.html