基于雙模型投票的人物關系抽取研究
本文關鍵詞:基于雙模型投票的人物關系抽取研究 出處:《計算機應用研究》2017年03期 論文類型:期刊論文
【摘要】:網頁標題具有簡潔、信息量大的特點,而且其中蘊涵了豐富、動態(tài)、復雜的人物關系。主要針對網頁標題文本中的人物關系抽取進行研究,提出一種雙模型投票的機器學習方法。針對19種關系類型分別進行特征抽取和選擇;使用兩種統(tǒng)計模型——最大熵和支持向量機分別進行模型訓練;對于每種關系類型利用模型投票的方法,即選擇訓練集中得到性能較好的模型作為該類的模型,最后使用訓練好的模型對測試集進行測試。結果顯示,該方法對于人物關系抽取任務取得了總體F1值為67.64%的性能。
[Abstract]:The title of a web page has the characteristics of simplicity and large amount of information, and it contains rich, dynamic and complex character relationships. This paper mainly focuses on the extraction of the relationship between people in the text of the title of the page. A two-model voting machine learning method is proposed, in which the feature extraction and selection are carried out for 19 relation types. Two statistical models, maximum entropy and support vector machine, are used for model training. For each relationship type, the model voting method is used, that is, the model with better performance is selected as the model of the training set. Finally, the trained model is used to test the test set. The result shows. This method achieves a total F1 value of 67.64% for the human relationship extraction task.
【作者單位】: 內蒙古師范大學計算機與信息工程學院;
【基金】:國家自然科學基金資助項目(61562068) 內蒙古師范大學“十百千”人才培養(yǎng)工程資助項目;內蒙古師范大學引進人才科研啟動經費資助項目(2014YJRC036);內蒙古師范大學校級基金資助項目(2015YBXM002) 內蒙古民委蒙古文信息化專項扶持子項目(MW-2014-MGYWXXH-01) 內蒙古自然科學基金資助項目(2013MS0912,2013MS0913,2014MS0617,2015MS0629) 內蒙古自治區(qū)高等學?茖W研究資助項目(NJZY028)
【分類號】:TP391.1;TP181
【正文快照】: 0引言伴隨著互聯(lián)網大數(shù)據(jù)的日益增長,如何從大數(shù)據(jù)中挖掘人們需要的有用信息成為科研人員關注的主要問題。而分散在海量數(shù)據(jù)中的人物與人物之間的關系(也稱為實體關系)是其中一類非常有用的信息,它在機器翻譯、信息檢索、自動問答等領域具有重要的價值。實體關系抽取是從自由
【相似文獻】
相關期刊論文 前3條
1 傅宛菊;陳木蘭;;中國新魔幻電影的類型化初探[J];東南傳播;2014年08期
2 丁海峰;;論電影《海洋天堂》中細節(jié)的運用[J];西部廣播電視;2013年05期
3 ;[J];;年期
相關會議論文 前3條
1 白勁鵬;;可怕的對稱——論《了不起的蓋茨比》中的主次人物關系[A];外語語言教學研究——黑龍江省外國語學會第十一次學術年會論文集[C];1997年
2 黃素影;;《天倫》創(chuàng)作小結[A];我的角色與我們的劇團——第六屆電影表演藝術學會獎文集[C];1997年
3 吳士余;;重視人物關系的典型化[A];《毛澤東文藝思想研究》第三輯暨全國毛澤東文藝思想研究會第三次年會論文集[C];1983年
相關重要報紙文章 前6條
1 本報記者 張悅;音樂劇《蝶》推出修排版[N];中國藝術報;2008年
2 記者 金朝力;網絡視頻業(yè)首推人臉識別功能[N];北京商報;2010年
3 本文實習記者 張柳青;紀念汶川地震一周年[N];中國電影報;2009年
4 許柏林;小成本拍出大境界[N];人民日報;2012年
5 張克丹 綜合整理;青春·理想·奮斗·奉獻[N];中國電影報;2009年
6 上海戲劇學院副教授 石俊;問號的力量[N];文匯報;2012年
相關碩士學位論文 前10條
1 潘云;基于中文在線資源的人物關系抽取研究[D];華東師范大學;2015年
2 史軍;初析舞劇《奶奶的信》的立意與結構[D];北京舞蹈學院;2015年
3 唐丞博;談《追夢時刻》中人物關系的發(fā)展和變化[D];云南藝術學院;2016年
4 劉博佳;基于維基百科的人物關系抽取研究[D];北京交通大學;2016年
5 陳靜;關于《哥兒》的中譯本中粗話的翻譯研究[D];北京外國語大學;2016年
6 馮元為;基于知識圖譜構建人物關系的設計與實現(xiàn)[D];重慶大學;2016年
7 徐珊;孫昌涉初期小說的人物關系和作家意識研究[D];山東大學;2009年
8 顧靜航;基于信息抽取的人物關系網絡構建研究[D];蘇州大學;2014年
9 許婷;基于話單挖掘的可視化人物關系分析系統(tǒng)的設計與實現(xiàn)[D];哈爾濱工業(yè)大學;2014年
10 范少帥;基于特征向量的人物關系抽取方法研究[D];華東交通大學;2015年
,本文編號:1392967
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1392967.html