結(jié)合從句級遠(yuǎn)程監(jiān)督與半監(jiān)督集成學(xué)習(xí)的關(guān)系抽取方法
[Abstract]:Aiming at the problems of noise and negative case data utilization in traditional relational extraction methods based on remote supervision, a relationship extraction method combining clause level remote monitoring with semi-supervised integrated learning is proposed. First, the relational instance set is constructed by remote supervision, and the noise in the relational instance set is removed by using the de-noising algorithm based on clause recognition. Then the lexical features of relational instances are extracted and transformed into distributed representation vectors to construct feature data sets. Finally, all positive data and partial negative case data in feature data set are selected to form annotated data sets, and the remaining negative case data are selected to form unlabeled datasets. The improved semi-supervised learning algorithm is used to train the relationship classifier. Experimental results show that the proposed method can achieve higher classification accuracy and recall than baseline method.
【作者單位】: 浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院;浙江鴻程計算機系統(tǒng)有限公司;
【基金】:國家自然科學(xué)基金項目(No.61332017,60703040) 浙江省重大科技專項(No.2015C33002,2013C01046,2011C13042) 中國工程科技知識中心項目(No.CKCEST-2014-1-5)資助~~
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 袁漢寧;;雙層多示例集成學(xué)習(xí)[J];武漢理工大學(xué)學(xué)報(信息與管理工程版);2011年05期
2 俞揚;周志華;;集成學(xué)習(xí)中完全隨機學(xué)習(xí)策略研究[J];計算機工程;2006年17期
3 張滄生;崔麗娟;楊剛;倪志宏;;集成學(xué)習(xí)算法的比較研究[J];河北大學(xué)學(xué)報(自然科學(xué)版);2007年05期
4 陳凱;;基于聚類技術(shù)的集成學(xué)習(xí)差異性研究[J];南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報;2008年04期
5 李凱;崔麗娟;;集成學(xué)習(xí)算法的差異性及性能比較[J];計算機工程;2008年06期
6 潘志松;燕繼坤;;少數(shù)類的集成學(xué)習(xí)[J];南京航空航天大學(xué)學(xué)報;2009年04期
7 陳凱;馬景義;;一種選擇性SER-BagBoosting Trees集成學(xué)習(xí)研究[J];計算機科學(xué);2009年09期
8 陳全;趙文輝;李潔;江雨燕;;選擇性集成學(xué)習(xí)算法的研究[J];計算機技術(shù)與發(fā)展;2010年02期
9 張燕平;曹振田;趙姝;鄭堯軍;杜玲;竇蓉蓉;;一種新的決策樹選擇性集成學(xué)習(xí)方法[J];計算機工程與應(yīng)用;2010年17期
10 饒峰;;核機器集成學(xué)習(xí)算法的誤差分析[J];重慶文理學(xué)院學(xué)報(自然科學(xué)版);2010年04期
相關(guān)會議論文 前4條
1 關(guān)菁華;劉大有;賈海洋;;自適應(yīng)多分類器集成學(xué)習(xí)算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
2 劉伍穎;王挺;;一種多過濾器集成學(xué)習(xí)垃圾郵件過濾方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
4 李燁;蔡云澤;許曉鳴;;基于支持向量機集成的故障診斷[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 阿里木·賽買提(Alim.Samat);基于集成學(xué)習(xí)的全極化SAR圖像分類研究[D];南京大學(xué);2015年
2 王永明;集成回歸問題若干關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年
3 常征;基于混合集成學(xué)習(xí)的眼部與四肢交互動作建模與識別[D];北京科技大學(xué);2016年
4 張春霞;集成學(xué)習(xí)中有關(guān)算法的研究[D];西安交通大學(xué);2010年
5 劉天羽;基于特征選擇技術(shù)的集成學(xué)習(xí)方法及其應(yīng)用研究[D];上海大學(xué);2007年
6 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年
7 王清;集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D];復(fù)旦大學(xué);2011年
8 方育柯;集成學(xué)習(xí)理論研究及其在個性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年
9 侯勇;特征提取與集成學(xué)習(xí)算法的研究及應(yīng)用[D];北京科技大學(xué);2015年
10 李燁;基于支持向量機的集成學(xué)習(xí)研究[D];上海交通大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類方法研究[D];蘇州大學(xué);2015年
2 宋文展;基于抽樣的集成進(jìn)化算法研究[D];廣西大學(xué);2015年
3 湯瑩;遷移與集成學(xué)習(xí)在文本分類中的應(yīng)用研究[D];江蘇科技大學(xué);2015年
4 劉政;基于知識元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年
5 丘橋云;結(jié)合文本傾向性分析的股評可信度計算研究[D];哈爾濱工業(yè)大學(xué);2014年
6 秦海;融合非標(biāo)記樣本選擇的集成學(xué)習(xí)研究[D];湘潭大學(xué);2015年
7 李想;基于多示例的集成學(xué)習(xí)理論與應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年
8 李震宇;基于集成學(xué)習(xí)的數(shù)字圖像隱寫定量分析[D];解放軍信息工程大學(xué);2014年
9 王希玲;基于選擇性集成學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測方法研究[D];青島科技大學(xué);2016年
10 陳范曙;基于信息整合的藥物相關(guān)信息挖掘方法研究[D];華東師范大學(xué);2016年
,本文編號:2366515
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2366515.html