疾病-病癥和病癥-治療物質(zhì)的關(guān)系抽取研究
本文關(guān)鍵詞: 信息抽取 半監(jiān)督學(xué)習(xí) Tri-training 集成學(xué)習(xí) 出處:《計算機工程與應(yīng)用》2017年10期 論文類型:期刊論文
【摘要】:隨著生物醫(yī)學(xué)文獻的快速增長,在海量的生物醫(yī)學(xué)文獻中存在大量有關(guān)疾病、病癥和治療物質(zhì)的信息,這些信息對疾病的治療和藥物的研制有著重要的意義。針對疾病與治療物質(zhì)之間的信息抽取,重點訓(xùn)練兩個模型,即疾病與病癥模型和病癥與治療物質(zhì)模型。疾病與病癥模型判斷一種疾病是否會存在或者導(dǎo)致一種生理現(xiàn)象的產(chǎn)生;病癥與治療物質(zhì)模型判斷一種物質(zhì)是否改變?nèi)说纳憩F(xiàn)象或者生理過程。使用半監(jiān)督學(xué)習(xí)的Tri-training的方法,利用大量未標注數(shù)據(jù)輔助少量有標注數(shù)據(jù)進行訓(xùn)練提高分類性能。實驗結(jié)果表明,Tri-training方法中利用未標注數(shù)據(jù)有助于提高實驗結(jié)果;且在訓(xùn)練過程中使用集成學(xué)習(xí)的思想將三個分類器器集成在一起,提高了學(xué)習(xí)性能。
[Abstract]:With the rapid growth of biomedical literature, there is a large amount of information about diseases, diseases and therapeutic substances in the vast amount of biomedical literature. This information is of great significance to the treatment of diseases and the development of drugs. Disease and disease model and disease and treatment material model. Disease and disease model to determine whether a disease will exist or lead to a physiological phenomenon; Disease and Therapeutic substances Model determines whether a substance changes a person's physiological phenomena or processes. A semi-supervised learning method called Tri-training, A large amount of unlabeled data is used to train a small amount of labeled data to improve the classification performance. The experimental results show that the use of unlabeled data in the Tri-training method is helpful to improve the experimental results. The three classifiers are integrated in the training process using the idea of integrated learning, which improves the learning performance.
【作者單位】: 大連理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金(No.61070098,No.61272373,No.61340020) 新世紀優(yōu)秀人才支撐計劃(No.NCET-13-0084) 中央高;究蒲袠I(yè)務(wù)費專項資金(No.DUT13JB09,No.DUT14YQ213)
【分類號】:TP181;TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 陳華;魏連;鄭志嫻;許榕生;;基于集成學(xué)習(xí)的網(wǎng)絡(luò)取證模型[J];福建電腦;2007年10期
2 時雷;虎曉紅;席磊;段其國;;集成學(xué)習(xí)技術(shù)在農(nóng)業(yè)中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2008年26期
3 周緒川;鐘勇;;集成學(xué)習(xí)分布式異常檢測方法[J];計算機工程與應(yīng)用;2011年18期
4 牛小飛;馬軍;馬少平;張冬梅;;基于遺傳規(guī)劃集成學(xué)習(xí)的網(wǎng)絡(luò)作弊檢測[J];中文信息學(xué)報;2012年05期
5 文益民;李健;杜飛明;陳方;;集成學(xué)習(xí)算法在不平衡分類中的應(yīng)用研究[J];計算技術(shù)與自動化;2009年02期
6 游生福;汪榮貴;戴經(jīng)成;張冬梅;;自適應(yīng)嵌套級聯(lián)的在線集成學(xué)習(xí)方法研究[J];計算機工程與應(yīng)用;2014年05期
7 孫建文;楊宗凱;劉三(女牙);王佩;;基于集成學(xué)習(xí)與遺傳算法的網(wǎng)絡(luò)書寫紋識別研究[J];計算機科學(xué);2011年06期
8 孔英會;景美麗;;基于混淆矩陣和集成學(xué)習(xí)的分類方法研究[J];計算機工程與科學(xué);2012年06期
9 文益民;王耀南;;基于訓(xùn)練集平行分割的集成學(xué)習(xí)算法研究[J];小型微型計算機系統(tǒng);2009年05期
10 何鳴;李國正;袁捷;;醫(yī)學(xué)診斷中集成學(xué)習(xí)技術(shù)的研究[J];計算機工程與應(yīng)用;2006年28期
相關(guān)會議論文 前2條
1 劉伍穎;王挺;;一種多過濾器集成學(xué)習(xí)垃圾郵件過濾方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
2 葉紅云;倪志偉;陳恩紅;;一種混合型集成學(xué)習(xí)演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
相關(guān)博士學(xué)位論文 前4條
1 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年
2 方育柯;集成學(xué)習(xí)理論研究及其在個性化推薦中的應(yīng)用[D];電子科技大學(xué);2011年
3 孫永宣;集成學(xué)習(xí)下的圖像分析關(guān)鍵問題研究[D];合肥工業(yè)大學(xué);2013年
4 劉增榮;視聽覺情感語義相干及應(yīng)用研究[D];太原理工大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類方法研究[D];蘇州大學(xué);2015年
2 湯瑩;遷移與集成學(xué)習(xí)在文本分類中的應(yīng)用研究[D];江蘇科技大學(xué);2015年
3 劉政;基于知識元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年
4 丘橋云;結(jié)合文本傾向性分析的股評可信度計算研究[D];哈爾濱工業(yè)大學(xué);2014年
5 李想;基于多示例的集成學(xué)習(xí)理論與應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年
6 李震宇;基于集成學(xué)習(xí)的數(shù)字圖像隱寫定量分析[D];解放軍信息工程大學(xué);2014年
7 陳范曙;基于信息整合的藥物相關(guān)信息挖掘方法研究[D];華東師范大學(xué);2016年
8 游攀利;基于集成SVM的文本分類方法研究[D];華中科技大學(xué);2014年
9 陶杰;基于集成學(xué)習(xí)的短文本主客觀分類研究[D];安徽工業(yè)大學(xué);2016年
10 徐燕會;基于神經(jīng)影像的進展型輕度認知功能障礙識別研究[D];安徽工業(yè)大學(xué);2016年
,本文編號:1543193
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1543193.html