基于中醫(yī)電子病歷的疾病診斷方法研究
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP18;R197.4
【部分圖文】:
疾病診斷方法的相關(guān)研宄??出發(fā),進行反復(fù)的學(xué)習(xí),得到一系列弱分類器(基本分類器),然后組合這些弱分??類器構(gòu)成一個強分類器。集成學(xué)習(xí)的流程如圖2-1所示:??g鮮聊I、J??(弱學(xué)習(xí)器2?二琴\、^、??'''''強學(xué)習(xí)器)??弱學(xué)習(xí)器n??圖2-1集成學(xué)習(xí)??Figure?2-1?Ensemble?Learning??可以發(fā)現(xiàn)在集成學(xué)習(xí)中有兩個主要的問題需要解決,第一是如何得到若干個??個體學(xué)習(xí)器,第二是如何選擇一種結(jié)合策略,將這些個體學(xué)習(xí)器集合成一個強學(xué)習(xí)??器。按照個體學(xué)習(xí)器之間是否存在依賴關(guān)系可以分為兩類,第一個是個體學(xué)習(xí)器之??間存在強依賴關(guān)系,一系列個體學(xué)習(xí)器基本都需要串行生成,代表算法是Boosting??系列算法,例如Adaboost和GBDT等;第二個是個體學(xué)習(xí)器之間不存在強依賴關(guān)??系,一系列個體學(xué)習(xí)器可以并行生成,代表算法是Bagging系列算法。??Boosting是一種串行的工作機制,即個體學(xué)習(xí)器的訓(xùn)練存在依賴關(guān)系,必須一??步一步序列化進行。其基本思想是:增加前一個基學(xué)習(xí)器在訓(xùn)練訓(xùn)練過程中預(yù)測錯??誤樣本的權(quán)重
規(guī)則如下:??1)對每棵決策樹的訓(xùn)練集,隨機森林使用隨機采樣bootstrap的方法來選擇采??樣集作為決策樹的訓(xùn)練集,極端隨機樹不使用隨機采樣,而是采用原始的訓(xùn)練集。??2)在選定了劃分特征后,隨機森林會基于信息增益、基尼系數(shù)或者均方差之類??的原則,選擇一個最優(yōu)的特征值劃分點,這和傳統(tǒng)的決策樹相同。但是ExtraTree??會采用激進的方法,它會隨機的選擇一個特征值來劃分決策樹。??從第二點可以看出,由于隨機選擇了特征值的劃分點位,而不是最優(yōu)點位,這??樣會導(dǎo)致生成的決策樹的規(guī)模一般會大于隨機森林的規(guī)模。即模型的方差相對于??隨機森林進一步減少,在某些時候,極端隨機樹的泛化能力比隨機森林更好。??2.3.3模型融合??模型融合(Stacking)就是用初始訓(xùn)練數(shù)據(jù)學(xué)習(xí)出若千個基學(xué)習(xí)器后,將這幾??個學(xué)習(xí)器的預(yù)測結(jié)果作為新的訓(xùn)練集,來學(xué)習(xí)一個新的學(xué)習(xí)器的方法。Stacking的??具體流程如圖2-2所示:??Model?1?Model?1?Model?1?Model?1?Model?1?New?Feature?Model2??
在本實驗中,我們將針對慢性病毒性乙型肝炎、二型糖尿病和肝硬化的數(shù)據(jù)??集,得到基于WBFS方法所篩選的特征和基于專家手工篩選后的特征,選擇相同??的分類預(yù)測模型,比較兩種方法的優(yōu)劣性。實驗結(jié)果見圖3-3:??27??
【參考文獻】
相關(guān)期刊論文 前2條
1 孟洪宇;孟慶剛;;基于條件隨機場的中醫(yī)術(shù)語抽取方法及其應(yīng)用探析[J];中華中醫(yī)藥學(xué)刊;2014年10期
2 李梢;張博;;中藥網(wǎng)絡(luò)藥理學(xué):理論、方法與應(yīng)用(英文)[J];中國天然藥物;2013年02期
相關(guān)博士學(xué)位論文 前2條
1 胡佳卉;基于信息處理的中醫(yī)藥治療2型糖尿病方藥數(shù)據(jù)挖掘與分析研究[D];北京中醫(yī)藥大學(xué);2017年
2 宋亞南;基于數(shù)據(jù)挖掘的新安醫(yī)家婦科常見病辨治特色與用藥規(guī)律研究[D];北京中醫(yī)藥大學(xué);2017年
相關(guān)碩士學(xué)位論文 前5條
1 王萍;基于電子病歷數(shù)據(jù)的疾病預(yù)測模型構(gòu)建研究[D];吉林大學(xué);2017年
2 李昆;基于電子病歷的深度神經(jīng)網(wǎng)絡(luò)預(yù)測模型研究與應(yīng)用[D];鄭州大學(xué);2017年
3 李奇航;面向復(fù)雜因素的心血管疾病預(yù)測研究[D];鄭州大學(xué);2017年
4 王鳳利;基于BP神經(jīng)網(wǎng)絡(luò)和DS證據(jù)理論的疾病預(yù)測模型研究[D];太原理工大學(xué);2016年
5 張宸鳴;核矩陣近似的研究及其在支持向量機中的應(yīng)用[D];北京交通大學(xué);2015年
本文編號:2837075
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2837075.html