基于深度學(xué)習(xí)模型預(yù)測(cè)ICU患者死亡率的可解釋性研究
發(fā)布時(shí)間:2022-01-25 08:09
隨著醫(yī)療衛(wèi)生事業(yè)的發(fā)展,電子病歷系統(tǒng)得到了長(zhǎng)足進(jìn)步,國(guó)家在《“十一五”衛(wèi)生信息化建設(shè)設(shè)想》中提出了推進(jìn)電子病歷等衛(wèi)生信息化工程,依托電子病歷系統(tǒng),醫(yī)院可以得到大量的有價(jià)值的數(shù)據(jù)并對(duì)其進(jìn)行研究。關(guān)于電子病歷死亡率方面的研究可以追溯到1991年,如今深度學(xué)習(xí)算法在很多領(lǐng)域展現(xiàn)了其優(yōu)秀的性能,因此越來(lái)越多的研究人員將深度學(xué)習(xí)算法應(yīng)用于電子病歷研究。然而一般的深度學(xué)習(xí)算法無(wú)法很好地解釋模型分類的依據(jù)和原理,人們對(duì)模型的信任度低;谶@個(gè)問(wèn)題,本文使用一種可解釋的深度學(xué)習(xí)模型對(duì)重癥加強(qiáng)護(hù)理病房(ICU,Intensive Care Unit)患者的進(jìn)行分類,并對(duì)結(jié)果進(jìn)行解釋性的討論。本文提取了Medical Information Mart for Intensive Care Ⅲ(MIMIC Ⅲ)醫(yī)學(xué)數(shù)據(jù)庫(kù)中ICU患者的生理數(shù)據(jù),將患者的文本數(shù)據(jù)轉(zhuǎn)換為圖片數(shù)據(jù),通過(guò)遷移學(xué)習(xí),使VGG16深度神經(jīng)網(wǎng)絡(luò)和梯度類激活映射(graddient based class activate mapping,Grad-CAM)結(jié)合,使用VGG16-Grad-CAM結(jié)合方法對(duì)患者進(jìn)行生存,死亡預(yù)測(cè),并將結(jié)果進(jìn)行...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
k近鄰算法原理圖
電子科技大學(xué)碩士學(xué)位論文14圖2-2支持向量機(jī)分類原理圖如圖2-2所示,wx+b=0即為分離超平面,對(duì)于線形可分的數(shù)據(jù)集來(lái)說(shuō),幾何間隔最大的分離超平面只有一個(gè)。支持向量機(jī)算法即在產(chǎn)生的無(wú)數(shù)個(gè)可分類超平面中尋找?guī)缀伍g隔最大的超平面,達(dá)到對(duì)樣本最好的分類效果。標(biāo)準(zhǔn)的支持向量機(jī)算法是一種二分類模型,其學(xué)習(xí)策略即為間隔最大化。即min12‖‖22.(+)≥1(=1,2,…)(2-1)然而在標(biāo)準(zhǔn)支持向量機(jī)中有一對(duì)矛盾體,即最大間隔和最小訓(xùn)練誤差,于是提出了軟間隔支持向量機(jī),軟間隔支持向量機(jī)的基本思想是對(duì)訓(xùn)練集中的每一個(gè)樣本引入一個(gè)松弛變量,使間隔大于等于1,即(+)≥1。并且引入一個(gè)懲罰參數(shù),懲罰參數(shù)越大對(duì)誤分類的懲罰越大。使用軟間隔最大化可以解決帶有異常點(diǎn)的分類問(wèn)題。2.2.3多層感知機(jī)算法多層感知機(jī)(MultilayerPerceptron,MLP)又名人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)[21,22],其結(jié)構(gòu)為輸入層,隱藏層,輸出層。最簡(jiǎn)單的多層感知機(jī)只有一個(gè)隱藏層,多層感知機(jī)基本結(jié)構(gòu)如下圖。
第二章數(shù)據(jù)統(tǒng)計(jì)及模型認(rèn)識(shí)15圖2-3多層感知機(jī)模型結(jié)構(gòu)圖從圖中可以看到,多層感知機(jī)每個(gè)層之間為全連接的,一開(kāi)始是輸入層,中間是隱藏層,最后是輸出層。假設(shè)輸入為={1,2,3,,},輸出為(1+),1為權(quán)重,b為偏置,函數(shù)f常用sigmoid或者tanh函數(shù)。多層感知機(jī)的每一個(gè)節(jié)點(diǎn)即為一個(gè)感知器,當(dāng)信號(hào)從輸入層被傳入時(shí),進(jìn)入隱藏層,隱藏層節(jié)點(diǎn)根據(jù)傳入的信號(hào)進(jìn)行計(jì)算,將計(jì)算后的結(jié)果傳入下一層,最后從輸出層輸出結(jié)果。多層感知機(jī)的訓(xùn)練過(guò)程即為尋找最佳的權(quán)重和偏置等參數(shù)使得模型能夠最好地?cái)M合數(shù)據(jù)。2.2.4隨機(jī)森林算法上世紀(jì)八十年代Breiman等人發(fā)明了決策樹(shù)算法,決策樹(shù)算法通過(guò)不斷二分類數(shù)據(jù)進(jìn)行分類或回歸。2001年Breiman把決策樹(shù)組合為隨機(jī)森林(RandomForest,RF)[23-25],隨機(jī)森林是一種Bagging算法的變體,是在以決策樹(shù)為基學(xué)習(xí)器構(gòu)建Bagging集成的基礎(chǔ)上,進(jìn)一步在決策樹(shù)的訓(xùn)練過(guò)程中引入隨機(jī)屬性選擇的方法。隨機(jī)森林是隨機(jī)化變量提取和數(shù)據(jù)提取,生成很多無(wú)關(guān)聯(lián)的決策樹(shù),每一個(gè)決策樹(shù)都是一個(gè)弱分類器,最后匯總所有決策樹(shù)的結(jié)果。隨機(jī)森林算法在沒(méi)有顯著提高計(jì)算量的前提下提高了預(yù)測(cè)精度。下圖為隨機(jī)森林算法結(jié)構(gòu)圖。
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)的可解釋性[J]. 吳飛,廖彬兵,韓亞洪. 航空兵器. 2019(01)
[2]國(guó)內(nèi)電子病歷發(fā)展與應(yīng)用現(xiàn)狀分析[J]. 馬錫坤,楊國(guó)斌,于京杰. 計(jì)算機(jī)應(yīng)用與軟件. 2015(01)
[3]急性心肌梗死患者入院時(shí)心率水平與死亡率相關(guān)性分析[J]. 羅建華,黃征. 浙江中西醫(yī)結(jié)合雜志. 2009(02)
[4]APACHEⅡ與SAPSⅡ評(píng)分系統(tǒng)對(duì)急診內(nèi)科危重患者病情評(píng)估價(jià)值的比較[J]. 孟新科,鄧躍林. 中國(guó)危重病急救醫(yī)學(xué). 2001(12)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的重癥監(jiān)護(hù)病患死亡率預(yù)測(cè)[D]. 張英凱.電子科技大學(xué) 2018
本文編號(hào):3608189
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
k近鄰算法原理圖
電子科技大學(xué)碩士學(xué)位論文14圖2-2支持向量機(jī)分類原理圖如圖2-2所示,wx+b=0即為分離超平面,對(duì)于線形可分的數(shù)據(jù)集來(lái)說(shuō),幾何間隔最大的分離超平面只有一個(gè)。支持向量機(jī)算法即在產(chǎn)生的無(wú)數(shù)個(gè)可分類超平面中尋找?guī)缀伍g隔最大的超平面,達(dá)到對(duì)樣本最好的分類效果。標(biāo)準(zhǔn)的支持向量機(jī)算法是一種二分類模型,其學(xué)習(xí)策略即為間隔最大化。即min12‖‖22.(+)≥1(=1,2,…)(2-1)然而在標(biāo)準(zhǔn)支持向量機(jī)中有一對(duì)矛盾體,即最大間隔和最小訓(xùn)練誤差,于是提出了軟間隔支持向量機(jī),軟間隔支持向量機(jī)的基本思想是對(duì)訓(xùn)練集中的每一個(gè)樣本引入一個(gè)松弛變量,使間隔大于等于1,即(+)≥1。并且引入一個(gè)懲罰參數(shù),懲罰參數(shù)越大對(duì)誤分類的懲罰越大。使用軟間隔最大化可以解決帶有異常點(diǎn)的分類問(wèn)題。2.2.3多層感知機(jī)算法多層感知機(jī)(MultilayerPerceptron,MLP)又名人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)[21,22],其結(jié)構(gòu)為輸入層,隱藏層,輸出層。最簡(jiǎn)單的多層感知機(jī)只有一個(gè)隱藏層,多層感知機(jī)基本結(jié)構(gòu)如下圖。
第二章數(shù)據(jù)統(tǒng)計(jì)及模型認(rèn)識(shí)15圖2-3多層感知機(jī)模型結(jié)構(gòu)圖從圖中可以看到,多層感知機(jī)每個(gè)層之間為全連接的,一開(kāi)始是輸入層,中間是隱藏層,最后是輸出層。假設(shè)輸入為={1,2,3,,},輸出為(1+),1為權(quán)重,b為偏置,函數(shù)f常用sigmoid或者tanh函數(shù)。多層感知機(jī)的每一個(gè)節(jié)點(diǎn)即為一個(gè)感知器,當(dāng)信號(hào)從輸入層被傳入時(shí),進(jìn)入隱藏層,隱藏層節(jié)點(diǎn)根據(jù)傳入的信號(hào)進(jìn)行計(jì)算,將計(jì)算后的結(jié)果傳入下一層,最后從輸出層輸出結(jié)果。多層感知機(jī)的訓(xùn)練過(guò)程即為尋找最佳的權(quán)重和偏置等參數(shù)使得模型能夠最好地?cái)M合數(shù)據(jù)。2.2.4隨機(jī)森林算法上世紀(jì)八十年代Breiman等人發(fā)明了決策樹(shù)算法,決策樹(shù)算法通過(guò)不斷二分類數(shù)據(jù)進(jìn)行分類或回歸。2001年Breiman把決策樹(shù)組合為隨機(jī)森林(RandomForest,RF)[23-25],隨機(jī)森林是一種Bagging算法的變體,是在以決策樹(shù)為基學(xué)習(xí)器構(gòu)建Bagging集成的基礎(chǔ)上,進(jìn)一步在決策樹(shù)的訓(xùn)練過(guò)程中引入隨機(jī)屬性選擇的方法。隨機(jī)森林是隨機(jī)化變量提取和數(shù)據(jù)提取,生成很多無(wú)關(guān)聯(lián)的決策樹(shù),每一個(gè)決策樹(shù)都是一個(gè)弱分類器,最后匯總所有決策樹(shù)的結(jié)果。隨機(jī)森林算法在沒(méi)有顯著提高計(jì)算量的前提下提高了預(yù)測(cè)精度。下圖為隨機(jī)森林算法結(jié)構(gòu)圖。
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)的可解釋性[J]. 吳飛,廖彬兵,韓亞洪. 航空兵器. 2019(01)
[2]國(guó)內(nèi)電子病歷發(fā)展與應(yīng)用現(xiàn)狀分析[J]. 馬錫坤,楊國(guó)斌,于京杰. 計(jì)算機(jī)應(yīng)用與軟件. 2015(01)
[3]急性心肌梗死患者入院時(shí)心率水平與死亡率相關(guān)性分析[J]. 羅建華,黃征. 浙江中西醫(yī)結(jié)合雜志. 2009(02)
[4]APACHEⅡ與SAPSⅡ評(píng)分系統(tǒng)對(duì)急診內(nèi)科危重患者病情評(píng)估價(jià)值的比較[J]. 孟新科,鄧躍林. 中國(guó)危重病急救醫(yī)學(xué). 2001(12)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的重癥監(jiān)護(hù)病患死亡率預(yù)測(cè)[D]. 張英凱.電子科技大學(xué) 2018
本文編號(hào):3608189
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/3608189.html
最近更新
教材專著