基于有限數(shù)據(jù)的臨床預(yù)測(cè)模型研究
發(fā)布時(shí)間:2021-06-12 04:55
隨著信息技術(shù)的高速發(fā)展和醫(yī)院信息系統(tǒng)的日益普及,患者的臨床資料得以電子化記錄和存儲(chǔ)。這些臨床數(shù)據(jù)能夠反映患者的身體狀況,為患病嚴(yán)重程度評(píng)估和疾病風(fēng)險(xiǎn)預(yù)測(cè)提供重要依據(jù)。臨床預(yù)測(cè)模型是基于醫(yī)學(xué)數(shù)據(jù)利用機(jī)器學(xué)習(xí)技術(shù)建立的疾病診斷和預(yù)測(cè)工具,能夠?yàn)獒t(yī)生診斷病情、制定治療管理方案以及進(jìn)行醫(yī)學(xué)研究提供科學(xué)依據(jù)和決策支持,具有重要的應(yīng)用價(jià)值。但在臨床實(shí)踐中,醫(yī)學(xué)樣本往往數(shù)量較少且數(shù)據(jù)不完整,容易導(dǎo)致機(jī)器學(xué)習(xí)算法過擬合、預(yù)測(cè)誤差大、不穩(wěn)定,限制了臨床預(yù)測(cè)模型的性能。針對(duì)上述問題,本論文研究了有限醫(yī)學(xué)數(shù)據(jù)條件下預(yù)測(cè)模型的構(gòu)建方法,以提升模型的預(yù)測(cè)性能,促進(jìn)臨床預(yù)測(cè)模型在實(shí)踐中發(fā)揮切實(shí)有效的作用。本論文主要完成了以下工作:(1)針對(duì)醫(yī)學(xué)數(shù)據(jù)缺失的問題,建立了自適應(yīng)加權(quán)投票隨機(jī)森林(Adaptive weight voting random forest,AWVRF)算法。當(dāng)樹節(jié)點(diǎn)變量缺失時(shí),該算法允許被處理的樣本在當(dāng)前節(jié)點(diǎn)上退出并根據(jù)所涉及變量的強(qiáng)度調(diào)整投票權(quán)重,通過加權(quán)投票做出最終決策。采用10個(gè)UCI標(biāo)準(zhǔn)數(shù)據(jù)集對(duì)該算法進(jìn)行測(cè)試,結(jié)果表明AWVRF的正確率和AUROC指標(biāo)優(yōu)于現(xiàn)行的補(bǔ)缺策略決策算法mea...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:121 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.2典型RNN模型??
?第2章臨床預(yù)測(cè)模型技術(shù)基礎(chǔ)???v?輸出層??圖2.2典型RNN模型??9?yt-i?9t?yt+i??o?o?o?o??v?v?v?v??h?_?/if_i?ht?hf+i??u?u?u?u??X?Xt_i?xt?xt+1??圖2.3典型RNN模型的展開圖??圖2.4展示了?RNN中重復(fù)模塊的結(jié)構(gòu)。??ht??r?、??tanh?ht??Tl^r??Xt??圖2.4?RNN中重復(fù)模塊的結(jié)構(gòu)??第f?zhèn)時(shí)刻重復(fù)模塊的輸出為??21??
?浙江大學(xué)博士學(xué)位論文???輸出門這3種門控開關(guān),可分別處理不同的信息:遺忘門負(fù)責(zé)去除不再需要的信??息;輸入門負(fù)責(zé)添加有用信息至記憶單元;輸出門負(fù)責(zé)控制輸出。由于遺忘門、??輸入門和輸出門以及記憶單元的設(shè)計(jì),LSTM能夠勝任保留和更新長(zhǎng)距離信息的??任務(wù)。??ht????人■?-W?ct??fL?XX?0trl??xt??圖2.7?LSTM結(jié)構(gòu)圖??LSTM?模塊的輸入是Xt。由公式(2-10)、(2-11)、(2-12)、(2-13)和(2-14)分別計(jì)??算得到當(dāng)前時(shí)刻的遺忘門A、輸入門it、候選值G、細(xì)胞狀態(tài)&和輸出門ot。再通??過公式(2-15)計(jì)算可得第/個(gè)時(shí)刻隱藏層的輸出/it。??ft?=?a(wr[ht^,Xt]?+?bf)?(2-10)??it?=?〇-(^i?■?[ht-vXt]?+?bi)?(2-11)??Ct?-?tanh(wc?■?+?bc)?(2-12)??Ct?=?ft*?Q-1?+?it*Ct?(2-13)??〇t?=?〇-(w〇?■?[h^Xt]?+?b〇)?(2-14)??ht?=?ot?*?tanh{Ct)?(2-15)??在這些公式中,和匕是模型的權(quán)重和偏置參數(shù),是上一時(shí)刻隱藏層的??輸出,Cm是上一時(shí)刻細(xì)胞狀態(tài)。符號(hào)?代表矩陣乘法(Matrixmultiplication),??而符號(hào)*代表元素積(Element-wise?product)。符號(hào)a代表sigmoid函數(shù),符號(hào)??tan/i代表hyperbolic?tangent函數(shù),其具體形式如公式(2-16)和(2-17)所不。??a(z)?=?_??-眷?g?(2-17)??
【參考文獻(xiàn)】:
期刊論文
[1]臨床預(yù)測(cè)模型:基本概念、應(yīng)用場(chǎng)景及研究思路[J]. 谷鴻秋,周支瑞,章仲恒,周權(quán). 中國(guó)循證心血管醫(yī)學(xué)雜志. 2018(12)
[2]基于臨床數(shù)據(jù)集的缺失值處理方法比較[J]. 李琳,楊紅梅,楊日東,胡珊,張學(xué)良,周毅. 中國(guó)數(shù)字醫(yī)學(xué). 2018(04)
[3]重癥監(jiān)護(hù)室住院死亡風(fēng)險(xiǎn)的預(yù)測(cè)方法研究[J]. 謝俊卿,藺軻,孔桂蘭. 計(jì)算機(jī)工程與應(yīng)用. 2017(20)
[4]基于隨機(jī)森林的乳腺腫瘤細(xì)針穿刺輔助診斷[J]. 孫偉,張俊升,邢培銳. 計(jì)算機(jī)應(yīng)用. 2015(S2)
[5]常用分類算法在不同樣本量和類分布的不平衡數(shù)據(jù)中的分類效果比較[J]. 袁聯(lián)雄,佘玲玲,林愛華,駱福添. 中國(guó)醫(yī)院統(tǒng)計(jì). 2015 (01)
[6]數(shù)據(jù)缺失的類型和處理方法及其在醫(yī)學(xué)中的應(yīng)用[J]. 黃光煒. 中國(guó)醫(yī)院統(tǒng)計(jì). 2013 (03)
[7]臨床研究中缺失值的類型和處理方法研究[J]. 唐健元,楊志敏,楊進(jìn)波,黃欽,吳春芳,馮毅. 中國(guó)衛(wèi)生統(tǒng)計(jì). 2011(03)
[8]有限樣本下中文垃圾郵件過濾的研究與實(shí)現(xiàn)[J]. 張洪勝,耿煥同,喻為民. 計(jì)算機(jī)應(yīng)用與軟件. 2008(01)
[9]幾種不同缺失值填充方法的比較[J]. 劉星毅,農(nóng)國(guó)才. 南寧師范高等?茖W(xué)校學(xué)報(bào). 2007(03)
[10]小樣本機(jī)器學(xué)習(xí)算法的特性分析與應(yīng)用[J]. 辛憲會(huì),葉秋果,滕惠忠,郭思海,李軍,張靚,韓曉宏. 海洋測(cè)繪. 2007(03)
博士論文
[1]遷移學(xué)習(xí)問題與方法研究[D]. 龍明盛.清華大學(xué) 2014
[2]數(shù)據(jù)挖掘中分類分析的策略研究及其生物醫(yī)學(xué)應(yīng)用[D]. 張超.南方醫(yī)科大學(xué) 2008
碩士論文
[1]不完全數(shù)據(jù)的處理方法及其在醫(yī)學(xué)研究中的應(yīng)用[D]. 李樹威.重慶醫(yī)科大學(xué) 2014
[2]機(jī)器學(xué)習(xí)中的特征選擇算法研究[D]. 姜百寧.中國(guó)海洋大學(xué) 2009
[3]基于實(shí)例和特征的遷移學(xué)習(xí)算法研究[D]. 戴文淵.上海交通大學(xué) 2009
[4]數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)質(zhì)量控制問題研究[D]. 熊霞.武漢大學(xué) 2004
本文編號(hào):3225989
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:121 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.2典型RNN模型??
?第2章臨床預(yù)測(cè)模型技術(shù)基礎(chǔ)???v?輸出層??圖2.2典型RNN模型??9?yt-i?9t?yt+i??o?o?o?o??v?v?v?v??h?_?/if_i?ht?hf+i??u?u?u?u??X?Xt_i?xt?xt+1??圖2.3典型RNN模型的展開圖??圖2.4展示了?RNN中重復(fù)模塊的結(jié)構(gòu)。??ht??r?、??tanh?ht??Tl^r??Xt??圖2.4?RNN中重復(fù)模塊的結(jié)構(gòu)??第f?zhèn)時(shí)刻重復(fù)模塊的輸出為??21??
?浙江大學(xué)博士學(xué)位論文???輸出門這3種門控開關(guān),可分別處理不同的信息:遺忘門負(fù)責(zé)去除不再需要的信??息;輸入門負(fù)責(zé)添加有用信息至記憶單元;輸出門負(fù)責(zé)控制輸出。由于遺忘門、??輸入門和輸出門以及記憶單元的設(shè)計(jì),LSTM能夠勝任保留和更新長(zhǎng)距離信息的??任務(wù)。??ht????人■?-W?ct??fL?XX?0trl??xt??圖2.7?LSTM結(jié)構(gòu)圖??LSTM?模塊的輸入是Xt。由公式(2-10)、(2-11)、(2-12)、(2-13)和(2-14)分別計(jì)??算得到當(dāng)前時(shí)刻的遺忘門A、輸入門it、候選值G、細(xì)胞狀態(tài)&和輸出門ot。再通??過公式(2-15)計(jì)算可得第/個(gè)時(shí)刻隱藏層的輸出/it。??ft?=?a(wr[ht^,Xt]?+?bf)?(2-10)??it?=?〇-(^i?■?[ht-vXt]?+?bi)?(2-11)??Ct?-?tanh(wc?■?+?bc)?(2-12)??Ct?=?ft*?Q-1?+?it*Ct?(2-13)??〇t?=?〇-(w〇?■?[h^Xt]?+?b〇)?(2-14)??ht?=?ot?*?tanh{Ct)?(2-15)??在這些公式中,和匕是模型的權(quán)重和偏置參數(shù),是上一時(shí)刻隱藏層的??輸出,Cm是上一時(shí)刻細(xì)胞狀態(tài)。符號(hào)?代表矩陣乘法(Matrixmultiplication),??而符號(hào)*代表元素積(Element-wise?product)。符號(hào)a代表sigmoid函數(shù),符號(hào)??tan/i代表hyperbolic?tangent函數(shù),其具體形式如公式(2-16)和(2-17)所不。??a(z)?=?_??-眷?g?(2-17)??
【參考文獻(xiàn)】:
期刊論文
[1]臨床預(yù)測(cè)模型:基本概念、應(yīng)用場(chǎng)景及研究思路[J]. 谷鴻秋,周支瑞,章仲恒,周權(quán). 中國(guó)循證心血管醫(yī)學(xué)雜志. 2018(12)
[2]基于臨床數(shù)據(jù)集的缺失值處理方法比較[J]. 李琳,楊紅梅,楊日東,胡珊,張學(xué)良,周毅. 中國(guó)數(shù)字醫(yī)學(xué). 2018(04)
[3]重癥監(jiān)護(hù)室住院死亡風(fēng)險(xiǎn)的預(yù)測(cè)方法研究[J]. 謝俊卿,藺軻,孔桂蘭. 計(jì)算機(jī)工程與應(yīng)用. 2017(20)
[4]基于隨機(jī)森林的乳腺腫瘤細(xì)針穿刺輔助診斷[J]. 孫偉,張俊升,邢培銳. 計(jì)算機(jī)應(yīng)用. 2015(S2)
[5]常用分類算法在不同樣本量和類分布的不平衡數(shù)據(jù)中的分類效果比較[J]. 袁聯(lián)雄,佘玲玲,林愛華,駱福添. 中國(guó)醫(yī)院統(tǒng)計(jì). 2015 (01)
[6]數(shù)據(jù)缺失的類型和處理方法及其在醫(yī)學(xué)中的應(yīng)用[J]. 黃光煒. 中國(guó)醫(yī)院統(tǒng)計(jì). 2013 (03)
[7]臨床研究中缺失值的類型和處理方法研究[J]. 唐健元,楊志敏,楊進(jìn)波,黃欽,吳春芳,馮毅. 中國(guó)衛(wèi)生統(tǒng)計(jì). 2011(03)
[8]有限樣本下中文垃圾郵件過濾的研究與實(shí)現(xiàn)[J]. 張洪勝,耿煥同,喻為民. 計(jì)算機(jī)應(yīng)用與軟件. 2008(01)
[9]幾種不同缺失值填充方法的比較[J]. 劉星毅,農(nóng)國(guó)才. 南寧師范高等?茖W(xué)校學(xué)報(bào). 2007(03)
[10]小樣本機(jī)器學(xué)習(xí)算法的特性分析與應(yīng)用[J]. 辛憲會(huì),葉秋果,滕惠忠,郭思海,李軍,張靚,韓曉宏. 海洋測(cè)繪. 2007(03)
博士論文
[1]遷移學(xué)習(xí)問題與方法研究[D]. 龍明盛.清華大學(xué) 2014
[2]數(shù)據(jù)挖掘中分類分析的策略研究及其生物醫(yī)學(xué)應(yīng)用[D]. 張超.南方醫(yī)科大學(xué) 2008
碩士論文
[1]不完全數(shù)據(jù)的處理方法及其在醫(yī)學(xué)研究中的應(yīng)用[D]. 李樹威.重慶醫(yī)科大學(xué) 2014
[2]機(jī)器學(xué)習(xí)中的特征選擇算法研究[D]. 姜百寧.中國(guó)海洋大學(xué) 2009
[3]基于實(shí)例和特征的遷移學(xué)習(xí)算法研究[D]. 戴文淵.上海交通大學(xué) 2009
[4]數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)質(zhì)量控制問題研究[D]. 熊霞.武漢大學(xué) 2004
本文編號(hào):3225989
本文鏈接:http://sikaile.net/shoufeilunwen/yxlbs/3225989.html
最近更新
教材專著