基于電子病歷時態(tài)數(shù)據(jù)的住院病人急性腎損傷風(fēng)險預(yù)測
發(fā)布時間:2024-12-01 03:29
急性腎損傷(Acute Kidney Injury,AKI)是一種以腎功能急速減退為特征的臨床綜合癥。每年我國有上百萬人罹患這種疾病,而國際研究表明其死亡率超過五成。目前沒有很好的治療方法,早期診斷是關(guān)鍵,F(xiàn)有研究通過分析電子病歷(Electronic Medical Record,EMR)中的診斷、治療和保健等健康相關(guān)活動的數(shù)字記錄,構(gòu)建AKI預(yù)測模型。但是,上述研究沒有考慮EMR中的時態(tài)信息,沒有反映病人的用藥行為和治療效果,導(dǎo)致模型性能不佳。同時,EMR中正負(fù)樣本的極度不平衡,使預(yù)測模型結(jié)果存在偏差。本文主要分為兩部分研究AKI風(fēng)險預(yù)測問題:首先,應(yīng)用兩種考慮時態(tài)信息的時態(tài)數(shù)據(jù)處理方法Stacked-Temporal和Multitask-Temporal來挖掘電子病歷中的時態(tài)信息,提高AKI風(fēng)險預(yù)測模型的性能。其次,本文采用了訓(xùn)練集劃分模型集成的方法解決類非平衡問題,以提高正樣本的預(yù)測準(zhǔn)確率。通過案例研究發(fā)現(xiàn),未經(jīng)非平衡處理的情況下,Recall最高為0.57,F1值最高為0.29。采用訓(xùn)練集劃分模型集成的方法時,Recall最高可達0.72,F1最高達0.33。說明經(jīng)過非平衡處理...
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:4013484
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3-1訓(xùn)練集劃分模型集成過程
20圖3-1訓(xùn)練集劃分模型集成過程集成方法的結(jié)果主要是通過投票(Voting)和加權(quán)確定。投票一般是針
圖4-6數(shù)據(jù)處理過程示意圖
圖4-6數(shù)據(jù)處理過程示意圖通過上面三種方法我們得到不同的數(shù)據(jù)集,利用卡方檢驗分別計算不同數(shù)據(jù)集中各個變量的卡方統(tǒng)計量和P值。P值表示當(dāng)原假設(shè)成立時拒絕原假設(shè)的概率,是一個小概率事件的概率。在統(tǒng)計學(xué)中,認(rèn)為當(dāng)P值小于0.05我們認(rèn)為具有顯
圖5-5ROC曲線圖
圖5-5ROC曲線圖出,曲線越偏往左上方則模型分類效果越好。reaUnderCurve)被定義為ROC曲線下的面積,其值要用到AUC是因為ROC曲線不能明確的對分類器
本文編號:4013484
本文鏈接:http://sikaile.net/yixuelunwen/mjlw/4013484.html
最近更新
教材專著