基于特征提取的ICU患者死亡風(fēng)險預(yù)測研究
發(fā)布時間:2023-12-09 19:01
隨著醫(yī)療數(shù)據(jù)供應(yīng)的迅速增長,預(yù)后系統(tǒng)變得越來越復(fù)雜和準(zhǔn)確,重癥監(jiān)護(hù)室尤其如此。重癥監(jiān)護(hù)室是重癥病人和危重術(shù)后患者的聚集地,目前臨床使用的典型ICU預(yù)后系統(tǒng)通常使用生理和人口統(tǒng)計數(shù)據(jù)方法,這些系統(tǒng)主要用于風(fēng)險調(diào)整,而沒有過多關(guān)注具體患者的病情發(fā)展預(yù)測。然而,過去十年中,人們對醫(yī)療數(shù)據(jù)的使用興趣顯著增加,利用大型數(shù)據(jù)集對特定患者病情預(yù)測的需求越來越多,隨著大數(shù)據(jù)分析與機(jī)器學(xué)習(xí)方法的興起,醫(yī)療領(lǐng)域與機(jī)器學(xué)習(xí)知識結(jié)合已成為ICU患者死亡風(fēng)險預(yù)測問題新的解決思路。目前多數(shù)利用機(jī)器學(xué)習(xí)方法的預(yù)測模型都專注于訓(xùn)練和改進(jìn)機(jī)器學(xué)習(xí)算法,通常忽略了數(shù)據(jù)的分析和處理。由于監(jiān)護(hù)設(shè)備的豐富性和復(fù)雜性,ICU數(shù)據(jù)往往存在維度高、采樣時間和次數(shù)不確定、類別不平衡、數(shù)據(jù)缺失等問題,這些數(shù)據(jù)問題往往會影響預(yù)測模型性能,因此對原始數(shù)據(jù)的預(yù)處理和特征提取工作對于預(yù)測模型來說是不可缺少的。本次研究著重于ICU數(shù)據(jù)的分析、特征提取和篩選,并采用決策樹、隨機(jī)森林和XGBoost三種機(jī)器學(xué)習(xí)方法建立預(yù)測模型,探索各種特征值組合對不同機(jī)器學(xué)習(xí)算法預(yù)測模型的影響。本文的主要研究內(nèi)容分為以下幾部分:首先,對研究所使用的ICU數(shù)據(jù)集進(jìn)行整...
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 臨床領(lǐng)域研究現(xiàn)狀
1.2.2 機(jī)器學(xué)習(xí)領(lǐng)域研究現(xiàn)狀
1.3 本文研究目的及研究方案
1.3.1 研究目的
1.3.2 研究方案
1.3.3 論文結(jié)構(gòu)安排
第二章 數(shù)據(jù)集及研究方法
2.1 數(shù)據(jù)集介紹
2.1.1 數(shù)據(jù)集來源
2.1.2 數(shù)據(jù)集初步分析
2.2 機(jī)器學(xué)習(xí)方法介紹
2.2.1 CART決策樹
2.2.2 隨機(jī)森林
2.2.3 XGBoost
2.3 模型評估標(biāo)準(zhǔn)
2.3.1 AUC(接收者操作特性曲線下面積)
2.3.2 正樣本分類情況評估
2.4 本章小結(jié)
第三章 樣本集特征提取
3.1 基本特征值提取
3.2 時間序列特征值提取
3.2.1 插值
3.2.2 晝夜分割
3.2.3 1h差分、12h差分、24h差分
3.2.4 反饋系數(shù)
3.3 缺失值處理
3.3.1 均值替代
3.3.2 存活患者均值替代
3.3.3 有創(chuàng)血壓與無創(chuàng)血壓結(jié)合
3.4 本章小結(jié)
第四章 方案設(shè)計及結(jié)果分析
4.1 基于機(jī)器學(xué)習(xí)的ICU死亡風(fēng)險預(yù)測方案設(shè)計
4.1.1 特征值篩選
4.1.2 重采樣
4.1.3 預(yù)測模型構(gòu)建
4.2 結(jié)果分析
4.2.1 重采樣方法比較
4.2.2 基于機(jī)器學(xué)習(xí)的ICU死亡風(fēng)險預(yù)測結(jié)果
4.2.3 特征值篩選對預(yù)測結(jié)果影響分析
4.2.4 三種機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果比較
4.2.5 基于隨機(jī)森林和XGBoost的特征值重要性分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
碩士研究生期間主要工作及相關(guān)成果
本文編號:3871971
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 臨床領(lǐng)域研究現(xiàn)狀
1.2.2 機(jī)器學(xué)習(xí)領(lǐng)域研究現(xiàn)狀
1.3 本文研究目的及研究方案
1.3.1 研究目的
1.3.2 研究方案
1.3.3 論文結(jié)構(gòu)安排
第二章 數(shù)據(jù)集及研究方法
2.1 數(shù)據(jù)集介紹
2.1.1 數(shù)據(jù)集來源
2.1.2 數(shù)據(jù)集初步分析
2.2 機(jī)器學(xué)習(xí)方法介紹
2.2.1 CART決策樹
2.2.2 隨機(jī)森林
2.2.3 XGBoost
2.3 模型評估標(biāo)準(zhǔn)
2.3.1 AUC(接收者操作特性曲線下面積)
2.3.2 正樣本分類情況評估
2.4 本章小結(jié)
第三章 樣本集特征提取
3.1 基本特征值提取
3.2 時間序列特征值提取
3.2.1 插值
3.2.2 晝夜分割
3.2.3 1h差分、12h差分、24h差分
3.2.4 反饋系數(shù)
3.3 缺失值處理
3.3.1 均值替代
3.3.2 存活患者均值替代
3.3.3 有創(chuàng)血壓與無創(chuàng)血壓結(jié)合
3.4 本章小結(jié)
第四章 方案設(shè)計及結(jié)果分析
4.1 基于機(jī)器學(xué)習(xí)的ICU死亡風(fēng)險預(yù)測方案設(shè)計
4.1.1 特征值篩選
4.1.2 重采樣
4.1.3 預(yù)測模型構(gòu)建
4.2 結(jié)果分析
4.2.1 重采樣方法比較
4.2.2 基于機(jī)器學(xué)習(xí)的ICU死亡風(fēng)險預(yù)測結(jié)果
4.2.3 特征值篩選對預(yù)測結(jié)果影響分析
4.2.4 三種機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果比較
4.2.5 基于隨機(jī)森林和XGBoost的特征值重要性分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
碩士研究生期間主要工作及相關(guān)成果
本文編號:3871971
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3871971.html
最近更新
教材專著