基于高維不平衡ICU數(shù)據(jù)的死亡率預(yù)測(cè)研究
發(fā)布時(shí)間:2020-05-06 13:29
【摘要】:重癥監(jiān)護(hù)室(the Intensive Care Unit,ICU)集中了醫(yī)院最重要的資源,旨在為危重病人提供全面、可靠的救治。對(duì)ICU病人進(jìn)行死亡率預(yù)測(cè),有助于醫(yī)生制定診治計(jì)劃,合理配置救治資源,進(jìn)而降低ICU病房病人的死亡率和減少病患的醫(yī)療費(fèi)用。然而,現(xiàn)有的死亡預(yù)測(cè)模型準(zhǔn)確率不高,預(yù)測(cè)模型多有不足。由于ICU病房的特殊性,ICU數(shù)據(jù)存在高維,不平衡分布和數(shù)據(jù)缺失等問(wèn)題,這些問(wèn)題給數(shù)據(jù)的預(yù)處理帶來(lái)很多困難。傳統(tǒng)的機(jī)器學(xué)習(xí)預(yù)測(cè)模型多是從模型組合的角度考慮進(jìn)行模型設(shè)計(jì),較少針對(duì)數(shù)據(jù)特性設(shè)計(jì)處理方法;另外,對(duì)模型的設(shè)計(jì)中較少有參數(shù)優(yōu)化的報(bào)道,而這是影響模型性能的重要因素。針對(duì)上述問(wèn)題和研究不足,本文設(shè)計(jì)了一系列的分析方法和工具,重點(diǎn)關(guān)注了對(duì)高維、不平衡數(shù)據(jù)的預(yù)處理和參數(shù)的優(yōu)化問(wèn)題。本文提出了改進(jìn)的代價(jià)敏感PCA(Modified Cost-Sensitive Principal Component Analysis,MCSPCA)算法,以改進(jìn)代價(jià)敏感主成分分析方法(Cost-Sensitive Principal Component Analysis,CSPCA)的性能,在代價(jià)系數(shù)調(diào)整時(shí)采用不同的系數(shù),最終選擇使用正類系數(shù)C_i~=1,負(fù)類系數(shù)C_i~=N_+/N_-,通過(guò)這種正負(fù)類樣本代價(jià)系數(shù)的調(diào)整再計(jì)算降維后的樣本矩陣,在特征提取階段即可實(shí)現(xiàn)對(duì)樣本的高維、不平衡問(wèn)題的改善;對(duì)參數(shù)優(yōu)化問(wèn)題,本文設(shè)計(jì)了混沌粒子群(Chaos Particle Swarm Optimization,CPSO)優(yōu)化算法,從粒子混沌序列初始化和早熟收斂判斷處理機(jī)制這兩個(gè)角度考量提升算法的性能,并對(duì)混沌序列初始化和早熟收斂機(jī)制進(jìn)行改進(jìn),以增加種群粒子在解空間分布的均勻性,提高種群陷入早熟收斂后的跳出能力。為了獲得最佳的預(yù)測(cè)模型,本文研究考察了不同的預(yù)處理方法,參數(shù)尋優(yōu)方法和不同的分類器,并在一個(gè)真實(shí)基準(zhǔn)數(shù)據(jù)集(Physionet Challenge 2012數(shù)據(jù)集)中評(píng)估了它們的AUC性能。最后的測(cè)試結(jié)果表明,該算法改善了常見(jiàn)機(jī)器學(xué)習(xí)方法的性能。我們提出的MCSPCA+CPSO+SVM模型達(dá)到最佳的AUC性能值0.7718和最少的總運(yùn)行時(shí)間814s,從而提高了ICU預(yù)測(cè)死亡率模型的預(yù)測(cè)效果。
【圖文】:
的介紹本論文構(gòu)建的預(yù)測(cè)模型,本章將要對(duì)死亡率預(yù)測(cè)建模紹,,包括死亡率建模的一般過(guò)程,主成分分析理論,粒子群理論,尤其對(duì)后三者將詳細(xì)介紹其基本原理和實(shí)現(xiàn)分析,進(jìn)改進(jìn)提供理論基礎(chǔ)。預(yù)測(cè)建模一般過(guò)程的構(gòu)建涉及很多理論和技術(shù)。同一般機(jī)器學(xué)習(xí)模型構(gòu)建過(guò)程型構(gòu)建步驟如下[34]:數(shù)據(jù)獲取,數(shù)據(jù)預(yù)處理,特征提取,參評(píng)價(jià)。首先 ICU 病房各種監(jiān)測(cè)設(shè)備,如心電監(jiān)護(hù)儀等,持續(xù)而得到的數(shù)據(jù)具有復(fù)雜的性質(zhì),需要進(jìn)行預(yù)處理。預(yù)處理方值剔除和歸一化等。預(yù)處理后再進(jìn)行特征提取,常用的特征PCA 降維等。特征提取后相較處理前,特征的復(fù)雜度大為降數(shù)優(yōu)化,最常使用的尋優(yōu)算法包含網(wǎng)格尋優(yōu)(Grid Search)算法傳(GA)算法等。將超參數(shù)應(yīng)用于分類器的預(yù)測(cè)中,構(gòu)成完整
第 2 章 模型構(gòu)建的基本理論還有圖像處理,數(shù)據(jù)壓縮和數(shù)據(jù)可視化等[42]。面解釋下 PCA 的幾何意義。下圖所示(圖 2-2),有 n 個(gè)數(shù)據(jù)點(diǎn),大致以橢圓形分布在以 x1,x2 為軸的坐這 n 個(gè)數(shù)據(jù)點(diǎn)沿 x1,x2 均有較大的離散性,若以 x1,x2 方向數(shù)據(jù)點(diǎn)值代表 n息,則會(huì)存在較大的信息損失。對(duì)數(shù)據(jù)描述稍作處理,將坐標(biāo)軸按逆時(shí)針角度,得到坐標(biāo)系 y1Oy2,此時(shí)可以發(fā)現(xiàn)數(shù)據(jù)點(diǎn)沿 y1 離散度最大,離散的用方差表述,即方差最大,比較而言在 y2 上方差最小,若此時(shí)用 n 個(gè)數(shù)據(jù)方向上的值表示原始數(shù)據(jù),則能在最大程度上減少信息損失。因此,PCA 的是:對(duì)原始數(shù)據(jù)所在的正交系統(tǒng)做旋轉(zhuǎn),找到在新的正交系統(tǒng)下原始數(shù)據(jù)差的表示。
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP18;R195
本文編號(hào):2651343
【圖文】:
的介紹本論文構(gòu)建的預(yù)測(cè)模型,本章將要對(duì)死亡率預(yù)測(cè)建模紹,,包括死亡率建模的一般過(guò)程,主成分分析理論,粒子群理論,尤其對(duì)后三者將詳細(xì)介紹其基本原理和實(shí)現(xiàn)分析,進(jìn)改進(jìn)提供理論基礎(chǔ)。預(yù)測(cè)建模一般過(guò)程的構(gòu)建涉及很多理論和技術(shù)。同一般機(jī)器學(xué)習(xí)模型構(gòu)建過(guò)程型構(gòu)建步驟如下[34]:數(shù)據(jù)獲取,數(shù)據(jù)預(yù)處理,特征提取,參評(píng)價(jià)。首先 ICU 病房各種監(jiān)測(cè)設(shè)備,如心電監(jiān)護(hù)儀等,持續(xù)而得到的數(shù)據(jù)具有復(fù)雜的性質(zhì),需要進(jìn)行預(yù)處理。預(yù)處理方值剔除和歸一化等。預(yù)處理后再進(jìn)行特征提取,常用的特征PCA 降維等。特征提取后相較處理前,特征的復(fù)雜度大為降數(shù)優(yōu)化,最常使用的尋優(yōu)算法包含網(wǎng)格尋優(yōu)(Grid Search)算法傳(GA)算法等。將超參數(shù)應(yīng)用于分類器的預(yù)測(cè)中,構(gòu)成完整
第 2 章 模型構(gòu)建的基本理論還有圖像處理,數(shù)據(jù)壓縮和數(shù)據(jù)可視化等[42]。面解釋下 PCA 的幾何意義。下圖所示(圖 2-2),有 n 個(gè)數(shù)據(jù)點(diǎn),大致以橢圓形分布在以 x1,x2 為軸的坐這 n 個(gè)數(shù)據(jù)點(diǎn)沿 x1,x2 均有較大的離散性,若以 x1,x2 方向數(shù)據(jù)點(diǎn)值代表 n息,則會(huì)存在較大的信息損失。對(duì)數(shù)據(jù)描述稍作處理,將坐標(biāo)軸按逆時(shí)針角度,得到坐標(biāo)系 y1Oy2,此時(shí)可以發(fā)現(xiàn)數(shù)據(jù)點(diǎn)沿 y1 離散度最大,離散的用方差表述,即方差最大,比較而言在 y2 上方差最小,若此時(shí)用 n 個(gè)數(shù)據(jù)方向上的值表示原始數(shù)據(jù),則能在最大程度上減少信息損失。因此,PCA 的是:對(duì)原始數(shù)據(jù)所在的正交系統(tǒng)做旋轉(zhuǎn),找到在新的正交系統(tǒng)下原始數(shù)據(jù)差的表示。
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP18;R195
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 董琳琳;姜麗杰;劉瑩;劉鐵紅;邱兵;張研;;兩種評(píng)分方法預(yù)測(cè)ICU急性腦卒中患者死亡率準(zhǔn)確性分析[J];中國(guó)急救醫(yī)學(xué);2016年06期
2 張義強(qiáng);李永生;王平;;探討APACHE Ⅱ評(píng)分對(duì)預(yù)測(cè)ICU急危重患者預(yù)后的價(jià)值[J];新疆醫(yī)學(xué);2014年10期
3 周燕;劉培玉;趙靜;王乾龍;;基于自適應(yīng)慣性權(quán)重的混沌粒子群算法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2012年03期
4 朱海梅;吳永萍;;一種高速收斂粒子群優(yōu)化算法[J];控制與決策;2010年01期
5 吳曙華,劉勵(lì)軍,沈斌,余世全,徐信發(fā),華晨,邱菁華,徐波;SAPSⅡ評(píng)分系統(tǒng)在綜合性ICU中的應(yīng)用價(jià)值[J];蘇州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2003年02期
本文編號(hào):2651343
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2651343.html
最近更新
教材專著