腦卒中類型與復(fù)發(fā)的Logistic回歸預(yù)測(cè)及SMOTE算法處理非平衡臨床數(shù)據(jù)
發(fā)布時(shí)間:2018-02-02 17:11
本文關(guān)鍵詞: 腦卒中 Logistic 回歸分析 SMOTE 非平衡數(shù)據(jù) 出處:《河北醫(yī)科大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:目的:腦卒中是一種突然起病的腦血液循環(huán)障礙性疾病,居全世界主要死因的第二位,分為缺血性腦卒中和出血性腦卒中,兩者的治療方法大不相同,目前臨床判斷卒中類型最準(zhǔn)確的方式是CT或MRI檢查,但在未能進(jìn)行影像檢查的情況下,只能依據(jù)臨床表現(xiàn)初步判斷類型,較容易誤診。本研究擬通過已有的臨床數(shù)據(jù),構(gòu)建腦卒中分型回歸模型、腦卒中復(fù)發(fā)回歸模型,用于臨床輔助診斷及出院后的健康管理,并評(píng)價(jià)預(yù)測(cè)效果,希望能夠?yàn)榕R床提供一種輔助診斷手段,提高診斷正確率。使用分類模型分類時(shí)需要有分布較平衡的數(shù)據(jù)才能獲得良好效果,在多數(shù)類似的研究中,數(shù)據(jù)不平衡現(xiàn)象普遍存在,本研究引入了非平衡數(shù)據(jù)處理方法SMOTE(Synthetic Minority Over-sampling Technique)算法、隨機(jī)復(fù)制法及欠抽樣法,并對(duì)處理結(jié)果進(jìn)行了比較。 方法:獲取石家莊市某醫(yī)院因腦卒中入院治療244例患者的病例及出院后健康監(jiān)測(cè)數(shù)據(jù)并整理,通過IBM SPSS進(jìn)行Logistic回歸分析,方法采用向前法,變量入選水準(zhǔn)入=0.05,出=0.10,獲得構(gòu)建回歸模型所需參數(shù),獲得Logistic回歸方程。若數(shù)據(jù)中出現(xiàn)類別分布不平衡的現(xiàn)象,導(dǎo)致分類預(yù)測(cè)準(zhǔn)確率或靈敏度較低,則使用數(shù)據(jù)平衡方法平衡數(shù)據(jù),隨機(jī)復(fù)制過抽樣法及隨機(jī)欠抽樣法均使用SPSS中的隨機(jī)抽樣功能選擇,SMOTE算法則使用使用R語言DmWR程序包中的SMOTE函數(shù)調(diào)用SMOTE算法平衡數(shù)據(jù), 結(jié)果: 1獲得了腦卒中分型的回歸模型,其預(yù)測(cè)準(zhǔn)確率較高。腦卒中分型回歸模型CoxSnell R Square檢驗(yàn)擬合優(yōu)度為0.634,預(yù)測(cè)準(zhǔn)確率為86.1%。 2得到了腦卒中復(fù)發(fā)預(yù)測(cè)的回歸模型,其預(yù)測(cè)靈敏度較低。缺血性腦卒中復(fù)發(fā)回歸模型CoxSnell R Square檢驗(yàn)擬合優(yōu)度為0.236,其靈敏度為28.6%。出血性腦卒中復(fù)發(fā)回歸模型CoxSnell R Square檢驗(yàn)擬合優(yōu)度為0.272,其靈敏度為60%。 3得到了使用SMOTE算法、隨機(jī)復(fù)制過抽樣法及隨機(jī)欠抽樣法平衡數(shù)據(jù)后缺血性腦卒中復(fù)發(fā)回歸模型的預(yù)測(cè)數(shù)據(jù)及ROC曲線。其中隨機(jī)復(fù)制過抽樣法處理獲得的回歸模型CoxSnell R Square檢驗(yàn)擬合優(yōu)度為0.473,靈敏度為85.7%;隨機(jī)欠抽樣法處理獲得的回歸模型CoxSnell RSquare檢驗(yàn)擬合優(yōu)度為0.576,靈敏度為85.7%;SMOTE算法處理獲得的回歸模型CoxSnell R Square檢驗(yàn)擬合優(yōu)度為0.488,靈敏度為89.3%。經(jīng)卡方檢驗(yàn)三種方法的靈敏度無顯著差異。ROC曲線下面積中SMOTE算法大于隨機(jī)過抽樣法和隨機(jī)欠抽樣法。 結(jié)論: 1缺血性與出血性腦卒中類型可以使用Logistic回歸進(jìn)行輔助診斷,以提高診斷準(zhǔn)確率。根據(jù)回歸式可知血壓的升高對(duì)發(fā)生出血性腦卒中有較大影響,而TIA史與出血性腦卒中呈負(fù)相關(guān)性,在腦卒中患者中,,經(jīng)常運(yùn)動(dòng)的人患腦出血的可能性更高,有腦卒中家族史的患者患腦出血的概率較高。 2腦卒中患者的復(fù)發(fā)可以根據(jù)出院后對(duì)其健康檢測(cè)的數(shù)據(jù)代入Logistic回歸方程評(píng)估,若P0.5則歸類為不復(fù)發(fā),若P≥0.5則歸類為復(fù)發(fā)。獲得結(jié)果后可對(duì)被判斷為復(fù)發(fā)組的人群進(jìn)行強(qiáng)化健康管理。 3在研究非配對(duì)樣本類別問題時(shí),必須要重視不同類別樣本的平衡性,若不同類別樣本量不平衡,極易使得研究結(jié)果更傾向于樣本量大的類別,產(chǎn)生偏倚。綜合隨機(jī)復(fù)制過抽樣法、隨機(jī)欠抽樣法及SMOTE算法原理、預(yù)測(cè)靈敏度及ROC曲線,SMOTE算法即避免隨機(jī)復(fù)制過抽樣法產(chǎn)生的過度擬合,亦防止隨機(jī)欠抽樣法導(dǎo)致的信息缺失。SMOTE算法平衡數(shù)據(jù)優(yōu)于使用隨機(jī)復(fù)制法及隨機(jī)欠抽樣法。
[Abstract]:......
【學(xué)位授予單位】:河北醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:R743.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 郭雷;肖懷鐵;付強(qiáng);;非均衡數(shù)據(jù)目標(biāo)識(shí)別中SVM模型多參數(shù)優(yōu)化選擇方法[J];紅外與毫米波學(xué)報(bào);2009年02期
2 林舒楊;李翠華;江弋;林琛;鄒權(quán);;不平衡數(shù)據(jù)的降采樣方法研究[J];計(jì)算機(jī)研究與發(fā)展;2011年S3期
3 程錦泉;劉建平;張仁利;庾蕾;聶紹發(fā);;缺血性腦卒中影響因素的條件Logistic回歸分析[J];熱帶醫(yī)學(xué)雜志;2007年02期
本文編號(hào):1485033
本文鏈接:http://sikaile.net/yixuelunwen/shenjingyixue/1485033.html
最近更新
教材專著