具有刪失數(shù)據(jù)的醫(yī)療生存統(tǒng)計(jì)分析和粗糙集決策分析的研究
發(fā)布時(shí)間:2017-08-15 05:05
本文關(guān)鍵詞:具有刪失數(shù)據(jù)的醫(yī)療生存統(tǒng)計(jì)分析和粗糙集決策分析的研究
更多相關(guān)文章: 生存分析 粗糙集 Cox回歸 刪失數(shù)據(jù) SPSS 統(tǒng)計(jì)分析 MATLAB
【摘要】:隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,數(shù)據(jù)挖掘的方法不斷擴(kuò)展。粗糙集理論和方法是一種能有效的分析和處理不一致、不精確、不完備等各種信息的數(shù)據(jù)分析工具。粗糙集決策分析方法因其不依賴于專家知識(shí)和經(jīng)驗(yàn),具有只依賴于本身數(shù)據(jù)的客觀性,得到了統(tǒng)計(jì)學(xué)和其他學(xué)科的普遍認(rèn)同。本文對(duì)數(shù)據(jù)挖掘中的粗糙集方法進(jìn)行了深入的研究,重點(diǎn)分析了基于粗糙集的屬性約簡(jiǎn)算法在數(shù)據(jù)挖掘規(guī)則提取階段的應(yīng)用。包括上(下)近似關(guān)系、知識(shí)的約簡(jiǎn)、核、不可區(qū)分關(guān)系、規(guī)則的提取。生存分析是研究生存現(xiàn)象和響應(yīng)時(shí)間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的一門學(xué)科。該學(xué)科在生物學(xué)、醫(yī)學(xué)、保險(xiǎn)學(xué)、可靠性工程學(xué)、人口學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等方面都有重要應(yīng)用。 本文對(duì)一個(gè)實(shí)際的糖尿病醫(yī)療數(shù)據(jù)進(jìn)行了Cox回歸生存分析和粗糙集醫(yī)療數(shù)據(jù)輔助規(guī)則提取。論文主要特點(diǎn)是可以處理刪失數(shù)據(jù),刪失是準(zhǔn)確時(shí)間未被觀察到的情況。研究對(duì)象是149位糖尿病人的數(shù)據(jù),通過對(duì)各生存指標(biāo)的統(tǒng)計(jì),利用生存分析和粗糙集兩大類方法,對(duì)糖尿病人的數(shù)據(jù)分別利用SPSS統(tǒng)計(jì)軟件和MATLAB中的粗糙集模塊分析,得出兩種不同角度的結(jié)果,分析的結(jié)果更加全面。生存分析的方法中,通過建立半?yún)?shù)模型,使用SPSS軟件中的Cox回歸功能模塊,利用生存時(shí)間函數(shù),生存分析模型的參數(shù)和非參數(shù)估計(jì)作為理論基礎(chǔ),在風(fēng)險(xiǎn)函數(shù)與屬性因子之間建立類似于廣義線性模型的關(guān)聯(lián),直接考察研究因子對(duì)風(fēng)險(xiǎn)函數(shù)的影響效果。該方法可以在不對(duì)生存時(shí)間的具體分布進(jìn)行假設(shè)的情況下評(píng)價(jià)因子的效果,大大簡(jiǎn)化了生存分析的求解過程。 粗糙集方法中,通過將連續(xù)屬性離散化,將生存數(shù)據(jù)劃分為可以用粗糙集方法計(jì)算的不可區(qū)分關(guān)系。利用粗糙集的知識(shí)約簡(jiǎn),以及決策表在知識(shí)表達(dá)上的應(yīng)用,同時(shí),通過對(duì)粗糙集數(shù)據(jù)分析系統(tǒng)的構(gòu)成和基本算法的研究,列舉出系統(tǒng)實(shí)現(xiàn)的程序,包括屬性約簡(jiǎn),核等。最后,通過實(shí)例來驗(yàn)證程序的正確性,使用MATLAB中粗糙集程序直接實(shí)現(xiàn)不可區(qū)分關(guān)系、屬性約簡(jiǎn)、核等的求解。通過利用粗糙集規(guī)則提取,得到了判定糖尿病人的約簡(jiǎn)的輔助治療結(jié)果,所得結(jié)果與醫(yī)院實(shí)際的診斷的方案吻合度非常高。得出兩大類方法的結(jié)果有重疊也有不同,實(shí)際驗(yàn)證了分析結(jié)果的正確性。
【關(guān)鍵詞】:生存分析 粗糙集 Cox回歸 刪失數(shù)據(jù) SPSS 統(tǒng)計(jì)分析 MATLAB
【學(xué)位授予單位】:東北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:C81
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-17
- 1.1 研究背景目的及意義10-11
- 1.2 生存分析的發(fā)展現(xiàn)狀11-12
- 1.3 粗糙集理論的國(guó)內(nèi)外發(fā)展現(xiàn)狀12-15
- 1.4 論文研究?jī)?nèi)容15-17
- 第2章 相關(guān)基礎(chǔ)知識(shí)17-33
- 2.1 生存分析的數(shù)據(jù)類型17-19
- 2.2 生存時(shí)間函數(shù)19-24
- 2.2.1 生存函數(shù)19-21
- 2.2.2 概率密度函數(shù)(或密度函數(shù))21-22
- 2.2.3 危險(xiǎn)率函數(shù)22-24
- 2.3 粗糙集基礎(chǔ)知識(shí)24-26
- 2.4 知識(shí)依賴性與知識(shí)約簡(jiǎn)26-30
- 2.4.1 知識(shí)約簡(jiǎn)與核26-28
- 2.4.2 相對(duì)約簡(jiǎn)與相對(duì)核28-30
- 2.5 知識(shí)表達(dá)系統(tǒng)與決策表30-33
- 2.5.1 知識(shí)表達(dá)系統(tǒng)30-31
- 2.5.2 決策表31-33
- 第3章 具有刪失數(shù)據(jù)的生存分析33-53
- 3.1 常用的生存分析模型33-40
- 3.1.1 生存分析的參數(shù)模型33-37
- 3.1.2 生存數(shù)據(jù)基本特征的非參數(shù)估計(jì)37-40
- 3.2 生存數(shù)據(jù)的COX模型40-44
- 3.2.1 COX模型的介紹40-42
- 3.2.2 COX模型估計(jì)42-44
- 3.2.3 COX假設(shè)檢驗(yàn)44
- 3.3 實(shí)例44-53
- 3.3.1 SPSS操作步驟45-49
- 3.3.2 結(jié)果分析49-53
- 第4章 粗糙集數(shù)據(jù)分析與規(guī)則提取53-70
- 4.1 預(yù)處理53-55
- 4.2 規(guī)則提取55-59
- 4.2.1 屬性約簡(jiǎn)55-58
- 4.2.2 值約簡(jiǎn)58
- 4.2.3 濾取風(fēng)險(xiǎn)規(guī)則58-59
- 4.3 決策分析59-70
- 4.3.1 MATLAB集合函數(shù)介紹59-60
- 4.3.2 主要MALAB程序60-63
- 4.3.3 生存分析數(shù)據(jù)的實(shí)例分析以及MATLAB實(shí)現(xiàn)63-70
- 第5章 總結(jié)與展望70-71
- 參考文獻(xiàn)71-74
- 致謝74
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 吳山產(chǎn),毛鋒,王文淵,卓晴;基于粗糙集的兩種離散化算法的研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年26期
,本文編號(hào):676358
本文鏈接:http://sikaile.net/shekelunwen/shgj/676358.html
最近更新
教材專著