基于數(shù)據(jù)挖掘的糖尿病預(yù)測(cè)模型研究
發(fā)布時(shí)間:2022-02-23 00:33
糖尿病(Diabetes Mellitus,DM)是一種以高血糖為特征的慢性疾病,且具有明顯的家族遺傳特性。國(guó)際糖尿病聯(lián)盟在Diabetes Atlas(Eighth Edition)中預(yù)測(cè)到21世紀(jì)中期全世界范圍內(nèi)的糖尿病患者數(shù)量會(huì)超過(guò)6億人,這個(gè)數(shù)量將超過(guò)全世界總?cè)丝跀?shù)的十分之一。在中國(guó)過(guò)去三十多年的社會(huì)發(fā)展歷史中,人們開(kāi)始意識(shí)到這一普遍影響家庭生活和個(gè)人幸福的慢性疾病所帶來(lái)的影響。當(dāng)前,從健康數(shù)據(jù)中獲取有價(jià)值的信息正在逐漸成為一種趨勢(shì);ヂ(lián)網(wǎng)及信息技術(shù)的快速發(fā)展使得大量有關(guān)個(gè)人健康的信息數(shù)據(jù)得以沉淀,但是龐大的數(shù)據(jù)量始終缺乏有效的整理、規(guī)范及利用。通過(guò)有效方法將所有可用信息智能地轉(zhuǎn)化為有價(jià)值的知識(shí),比以往任何時(shí)候都更加重要和必不可少。如何挖掘出數(shù)據(jù)中有意義的信息為糖尿病的預(yù)防提供合理的建議成為當(dāng)前亟待解決的問(wèn)題;跀(shù)據(jù)挖掘的分析能夠?qū)κ挛锏陌l(fā)展趨勢(shì)做出預(yù)測(cè)也能夠發(fā)現(xiàn)數(shù)據(jù)中包含的特征因素,針對(duì)糖尿病健康數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘的研究分析有希望成為糖尿病預(yù)防的有效解決方案。本論文結(jié)合現(xiàn)有糖尿病預(yù)測(cè)模型的研究基礎(chǔ),針對(duì)多個(gè)有價(jià)值的糖尿病健康數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘?qū)嶒?yàn),提出一種預(yù)測(cè)效果更佳、適用性...
【文章來(lái)源】:北京工業(yè)大學(xué)北京市211工程院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 論文主要研究?jī)?nèi)容
1.3.1 利用數(shù)據(jù)預(yù)處理技術(shù)對(duì)數(shù)據(jù)集進(jìn)行處理
1.3.2 使用數(shù)據(jù)挖掘算法建立糖尿病預(yù)測(cè)模型
1.3.3 提取糖尿病患者再入院的潛在風(fēng)險(xiǎn)因素
1.4 論文組織結(jié)構(gòu)安排
第2章 糖尿病數(shù)據(jù)挖掘相關(guān)方法
2.1 糖尿病詳解
2.1.1 1型糖尿病
2.1.2 2型糖尿病
2.1.3 妊娠期糖尿病
2.2 數(shù)據(jù)挖掘在糖尿病方面的應(yīng)用
2.2.1 數(shù)據(jù)挖掘的過(guò)程
2.2.2 基于分類算法的應(yīng)用
2.2.3 基于聚類算法的應(yīng)用
2.2.4 基于關(guān)聯(lián)算法的應(yīng)用
2.3 典型算法應(yīng)用
2.3.1 K-means算法
2.3.2 Logistic回歸算法
2.3.3 決策樹算法
2.3.4 隨機(jī)森林算法
2.3.5 遺傳算法
2.4 本章小結(jié)
第3章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
3.1 實(shí)驗(yàn)環(huán)境搭建
3.1.1 WEKA工具平臺(tái)
3.1.2 Matlab實(shí)驗(yàn)平臺(tái)
3.2 糖尿病數(shù)據(jù)集
3.2.1 Pima Indian Diabetes數(shù)據(jù)集
3.2.2 Dr. Schorling提供的數(shù)據(jù)集
3.2.3 調(diào)查問(wèn)卷收集的數(shù)據(jù)集
3.2.4 Diabetes 130-US hospitals for years 1999-2008數(shù)據(jù)集
3.3 數(shù)據(jù)集預(yù)處理
3.3.1 實(shí)驗(yàn)相關(guān)數(shù)據(jù)預(yù)處理技術(shù)
3.3.2 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
3.3.3 糖尿病再入院風(fēng)險(xiǎn)特征實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
3.4 本章小結(jié)
第4章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)算法模型建立
4.1 實(shí)驗(yàn)算法特點(diǎn)
4.1.1 K-means算法特點(diǎn)
4.1.2 Logistic回歸算法特點(diǎn)
4.1.3 決策樹算法特點(diǎn)
4.1.4 隨機(jī)森林算法特點(diǎn)
4.2 K-means與決策樹組合算法模型
4.2.1 預(yù)測(cè)模型步驟
4.2.2 預(yù)測(cè)模型算法應(yīng)用
4.3 改進(jìn)的K-means與Logistic回歸組合算法模型
4.3.1 預(yù)測(cè)模型步驟
4.3.2 預(yù)測(cè)模型算法應(yīng)用
4.4 本章小結(jié)
第5章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)結(jié)果分析
5.1 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)結(jié)果
5.1.1 Kappa統(tǒng)計(jì)量
5.1.2 準(zhǔn)確性、敏感性、特異性
5.1.3 分類細(xì)節(jié)準(zhǔn)確率
5.2 糖尿病預(yù)測(cè)研究現(xiàn)有模型驗(yàn)證
5.3 糖尿病預(yù)測(cè)研究新數(shù)據(jù)集驗(yàn)證
5.3.1 Dr. Schorling提供的數(shù)據(jù)集驗(yàn)證
5.3.2 調(diào)查問(wèn)卷收集的數(shù)據(jù)集驗(yàn)證
5.4 糖尿病患者再入院風(fēng)險(xiǎn)特征實(shí)驗(yàn)分析
5.4.1 實(shí)驗(yàn)內(nèi)容
5.4.2 實(shí)驗(yàn)結(jié)果
5.5 本章小結(jié)
第6章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)可靠性論證
6.1 實(shí)驗(yàn)結(jié)果準(zhǔn)確性論證
6.1.1 相關(guān)研究者實(shí)驗(yàn)結(jié)果對(duì)比
6.1.2 10折交叉驗(yàn)證
6.2 組合算法模型有效性論證
6.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士期間取得的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)模型在2型糖尿病患病風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[J]. 王喜丹,王曉丹,梁麗. 臨床醫(yī)藥文獻(xiàn)電子雜志. 2017(84)
[2]基于頻繁模式增長(zhǎng)算法的2型糖尿病患病風(fēng)險(xiǎn)預(yù)測(cè)的分析研究[J]. 韋哲,葉廣健,王能才. 中國(guó)醫(yī)學(xué)裝備. 2016(05)
[3]2型糖尿病報(bào)告發(fā)病率研究進(jìn)展[J]. 汪會(huì)琴,胡如英,武海濱,俞敏. 浙江預(yù)防醫(yī)學(xué). 2016(01)
[4]具有容噪特性的C4.5算法改進(jìn)[J]. 王偉,李磊,張志鴻. 計(jì)算機(jī)科學(xué). 2015(12)
[5]一種改進(jìn)的C4.5決策樹算法[J]. 胡美春,田大鋼. 軟件導(dǎo)刊. 2015(07)
[6]醫(yī)療健康大數(shù)據(jù):應(yīng)用實(shí)例與系統(tǒng)分析[J]. 董誠(chéng),林立,金海,廖小飛. 大數(shù)據(jù). 2015(02)
[7]中國(guó)糖尿病的流行病學(xué)現(xiàn)狀及展望[J]. 廖涌. 重慶醫(yī)科大學(xué)學(xué)報(bào). 2015(07)
[8]C4.5算法的改進(jìn)及應(yīng)用[J]. 佘為. 信息與電腦(理論版). 2015(12)
[9]醫(yī)療健康大數(shù)據(jù)研究綜述[J]. 顏延,秦興彬,樊建平,王磊. 科研信息化技術(shù)與應(yīng)用. 2014(06)
[10]人工神經(jīng)網(wǎng)絡(luò)模型在2型糖尿病患病風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[J]. 郭奕瑞,李玉倩,王高帥,劉曉田,張路寧,張紅艷,王炳源,王重建. 鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版). 2014(02)
博士論文
[1]中國(guó)成人個(gè)體糖尿病發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的建立及驗(yàn)證[D]. 米生權(quán).中國(guó)疾病預(yù)防控制中心 2011
碩士論文
[1]糖尿病健康數(shù)據(jù)分析方法及應(yīng)用[D]. 王瑤.哈爾濱工業(yè)大學(xué) 2017
[2]基于電子病歷分析的糖尿病患病風(fēng)險(xiǎn)數(shù)據(jù)挖掘方法研究[D]. 肖文翔.青島大學(xué) 2016
[3]基于機(jī)器學(xué)習(xí)算法的糖尿病預(yù)測(cè)模型研究[D]. 洪燁.哈爾濱工業(yè)大學(xué) 2016
[4]基于weka的可視化醫(yī)療數(shù)據(jù)挖掘平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉斌.湖南大學(xué) 2016
[5]基于數(shù)據(jù)挖掘技術(shù)的糖尿病臨床數(shù)據(jù)分析[D]. 何禹德.長(zhǎng)春工業(yè)大學(xué) 2016
[6]改進(jìn)遺傳算法在營(yíng)養(yǎng)配餐系統(tǒng)中的應(yīng)用[D]. 劉宏暢.北京工業(yè)大學(xué) 2015
本文編號(hào):3640503
【文章來(lái)源】:北京工業(yè)大學(xué)北京市211工程院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 論文主要研究?jī)?nèi)容
1.3.1 利用數(shù)據(jù)預(yù)處理技術(shù)對(duì)數(shù)據(jù)集進(jìn)行處理
1.3.2 使用數(shù)據(jù)挖掘算法建立糖尿病預(yù)測(cè)模型
1.3.3 提取糖尿病患者再入院的潛在風(fēng)險(xiǎn)因素
1.4 論文組織結(jié)構(gòu)安排
第2章 糖尿病數(shù)據(jù)挖掘相關(guān)方法
2.1 糖尿病詳解
2.1.1 1型糖尿病
2.1.2 2型糖尿病
2.1.3 妊娠期糖尿病
2.2 數(shù)據(jù)挖掘在糖尿病方面的應(yīng)用
2.2.1 數(shù)據(jù)挖掘的過(guò)程
2.2.2 基于分類算法的應(yīng)用
2.2.3 基于聚類算法的應(yīng)用
2.2.4 基于關(guān)聯(lián)算法的應(yīng)用
2.3 典型算法應(yīng)用
2.3.1 K-means算法
2.3.2 Logistic回歸算法
2.3.3 決策樹算法
2.3.4 隨機(jī)森林算法
2.3.5 遺傳算法
2.4 本章小結(jié)
第3章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
3.1 實(shí)驗(yàn)環(huán)境搭建
3.1.1 WEKA工具平臺(tái)
3.1.2 Matlab實(shí)驗(yàn)平臺(tái)
3.2 糖尿病數(shù)據(jù)集
3.2.1 Pima Indian Diabetes數(shù)據(jù)集
3.2.2 Dr. Schorling提供的數(shù)據(jù)集
3.2.3 調(diào)查問(wèn)卷收集的數(shù)據(jù)集
3.2.4 Diabetes 130-US hospitals for years 1999-2008數(shù)據(jù)集
3.3 數(shù)據(jù)集預(yù)處理
3.3.1 實(shí)驗(yàn)相關(guān)數(shù)據(jù)預(yù)處理技術(shù)
3.3.2 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
3.3.3 糖尿病再入院風(fēng)險(xiǎn)特征實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
3.4 本章小結(jié)
第4章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)算法模型建立
4.1 實(shí)驗(yàn)算法特點(diǎn)
4.1.1 K-means算法特點(diǎn)
4.1.2 Logistic回歸算法特點(diǎn)
4.1.3 決策樹算法特點(diǎn)
4.1.4 隨機(jī)森林算法特點(diǎn)
4.2 K-means與決策樹組合算法模型
4.2.1 預(yù)測(cè)模型步驟
4.2.2 預(yù)測(cè)模型算法應(yīng)用
4.3 改進(jìn)的K-means與Logistic回歸組合算法模型
4.3.1 預(yù)測(cè)模型步驟
4.3.2 預(yù)測(cè)模型算法應(yīng)用
4.4 本章小結(jié)
第5章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)結(jié)果分析
5.1 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)結(jié)果
5.1.1 Kappa統(tǒng)計(jì)量
5.1.2 準(zhǔn)確性、敏感性、特異性
5.1.3 分類細(xì)節(jié)準(zhǔn)確率
5.2 糖尿病預(yù)測(cè)研究現(xiàn)有模型驗(yàn)證
5.3 糖尿病預(yù)測(cè)研究新數(shù)據(jù)集驗(yàn)證
5.3.1 Dr. Schorling提供的數(shù)據(jù)集驗(yàn)證
5.3.2 調(diào)查問(wèn)卷收集的數(shù)據(jù)集驗(yàn)證
5.4 糖尿病患者再入院風(fēng)險(xiǎn)特征實(shí)驗(yàn)分析
5.4.1 實(shí)驗(yàn)內(nèi)容
5.4.2 實(shí)驗(yàn)結(jié)果
5.5 本章小結(jié)
第6章 糖尿病預(yù)測(cè)研究實(shí)驗(yàn)可靠性論證
6.1 實(shí)驗(yàn)結(jié)果準(zhǔn)確性論證
6.1.1 相關(guān)研究者實(shí)驗(yàn)結(jié)果對(duì)比
6.1.2 10折交叉驗(yàn)證
6.2 組合算法模型有效性論證
6.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士期間取得的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)模型在2型糖尿病患病風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[J]. 王喜丹,王曉丹,梁麗. 臨床醫(yī)藥文獻(xiàn)電子雜志. 2017(84)
[2]基于頻繁模式增長(zhǎng)算法的2型糖尿病患病風(fēng)險(xiǎn)預(yù)測(cè)的分析研究[J]. 韋哲,葉廣健,王能才. 中國(guó)醫(yī)學(xué)裝備. 2016(05)
[3]2型糖尿病報(bào)告發(fā)病率研究進(jìn)展[J]. 汪會(huì)琴,胡如英,武海濱,俞敏. 浙江預(yù)防醫(yī)學(xué). 2016(01)
[4]具有容噪特性的C4.5算法改進(jìn)[J]. 王偉,李磊,張志鴻. 計(jì)算機(jī)科學(xué). 2015(12)
[5]一種改進(jìn)的C4.5決策樹算法[J]. 胡美春,田大鋼. 軟件導(dǎo)刊. 2015(07)
[6]醫(yī)療健康大數(shù)據(jù):應(yīng)用實(shí)例與系統(tǒng)分析[J]. 董誠(chéng),林立,金海,廖小飛. 大數(shù)據(jù). 2015(02)
[7]中國(guó)糖尿病的流行病學(xué)現(xiàn)狀及展望[J]. 廖涌. 重慶醫(yī)科大學(xué)學(xué)報(bào). 2015(07)
[8]C4.5算法的改進(jìn)及應(yīng)用[J]. 佘為. 信息與電腦(理論版). 2015(12)
[9]醫(yī)療健康大數(shù)據(jù)研究綜述[J]. 顏延,秦興彬,樊建平,王磊. 科研信息化技術(shù)與應(yīng)用. 2014(06)
[10]人工神經(jīng)網(wǎng)絡(luò)模型在2型糖尿病患病風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[J]. 郭奕瑞,李玉倩,王高帥,劉曉田,張路寧,張紅艷,王炳源,王重建. 鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版). 2014(02)
博士論文
[1]中國(guó)成人個(gè)體糖尿病發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的建立及驗(yàn)證[D]. 米生權(quán).中國(guó)疾病預(yù)防控制中心 2011
碩士論文
[1]糖尿病健康數(shù)據(jù)分析方法及應(yīng)用[D]. 王瑤.哈爾濱工業(yè)大學(xué) 2017
[2]基于電子病歷分析的糖尿病患病風(fēng)險(xiǎn)數(shù)據(jù)挖掘方法研究[D]. 肖文翔.青島大學(xué) 2016
[3]基于機(jī)器學(xué)習(xí)算法的糖尿病預(yù)測(cè)模型研究[D]. 洪燁.哈爾濱工業(yè)大學(xué) 2016
[4]基于weka的可視化醫(yī)療數(shù)據(jù)挖掘平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉斌.湖南大學(xué) 2016
[5]基于數(shù)據(jù)挖掘技術(shù)的糖尿病臨床數(shù)據(jù)分析[D]. 何禹德.長(zhǎng)春工業(yè)大學(xué) 2016
[6]改進(jìn)遺傳算法在營(yíng)養(yǎng)配餐系統(tǒng)中的應(yīng)用[D]. 劉宏暢.北京工業(yè)大學(xué) 2015
本文編號(hào):3640503
本文鏈接:http://sikaile.net/yixuelunwen/nfm/3640503.html
最近更新
教材專著