基于數(shù)據(jù)挖掘的糖尿病預測模型研究
發(fā)布時間:2022-02-23 00:33
糖尿。―iabetes Mellitus,DM)是一種以高血糖為特征的慢性疾病,且具有明顯的家族遺傳特性。國際糖尿病聯(lián)盟在Diabetes Atlas(Eighth Edition)中預測到21世紀中期全世界范圍內的糖尿病患者數(shù)量會超過6億人,這個數(shù)量將超過全世界總人口數(shù)的十分之一。在中國過去三十多年的社會發(fā)展歷史中,人們開始意識到這一普遍影響家庭生活和個人幸福的慢性疾病所帶來的影響。當前,從健康數(shù)據(jù)中獲取有價值的信息正在逐漸成為一種趨勢;ヂ(lián)網及信息技術的快速發(fā)展使得大量有關個人健康的信息數(shù)據(jù)得以沉淀,但是龐大的數(shù)據(jù)量始終缺乏有效的整理、規(guī)范及利用。通過有效方法將所有可用信息智能地轉化為有價值的知識,比以往任何時候都更加重要和必不可少。如何挖掘出數(shù)據(jù)中有意義的信息為糖尿病的預防提供合理的建議成為當前亟待解決的問題。基于數(shù)據(jù)挖掘的分析能夠對事物的發(fā)展趨勢做出預測也能夠發(fā)現(xiàn)數(shù)據(jù)中包含的特征因素,針對糖尿病健康數(shù)據(jù)進行數(shù)據(jù)挖掘的研究分析有希望成為糖尿病預防的有效解決方案。本論文結合現(xiàn)有糖尿病預測模型的研究基礎,針對多個有價值的糖尿病健康數(shù)據(jù)集進行數(shù)據(jù)挖掘實驗,提出一種預測效果更佳、適用性...
【文章來源】:北京工業(yè)大學北京市211工程院校
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內研究現(xiàn)狀
1.3 論文主要研究內容
1.3.1 利用數(shù)據(jù)預處理技術對數(shù)據(jù)集進行處理
1.3.2 使用數(shù)據(jù)挖掘算法建立糖尿病預測模型
1.3.3 提取糖尿病患者再入院的潛在風險因素
1.4 論文組織結構安排
第2章 糖尿病數(shù)據(jù)挖掘相關方法
2.1 糖尿病詳解
2.1.1 1型糖尿病
2.1.2 2型糖尿病
2.1.3 妊娠期糖尿病
2.2 數(shù)據(jù)挖掘在糖尿病方面的應用
2.2.1 數(shù)據(jù)挖掘的過程
2.2.2 基于分類算法的應用
2.2.3 基于聚類算法的應用
2.2.4 基于關聯(lián)算法的應用
2.3 典型算法應用
2.3.1 K-means算法
2.3.2 Logistic回歸算法
2.3.3 決策樹算法
2.3.4 隨機森林算法
2.3.5 遺傳算法
2.4 本章小結
第3章 糖尿病預測研究實驗數(shù)據(jù)準備
3.1 實驗環(huán)境搭建
3.1.1 WEKA工具平臺
3.1.2 Matlab實驗平臺
3.2 糖尿病數(shù)據(jù)集
3.2.1 Pima Indian Diabetes數(shù)據(jù)集
3.2.2 Dr. Schorling提供的數(shù)據(jù)集
3.2.3 調查問卷收集的數(shù)據(jù)集
3.2.4 Diabetes 130-US hospitals for years 1999-2008數(shù)據(jù)集
3.3 數(shù)據(jù)集預處理
3.3.1 實驗相關數(shù)據(jù)預處理技術
3.3.2 糖尿病預測研究實驗數(shù)據(jù)預處理
3.3.3 糖尿病再入院風險特征實驗數(shù)據(jù)預處理
3.4 本章小結
第4章 糖尿病預測研究實驗算法模型建立
4.1 實驗算法特點
4.1.1 K-means算法特點
4.1.2 Logistic回歸算法特點
4.1.3 決策樹算法特點
4.1.4 隨機森林算法特點
4.2 K-means與決策樹組合算法模型
4.2.1 預測模型步驟
4.2.2 預測模型算法應用
4.3 改進的K-means與Logistic回歸組合算法模型
4.3.1 預測模型步驟
4.3.2 預測模型算法應用
4.4 本章小結
第5章 糖尿病預測研究實驗結果分析
5.1 糖尿病預測研究實驗結果
5.1.1 Kappa統(tǒng)計量
5.1.2 準確性、敏感性、特異性
5.1.3 分類細節(jié)準確率
5.2 糖尿病預測研究現(xiàn)有模型驗證
5.3 糖尿病預測研究新數(shù)據(jù)集驗證
5.3.1 Dr. Schorling提供的數(shù)據(jù)集驗證
5.3.2 調查問卷收集的數(shù)據(jù)集驗證
5.4 糖尿病患者再入院風險特征實驗分析
5.4.1 實驗內容
5.4.2 實驗結果
5.5 本章小結
第6章 糖尿病預測研究實驗可靠性論證
6.1 實驗結果準確性論證
6.1.1 相關研究者實驗結果對比
6.1.2 10折交叉驗證
6.2 組合算法模型有效性論證
6.3 本章小結
結論
參考文獻
攻讀碩士期間取得的研究成果
致謝
【參考文獻】:
期刊論文
[1]基于深度學習模型在2型糖尿病患病風險預測中的應用[J]. 王喜丹,王曉丹,梁麗. 臨床醫(yī)藥文獻電子雜志. 2017(84)
[2]基于頻繁模式增長算法的2型糖尿病患病風險預測的分析研究[J]. 韋哲,葉廣健,王能才. 中國醫(yī)學裝備. 2016(05)
[3]2型糖尿病報告發(fā)病率研究進展[J]. 汪會琴,胡如英,武海濱,俞敏. 浙江預防醫(yī)學. 2016(01)
[4]具有容噪特性的C4.5算法改進[J]. 王偉,李磊,張志鴻. 計算機科學. 2015(12)
[5]一種改進的C4.5決策樹算法[J]. 胡美春,田大鋼. 軟件導刊. 2015(07)
[6]醫(yī)療健康大數(shù)據(jù):應用實例與系統(tǒng)分析[J]. 董誠,林立,金海,廖小飛. 大數(shù)據(jù). 2015(02)
[7]中國糖尿病的流行病學現(xiàn)狀及展望[J]. 廖涌. 重慶醫(yī)科大學學報. 2015(07)
[8]C4.5算法的改進及應用[J]. 佘為. 信息與電腦(理論版). 2015(12)
[9]醫(yī)療健康大數(shù)據(jù)研究綜述[J]. 顏延,秦興彬,樊建平,王磊. 科研信息化技術與應用. 2014(06)
[10]人工神經網絡模型在2型糖尿病患病風險預測中的應用[J]. 郭奕瑞,李玉倩,王高帥,劉曉田,張路寧,張紅艷,王炳源,王重建. 鄭州大學學報(醫(yī)學版). 2014(02)
博士論文
[1]中國成人個體糖尿病發(fā)病風險預測模型的建立及驗證[D]. 米生權.中國疾病預防控制中心 2011
碩士論文
[1]糖尿病健康數(shù)據(jù)分析方法及應用[D]. 王瑤.哈爾濱工業(yè)大學 2017
[2]基于電子病歷分析的糖尿病患病風險數(shù)據(jù)挖掘方法研究[D]. 肖文翔.青島大學 2016
[3]基于機器學習算法的糖尿病預測模型研究[D]. 洪燁.哈爾濱工業(yè)大學 2016
[4]基于weka的可視化醫(yī)療數(shù)據(jù)挖掘平臺的設計與實現(xiàn)[D]. 劉斌.湖南大學 2016
[5]基于數(shù)據(jù)挖掘技術的糖尿病臨床數(shù)據(jù)分析[D]. 何禹德.長春工業(yè)大學 2016
[6]改進遺傳算法在營養(yǎng)配餐系統(tǒng)中的應用[D]. 劉宏暢.北京工業(yè)大學 2015
本文編號:3640503
【文章來源】:北京工業(yè)大學北京市211工程院校
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內研究現(xiàn)狀
1.3 論文主要研究內容
1.3.1 利用數(shù)據(jù)預處理技術對數(shù)據(jù)集進行處理
1.3.2 使用數(shù)據(jù)挖掘算法建立糖尿病預測模型
1.3.3 提取糖尿病患者再入院的潛在風險因素
1.4 論文組織結構安排
第2章 糖尿病數(shù)據(jù)挖掘相關方法
2.1 糖尿病詳解
2.1.1 1型糖尿病
2.1.2 2型糖尿病
2.1.3 妊娠期糖尿病
2.2 數(shù)據(jù)挖掘在糖尿病方面的應用
2.2.1 數(shù)據(jù)挖掘的過程
2.2.2 基于分類算法的應用
2.2.3 基于聚類算法的應用
2.2.4 基于關聯(lián)算法的應用
2.3 典型算法應用
2.3.1 K-means算法
2.3.2 Logistic回歸算法
2.3.3 決策樹算法
2.3.4 隨機森林算法
2.3.5 遺傳算法
2.4 本章小結
第3章 糖尿病預測研究實驗數(shù)據(jù)準備
3.1 實驗環(huán)境搭建
3.1.1 WEKA工具平臺
3.1.2 Matlab實驗平臺
3.2 糖尿病數(shù)據(jù)集
3.2.1 Pima Indian Diabetes數(shù)據(jù)集
3.2.2 Dr. Schorling提供的數(shù)據(jù)集
3.2.3 調查問卷收集的數(shù)據(jù)集
3.2.4 Diabetes 130-US hospitals for years 1999-2008數(shù)據(jù)集
3.3 數(shù)據(jù)集預處理
3.3.1 實驗相關數(shù)據(jù)預處理技術
3.3.2 糖尿病預測研究實驗數(shù)據(jù)預處理
3.3.3 糖尿病再入院風險特征實驗數(shù)據(jù)預處理
3.4 本章小結
第4章 糖尿病預測研究實驗算法模型建立
4.1 實驗算法特點
4.1.1 K-means算法特點
4.1.2 Logistic回歸算法特點
4.1.3 決策樹算法特點
4.1.4 隨機森林算法特點
4.2 K-means與決策樹組合算法模型
4.2.1 預測模型步驟
4.2.2 預測模型算法應用
4.3 改進的K-means與Logistic回歸組合算法模型
4.3.1 預測模型步驟
4.3.2 預測模型算法應用
4.4 本章小結
第5章 糖尿病預測研究實驗結果分析
5.1 糖尿病預測研究實驗結果
5.1.1 Kappa統(tǒng)計量
5.1.2 準確性、敏感性、特異性
5.1.3 分類細節(jié)準確率
5.2 糖尿病預測研究現(xiàn)有模型驗證
5.3 糖尿病預測研究新數(shù)據(jù)集驗證
5.3.1 Dr. Schorling提供的數(shù)據(jù)集驗證
5.3.2 調查問卷收集的數(shù)據(jù)集驗證
5.4 糖尿病患者再入院風險特征實驗分析
5.4.1 實驗內容
5.4.2 實驗結果
5.5 本章小結
第6章 糖尿病預測研究實驗可靠性論證
6.1 實驗結果準確性論證
6.1.1 相關研究者實驗結果對比
6.1.2 10折交叉驗證
6.2 組合算法模型有效性論證
6.3 本章小結
結論
參考文獻
攻讀碩士期間取得的研究成果
致謝
【參考文獻】:
期刊論文
[1]基于深度學習模型在2型糖尿病患病風險預測中的應用[J]. 王喜丹,王曉丹,梁麗. 臨床醫(yī)藥文獻電子雜志. 2017(84)
[2]基于頻繁模式增長算法的2型糖尿病患病風險預測的分析研究[J]. 韋哲,葉廣健,王能才. 中國醫(yī)學裝備. 2016(05)
[3]2型糖尿病報告發(fā)病率研究進展[J]. 汪會琴,胡如英,武海濱,俞敏. 浙江預防醫(yī)學. 2016(01)
[4]具有容噪特性的C4.5算法改進[J]. 王偉,李磊,張志鴻. 計算機科學. 2015(12)
[5]一種改進的C4.5決策樹算法[J]. 胡美春,田大鋼. 軟件導刊. 2015(07)
[6]醫(yī)療健康大數(shù)據(jù):應用實例與系統(tǒng)分析[J]. 董誠,林立,金海,廖小飛. 大數(shù)據(jù). 2015(02)
[7]中國糖尿病的流行病學現(xiàn)狀及展望[J]. 廖涌. 重慶醫(yī)科大學學報. 2015(07)
[8]C4.5算法的改進及應用[J]. 佘為. 信息與電腦(理論版). 2015(12)
[9]醫(yī)療健康大數(shù)據(jù)研究綜述[J]. 顏延,秦興彬,樊建平,王磊. 科研信息化技術與應用. 2014(06)
[10]人工神經網絡模型在2型糖尿病患病風險預測中的應用[J]. 郭奕瑞,李玉倩,王高帥,劉曉田,張路寧,張紅艷,王炳源,王重建. 鄭州大學學報(醫(yī)學版). 2014(02)
博士論文
[1]中國成人個體糖尿病發(fā)病風險預測模型的建立及驗證[D]. 米生權.中國疾病預防控制中心 2011
碩士論文
[1]糖尿病健康數(shù)據(jù)分析方法及應用[D]. 王瑤.哈爾濱工業(yè)大學 2017
[2]基于電子病歷分析的糖尿病患病風險數(shù)據(jù)挖掘方法研究[D]. 肖文翔.青島大學 2016
[3]基于機器學習算法的糖尿病預測模型研究[D]. 洪燁.哈爾濱工業(yè)大學 2016
[4]基于weka的可視化醫(yī)療數(shù)據(jù)挖掘平臺的設計與實現(xiàn)[D]. 劉斌.湖南大學 2016
[5]基于數(shù)據(jù)挖掘技術的糖尿病臨床數(shù)據(jù)分析[D]. 何禹德.長春工業(yè)大學 2016
[6]改進遺傳算法在營養(yǎng)配餐系統(tǒng)中的應用[D]. 劉宏暢.北京工業(yè)大學 2015
本文編號:3640503
本文鏈接:http://sikaile.net/yixuelunwen/nfm/3640503.html
最近更新
教材專著