基于多重插補的代謝綜合征自我預測模型研究
發(fā)布時間:2021-04-20 20:15
代謝綜合征(Metabolic syndrome,MetS)是一組復雜的多種物質代謝紊亂癥候群,極易引發(fā)高血壓、高血糖、高血脂等并發(fā)癥。MetS通常通過醫(yī)院的健康體檢診斷,診斷指標包括身高、體重、腰圍、血壓和部分血液檢測指標。但是,目前中國體檢的滲透率遠低于發(fā)達國家。這樣的情況需要一種不依賴于醫(yī)院健康檢查的MetS預測方法。但是,自我管理過程中血液檢測數(shù)據(jù)無法獲取,這給MetS的預測帶來挑戰(zhàn)。本論文提出一種新穎的基于插補特征的MetS自我預測方法。數(shù)據(jù)集包含浙江大學醫(yī)學院附屬第一醫(yī)院健康檢查數(shù)據(jù)庫91,420人次的健康檢查資料。在該方法中,第一步預測出血液檢測數(shù)據(jù),第二步將血液檢測數(shù)據(jù)的預測值作為補充特征用于訓練出MetS預測模型。本文使用XGBoost構建了另外兩種模型以對比三種方法的性能。第一種模型只使用自我可觀測的特征,第二種模型使用新增的血液檢測數(shù)據(jù)進行訓練。在第三種模型中,MICE(multivariate imputation by chained equations)方法用于預測出血液檢測數(shù)據(jù),從而替代第二種模型的真實數(shù)據(jù)來進行訓練。結果表明,與前兩個模型相比,本文所提出...
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.3 研究內容
1.4 論文組織結構
第2章 相關技術與方法
2.1 數(shù)據(jù)挖掘與機器學習技術
2.1.1 技術概念
2.1.2 挖掘任務
2.1.3 一般流程
2.1.4 分析工具
2.2 相關方法概述
2.2.1 Z-Score標準化
2.2.2 SMOTE技術
2.2.3 MICE
2.2.4 XGBoost
2.3 相關評價指標
2.3.1 混淆矩陣
2.3.2 ROC曲線和PR曲線
2.3.3 插補誤差指標
第3章 代謝綜合征自我預測模型研究
3.1 數(shù)據(jù)源
3.2 數(shù)據(jù)預處理
3.2.1 數(shù)據(jù)標準化
3.2.2 樣本均衡
3.3 特征評分
3.4 自我預測模型構建
3.4.1 構建方法
3.4.2 模型比較
3.4.3 參數(shù)訓練
3.5 自我預測模型評估
第4章 代謝綜合征多場景風險評估分析
4.1 多場景風險評估模型構建
4.1.1 構建方案
4.1.2 參數(shù)訓練
4.2 多場景風險評估模型評估
4.2.1 第一組模型分析
4.2.2 第二組模型分析
4.2.3 第三組模型分析
第5章 總結與展望
5.1 總結
5.2 展望
參考文獻
作者在碩士研究生期間的科研成果
【參考文獻】:
期刊論文
[1]看病難現(xiàn)狀及其影響因素淺析[J]. 焦雅輝,胡瑞榮. 中國醫(yī)療保險. 2012(03)
[2]高血壓、糖尿病、血脂異常及代謝綜合征與超重和肥胖關系[J]. 張雷,崔紅月,劉愛萍,王培玉. 中國慢性病預防與控制. 2009(06)
[3]數(shù)據(jù)挖掘研究現(xiàn)狀綜述[J]. 王立偉. 圖書與情報. 2008(05)
[4]老年男性高尿酸血癥與代謝綜合征各組分的相關性分析[J]. 陳蔚,張玉. 復旦學報(醫(yī)學版). 2007(03)
[5]數(shù)據(jù)挖掘技術在肺癌生存期預測中的應用探討[J]. 張曉東. 中國醫(yī)院統(tǒng)計. 2006(04)
[6]加強多學科協(xié)作,爭取心血管病研究取得新進展[J]. 臧益民,樊榮. 心臟雜志. 2006(05)
[7]醫(yī)學數(shù)據(jù)挖掘的技術、方法及應用[J]. 朱凌云,吳寶明. 生物醫(yī)學工程學雜志. 2003(03)
本文編號:3150330
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.3 研究內容
1.4 論文組織結構
第2章 相關技術與方法
2.1 數(shù)據(jù)挖掘與機器學習技術
2.1.1 技術概念
2.1.2 挖掘任務
2.1.3 一般流程
2.1.4 分析工具
2.2 相關方法概述
2.2.1 Z-Score標準化
2.2.2 SMOTE技術
2.2.3 MICE
2.2.4 XGBoost
2.3 相關評價指標
2.3.1 混淆矩陣
2.3.2 ROC曲線和PR曲線
2.3.3 插補誤差指標
第3章 代謝綜合征自我預測模型研究
3.1 數(shù)據(jù)源
3.2 數(shù)據(jù)預處理
3.2.1 數(shù)據(jù)標準化
3.2.2 樣本均衡
3.3 特征評分
3.4 自我預測模型構建
3.4.1 構建方法
3.4.2 模型比較
3.4.3 參數(shù)訓練
3.5 自我預測模型評估
第4章 代謝綜合征多場景風險評估分析
4.1 多場景風險評估模型構建
4.1.1 構建方案
4.1.2 參數(shù)訓練
4.2 多場景風險評估模型評估
4.2.1 第一組模型分析
4.2.2 第二組模型分析
4.2.3 第三組模型分析
第5章 總結與展望
5.1 總結
5.2 展望
參考文獻
作者在碩士研究生期間的科研成果
【參考文獻】:
期刊論文
[1]看病難現(xiàn)狀及其影響因素淺析[J]. 焦雅輝,胡瑞榮. 中國醫(yī)療保險. 2012(03)
[2]高血壓、糖尿病、血脂異常及代謝綜合征與超重和肥胖關系[J]. 張雷,崔紅月,劉愛萍,王培玉. 中國慢性病預防與控制. 2009(06)
[3]數(shù)據(jù)挖掘研究現(xiàn)狀綜述[J]. 王立偉. 圖書與情報. 2008(05)
[4]老年男性高尿酸血癥與代謝綜合征各組分的相關性分析[J]. 陳蔚,張玉. 復旦學報(醫(yī)學版). 2007(03)
[5]數(shù)據(jù)挖掘技術在肺癌生存期預測中的應用探討[J]. 張曉東. 中國醫(yī)院統(tǒng)計. 2006(04)
[6]加強多學科協(xié)作,爭取心血管病研究取得新進展[J]. 臧益民,樊榮. 心臟雜志. 2006(05)
[7]醫(yī)學數(shù)據(jù)挖掘的技術、方法及應用[J]. 朱凌云,吳寶明. 生物醫(yī)學工程學雜志. 2003(03)
本文編號:3150330
本文鏈接:http://sikaile.net/yixuelunwen/nfm/3150330.html
最近更新
教材專著