天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主成分的回歸和決策樹對高血壓數據的處理

發(fā)布時間:2023-03-29 00:47
  本文選取來自某市農村地區(qū)常住居民高血壓流行病調查的樣本數據,調查數據包括三個部分,分別為:2004-2006年的基線調查,2008年和2010年的兩次隨訪,共46315條記錄。本文選取了2004-2006年的基線調查的部分,研究高血壓的相關因素與高血壓的關系。高血壓的影響因素有許多,例如:年齡,性別,飲食習慣等。由于影響因素太多,為了處理方便,本文采用主成分分析的方法,將多個指標化為少數互不相關的綜合指標,實現對影響因素的降維。接著,通過對主成分分別進行回歸分析和logistic回歸分析,得到高血壓的判定模型。并且,進行數據模擬。通過主成分回歸和主成分logistic回歸分析得到的模型中,主成分logistic回歸,可以得出患病概率,進行一個很好的預測。以上是基于傳統(tǒng)多元統(tǒng)計分析對這組數據的處理。同時,我們也基于現代流行的數據挖掘中的決策樹算法,對該組數據進行處理,得到高血壓的一個判別模型。根據該模型,可以根據居民的一些生活指標判斷居民是否患有高血壓,同時,根據這個模型可以給出一些防治的建議。本文通過兩個模型找出一些生活中需要注意的因素,為居民高血壓的防治給出一點有效的建議。并且實現數...

【文章頁數】:55 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 國外研究現狀
    1.2 國內研究現狀
    1.3 本文目的及意義
    1.4 本文主題框架
第2章 調查數據的初步處理
    2.1 數據來源
    2.2 數據處理的方法
    2.3 清洗不合理樣本
    2.4 數據修正及補值
    2.5 數據再次刪選
    2.6 預測數據的選取
第3章 主成分的回歸結果
    3.1 主成分的回歸模型構建
    3.2 本組數據的預處理
    3.3 主成分分析
    3.4 主成分回歸分析
    3.5 主成分的logistic回歸
    3.6 結果分析
第4章 決策樹方法的結果
    4.1 決策樹算法簡介
    4.2 在決策樹的方法下數據預處理
    4.3 模型以及變量的選擇
    4.4 決策樹模型分析結果
    4.5 結果分析
第5章 模型對比及建議
    5.1 模型在對該組數據處理的對比
    5.2 高血壓防治方面的建議
參考文獻
致謝
附錄



本文編號:3773642

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/xxg/3773642.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶c9c2a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com