基于SMOTE和XGBoost的Ⅰ型與Ⅱ型糖尿病分類方法研究
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1集成學(xué)習(xí)思想圖示
特征提取及分類的相關(guān)技術(shù)172.5.2boosting集成學(xué)習(xí)簡介機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法的目的是為了選擇出一個穩(wěn)定性等各方面性能較好的模型,進行數(shù)據(jù)預(yù)測等操作時,使用單個弱監(jiān)督模型的效果可能會不佳,因此,往往會訓(xùn)練多個模型來解決這一問題,之后將這多個模型進行組合成為更全面的模型....
圖3.1某患者1天血糖曲線
基于SMOTE+XGBoost的糖尿病分類模型233基于SMOTE+XGBoost的糖尿病分類模型本文提出運用數(shù)據(jù)挖掘技術(shù)來對糖尿病患者的分型提供技術(shù)支持,幫助臨床中對Ⅰ型與Ⅱ型糖尿病患者進行分類。論文提出的基于SMOTE+XGBoost的糖尿病分類模型在進行模型的訓(xùn)練及測試之前....
圖3.2某患者3天865個記錄點的血糖曲線
基于SMOTE+XGBoost的糖尿病分類模型24圖3.2某患者3天865個記錄點的血糖曲線導(dǎo)入Excel表格后的患者數(shù)據(jù)中存在有缺失值和異常值的情況,缺失值是由于患者佩戴或摘除儀器時造成少部分數(shù)據(jù)缺失或在測量過程中人為摘除儀器造成大部分數(shù)據(jù)丟失,針對缺失值現(xiàn)象則將該患者數(shù)據(jù)丟棄....
圖3.3BorderlineSMOTE算法樣本類別
?椒ǎ?碆orderline-SMOTE1和Borderline-SMOTE2。BorderlineSMOTE算法是基于SMOTE算法的基礎(chǔ)上進行改進的過采樣算法,改進算法僅對樣本邊界上的少數(shù)類進行分析并合成新的樣本。BorderlineSMOTE算法的思想是將少數(shù)類樣本分為了3....
本文編號:3894888
本文鏈接:http://sikaile.net/yixuelunwen/nfm/3894888.html