天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于SMOTE和XGBoost的Ⅰ型與Ⅱ型糖尿病分類方法研究

發(fā)布時間:2024-02-04 00:24
  嚴重危害人類生命健康的疾病之一就包括有糖尿病,共有四種類型:Ⅰ型糖尿病、Ⅱ型糖尿病、特異型糖尿病和妊娠糖尿病。醫(yī)生根據(jù)患者的臨床表現(xiàn)以及醫(yī)學(xué)檢測結(jié)果來判斷。而Ⅰ型與Ⅱ型糖尿病在臨床表現(xiàn)上有一些相似癥狀難以判斷,不同醫(yī)生可能判定結(jié)果不同。論文針對Ⅰ型與Ⅱ型糖尿病分類問題,提出利用動態(tài)血糖檢測儀(CGMS)對糖尿病患者進行時間序列血糖濃度數(shù)據(jù)的采集,對患者數(shù)據(jù)進行特征提取及分類工作,為糖尿病分類提供新的分類模型。但由于患者基數(shù)不同,往往被確診為Ⅰ型糖尿病的患者遠少于Ⅱ型糖尿病患者,導(dǎo)致樣本數(shù)據(jù)類別比例失衡,屬于類不平衡數(shù)據(jù),因此針對類不平衡數(shù)據(jù)論文提出SMOTE及其改進算法進行處理,然后再對處理后的數(shù)據(jù)進行分類模型的訓(xùn)練及測試。論文的主要工作為:1.對CGMS儀器中得到的患者的原始數(shù)據(jù)進行預(yù)處理,利用PCA技術(shù)對數(shù)據(jù)進行不同維度的特征提取,將PCA閾值設(shè)為85%、90%、95%、99%和MLE,最終獲得五組不同特征組;2.構(gòu)建針對Ⅰ型與Ⅱ型糖尿病嚴重的類不平衡數(shù)據(jù),論文提出了SMOTE+XGBoost算法的分類模型。針對PCA獲得的五組特征組,首先進行SMOTE及其兩種改進算法Border...

【文章頁數(shù)】:62 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2.1集成學(xué)習(xí)思想圖示

圖2.1集成學(xué)習(xí)思想圖示

特征提取及分類的相關(guān)技術(shù)172.5.2boosting集成學(xué)習(xí)簡介機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法的目的是為了選擇出一個穩(wěn)定性等各方面性能較好的模型,進行數(shù)據(jù)預(yù)測等操作時,使用單個弱監(jiān)督模型的效果可能會不佳,因此,往往會訓(xùn)練多個模型來解決這一問題,之后將這多個模型進行組合成為更全面的模型....


圖3.1某患者1天血糖曲線

圖3.1某患者1天血糖曲線

基于SMOTE+XGBoost的糖尿病分類模型233基于SMOTE+XGBoost的糖尿病分類模型本文提出運用數(shù)據(jù)挖掘技術(shù)來對糖尿病患者的分型提供技術(shù)支持,幫助臨床中對Ⅰ型與Ⅱ型糖尿病患者進行分類。論文提出的基于SMOTE+XGBoost的糖尿病分類模型在進行模型的訓(xùn)練及測試之前....


圖3.2某患者3天865個記錄點的血糖曲線

圖3.2某患者3天865個記錄點的血糖曲線

基于SMOTE+XGBoost的糖尿病分類模型24圖3.2某患者3天865個記錄點的血糖曲線導(dǎo)入Excel表格后的患者數(shù)據(jù)中存在有缺失值和異常值的情況,缺失值是由于患者佩戴或摘除儀器時造成少部分數(shù)據(jù)缺失或在測量過程中人為摘除儀器造成大部分數(shù)據(jù)丟失,針對缺失值現(xiàn)象則將該患者數(shù)據(jù)丟棄....


圖3.3BorderlineSMOTE算法樣本類別

圖3.3BorderlineSMOTE算法樣本類別

?椒ǎ?碆orderline-SMOTE1和Borderline-SMOTE2。BorderlineSMOTE算法是基于SMOTE算法的基礎(chǔ)上進行改進的過采樣算法,改進算法僅對樣本邊界上的少數(shù)類進行分析并合成新的樣本。BorderlineSMOTE算法的思想是將少數(shù)類樣本分為了3....



本文編號:3894888

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/nfm/3894888.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7eead***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com