天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 數學論文 >

基于六種統(tǒng)計學習方法和Adaboost視角下血糖值預測

發(fā)布時間:2021-12-24 12:53
  糖尿病是一種嚴重影響人體免疫力的慢性病,可以控制卻不能根治。合理的運用一些統(tǒng)計方法對血糖值進行預測,有利于糖尿病的預防和控制,對我國人民群眾整體的身體素質水平的提高具有重要貢獻。本文在預測血糖的過程中,一共使用了6種不同的統(tǒng)計學習方法對血糖值進行預測,即主成分分析(PCA)、梯度提升決策樹(GBDT)、支持向量回歸(SVR)、核嶺回歸(KRR)、Adaboost集成、投票回歸(VotingRegressor),并形成6種集成模型。其中有關血糖值的數據來源于天池精準醫(yī)療大賽——人工智能輔助糖尿病遺傳風險預測。首先對數據進行預處理,將處理后的數據導入Python,然后將含有5642個樣本值的一組血糖值數據按照7:3的比例隨機分成兩組,分別稱為訓練集和測試集,最后運用訓練集中的數據使用6種統(tǒng)計學習方法建立回歸模型,利用測試集中的數據預測血糖值,并對模型進行檢驗。文章最后分別從模型精度和模型效率兩個方面對6種集成模型對比分析發(fā)現:Ada-VotingRegressor模型的精度最高,測試集和訓練集的均方誤差相對最小,且測試集和訓練集的均方誤差相差最小,模型簡單,擬合度高;但當考慮到模型效率時,... 

【文章來源】:武漢科技大學湖北省

【文章頁數】:65 頁

【學位級別】:碩士

【部分圖文】:

基于六種統(tǒng)計學習方法和Adaboost視角下血糖值預測


SVR算法流程圖

重要性,變量,綜合指標


武漢科技大學碩士學位論文14作回歸。為了更清楚的看出這些綜合指標中哪些指標的相對重要性更高,我們將對這些指標進行變量特征重要性分析。3.2變量特征重要性分析變量特征重要性的大小是依據決策樹中節(jié)點的增益來判斷的,某個特征作為節(jié)點的次數越多,我們就認為它的相對重要性越高。圖3.1中,橫軸表示相對重要性的大小,縱軸表示變量的重要性,從圖中我們可以看出第7個綜合指標是18個新指標中相對重要性最高的,超過了90%,其次就是第1個和第8個綜合指標的相對重要性較高,分別達60%和40%左右,第10個綜合指標的相對重要性幾乎為0。圖3.1清晰的說明了在眾多綜合指標中,哪幾個綜合指標的相對重要性較大,從而間接指出原指標中那些指標對血糖的影響較高,為人們避免患糖尿病提供了科學依據。圖3.1變量的特征重要性3.3基于GBDT回歸的血糖值預測將這18個綜合指標導出到新的Excel表格中,然后將數據讀入python,按照7:3的比例劃分用于訓練數據建立回歸模型的訓練集和預測血糖值的測試集。表3.2中Y代表訓練集中血糖的真實值,即標簽,而Y*則代表用訓練集中的數據預測的血糖值,其中,建立的回歸模型的訓練集均方誤差為0.005358,得出預測的具體結果如表3.2所示。

學習曲線,學習曲線,均方誤差


武漢科技大學碩士學位論文19從表4.7中可以看出:在訓練集上,SVR比KRR的預測精確度低0.000274,在測試集上,SVR比KRR的預測精確度低0.000163?梢,無論是在訓練集上還是在測試集上,KRR的均方誤差都略小于SVR。其次,作出SVR和KRR的學習曲線,以橫坐標表示訓練的樣本的大小,縱坐標表示均方誤差(MSE),如圖4.1所示。圖4.1SVR和KRR學習曲線圖圖4.1中,橫坐標表示訓練的樣本的大小,縱坐標表示均方誤差(MSE)。從圖4.1可以看出:其一,隨著樣本量的不斷增加,SVR和KRR的學習曲線均呈遞減趨勢,SVR和KRR的均方誤差都在不斷減少。其二,KRR的學習曲線整體在SVR的下方,這表明:無論使用多大樣本量進行預測,KRR進行預測的均方誤差均小于SVR的均方誤差約0.000425。因此,KRR的預測精度要高于SVR,這與表4.7的結果相符。最后,為了對比SVR和KRR預測血糖值的效率,本文分別計算出模型擬合和預測的時間,結果如表4.8所示。表4.8SVR和KRR擬合預測時間模型類別訓練集擬合時間(s)測試集預測時間(s)SVR103.3710.453KRR189.7021.256由表4.8可知,KRR的擬合時間幾乎是SVR的1.8倍,預測時間更幾乎接近SVR的2.8倍,這說明KRR在對血糖值進行預測時,預測的精度要高于SVR的同時,訓練和預測時間也同樣高于SVR。

【參考文獻】:
期刊論文
[1]大數據時代醫(yī)療信息安全現狀分析和發(fā)展對策[J]. 劉磊,鄭姍姍.  包頭醫(yī)學. 2020(01)
[2]基于XGBoost對肺鱗癌和肺腺癌的分類預測[J]. 冷菲,李巍.  首都醫(yī)科大學學報. 2019(06)
[3]支持向量機和人工神經網絡在冠狀動脈旁路移植術后晚期靜脈移植血管病患病風險預測中的應用[J]. 鳳思苑,鞏曉文,崔壯,高靜,李長平,劉媛媛,劉寅,馬駿.  中國衛(wèi)生統(tǒng)計. 2019(04)
[4]人工智能技術在機械電子工程領域的應用[J]. 尚忠華.  科技風. 2019(17)
[5]基于Adaboost模型的江蘇省冬小麥產量預測[J]. 張順航,張鳳航,李金澤.  現代農業(yè)科技. 2019(12)
[6]社區(qū)2型糖尿病合并腦卒中患病率及相關因素調查分析[J]. 高薇,劉開翔,謝席勝,占志朋,趙玉章,馮勝剛,劉濤.  西部醫(yī)學. 2019(04)
[7]妊娠相關暴發(fā)性1型糖尿病1例報道[J]. 遆紅燕,康芳芳,郭亞莉,張韶君.  中西醫(yī)結合心腦血管病雜志. 2019(07)
[8]1型糖尿病視網膜病變的綜合防治[J]. 張弘哲,于偉泓.  中國醫(yī)刊. 2019(04)
[9]RGB三通道缺陷檢測投票分類器方法[J]. 李全杰,程良倫,吳珍珍,蔣俊釗.  計算機工程與設計. 2019(02)
[10]基于GM-SVR的小樣本條件下化工設備可靠性預測[J]. 趙江平,丁潔,陳敬龍.  中國安全生產科學技術. 2019(01)

碩士論文
[1]基于因子分析耦合XGBoost模型的血糖值回歸與分類預測[D]. 余力.武漢科技大學 2019
[2]基于CEEMDAN-ELM的短期血糖預測模型研究[D]. 郭占麗.鄭州大學 2017
[3]基于最小二乘法AR模型在血糖預測中的研究[D]. 安邦.鄭州大學 2015
[4]基于ARIMA和BPNN的組合預測模型在血糖預測中的應用[D]. 雍永強.鄭州大學 2015
[5]數據驅動的血糖預測方法研究[D]. 莫雪.北京化工大學 2014
[6]血糖預測模型及低血糖預警技術研究[D]. 申艷蕊.鄭州大學 2014
[7]數據驅動的血糖預測方法及其應用[D]. 吳向偉.北京化工大學 2013
[8]重癥監(jiān)護病人的數據驅動模型預測血糖控制[D]. 江旭.北京化工大學 2013



本文編號:3550518

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/3550518.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶6b775***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com