天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 數(shù)學(xué)論文 >

基于六種統(tǒng)計學(xué)習(xí)方法和Adaboost視角下血糖值預(yù)測

發(fā)布時間:2021-12-24 12:53
  糖尿病是一種嚴(yán)重影響人體免疫力的慢性病,可以控制卻不能根治。合理的運(yùn)用一些統(tǒng)計方法對血糖值進(jìn)行預(yù)測,有利于糖尿病的預(yù)防和控制,對我國人民群眾整體的身體素質(zhì)水平的提高具有重要貢獻(xiàn)。本文在預(yù)測血糖的過程中,一共使用了6種不同的統(tǒng)計學(xué)習(xí)方法對血糖值進(jìn)行預(yù)測,即主成分分析(PCA)、梯度提升決策樹(GBDT)、支持向量回歸(SVR)、核嶺回歸(KRR)、Adaboost集成、投票回歸(VotingRegressor),并形成6種集成模型。其中有關(guān)血糖值的數(shù)據(jù)來源于天池精準(zhǔn)醫(yī)療大賽——人工智能輔助糖尿病遺傳風(fēng)險預(yù)測。首先對數(shù)據(jù)進(jìn)行預(yù)處理,將處理后的數(shù)據(jù)導(dǎo)入Python,然后將含有5642個樣本值的一組血糖值數(shù)據(jù)按照7:3的比例隨機(jī)分成兩組,分別稱為訓(xùn)練集和測試集,最后運(yùn)用訓(xùn)練集中的數(shù)據(jù)使用6種統(tǒng)計學(xué)習(xí)方法建立回歸模型,利用測試集中的數(shù)據(jù)預(yù)測血糖值,并對模型進(jìn)行檢驗(yàn)。文章最后分別從模型精度和模型效率兩個方面對6種集成模型對比分析發(fā)現(xiàn):Ada-VotingRegressor模型的精度最高,測試集和訓(xùn)練集的均方誤差相對最小,且測試集和訓(xùn)練集的均方誤差相差最小,模型簡單,擬合度高;但當(dāng)考慮到模型效率時,... 

【文章來源】:武漢科技大學(xué)湖北省

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于六種統(tǒng)計學(xué)習(xí)方法和Adaboost視角下血糖值預(yù)測


SVR算法流程圖

重要性,變量,綜合指標(biāo)


武漢科技大學(xué)碩士學(xué)位論文14作回歸。為了更清楚的看出這些綜合指標(biāo)中哪些指標(biāo)的相對重要性更高,我們將對這些指標(biāo)進(jìn)行變量特征重要性分析。3.2變量特征重要性分析變量特征重要性的大小是依據(jù)決策樹中節(jié)點(diǎn)的增益來判斷的,某個特征作為節(jié)點(diǎn)的次數(shù)越多,我們就認(rèn)為它的相對重要性越高。圖3.1中,橫軸表示相對重要性的大小,縱軸表示變量的重要性,從圖中我們可以看出第7個綜合指標(biāo)是18個新指標(biāo)中相對重要性最高的,超過了90%,其次就是第1個和第8個綜合指標(biāo)的相對重要性較高,分別達(dá)60%和40%左右,第10個綜合指標(biāo)的相對重要性幾乎為0。圖3.1清晰的說明了在眾多綜合指標(biāo)中,哪幾個綜合指標(biāo)的相對重要性較大,從而間接指出原指標(biāo)中那些指標(biāo)對血糖的影響較高,為人們避免患糖尿病提供了科學(xué)依據(jù)。圖3.1變量的特征重要性3.3基于GBDT回歸的血糖值預(yù)測將這18個綜合指標(biāo)導(dǎo)出到新的Excel表格中,然后將數(shù)據(jù)讀入python,按照7:3的比例劃分用于訓(xùn)練數(shù)據(jù)建立回歸模型的訓(xùn)練集和預(yù)測血糖值的測試集。表3.2中Y代表訓(xùn)練集中血糖的真實(shí)值,即標(biāo)簽,而Y*則代表用訓(xùn)練集中的數(shù)據(jù)預(yù)測的血糖值,其中,建立的回歸模型的訓(xùn)練集均方誤差為0.005358,得出預(yù)測的具體結(jié)果如表3.2所示。

學(xué)習(xí)曲線,學(xué)習(xí)曲線,均方誤差


武漢科技大學(xué)碩士學(xué)位論文19從表4.7中可以看出:在訓(xùn)練集上,SVR比KRR的預(yù)測精確度低0.000274,在測試集上,SVR比KRR的預(yù)測精確度低0.000163。可見,無論是在訓(xùn)練集上還是在測試集上,KRR的均方誤差都略小于SVR。其次,作出SVR和KRR的學(xué)習(xí)曲線,以橫坐標(biāo)表示訓(xùn)練的樣本的大小,縱坐標(biāo)表示均方誤差(MSE),如圖4.1所示。圖4.1SVR和KRR學(xué)習(xí)曲線圖圖4.1中,橫坐標(biāo)表示訓(xùn)練的樣本的大小,縱坐標(biāo)表示均方誤差(MSE)。從圖4.1可以看出:其一,隨著樣本量的不斷增加,SVR和KRR的學(xué)習(xí)曲線均呈遞減趨勢,SVR和KRR的均方誤差都在不斷減少。其二,KRR的學(xué)習(xí)曲線整體在SVR的下方,這表明:無論使用多大樣本量進(jìn)行預(yù)測,KRR進(jìn)行預(yù)測的均方誤差均小于SVR的均方誤差約0.000425。因此,KRR的預(yù)測精度要高于SVR,這與表4.7的結(jié)果相符。最后,為了對比SVR和KRR預(yù)測血糖值的效率,本文分別計算出模型擬合和預(yù)測的時間,結(jié)果如表4.8所示。表4.8SVR和KRR擬合預(yù)測時間模型類別訓(xùn)練集擬合時間(s)測試集預(yù)測時間(s)SVR103.3710.453KRR189.7021.256由表4.8可知,KRR的擬合時間幾乎是SVR的1.8倍,預(yù)測時間更幾乎接近SVR的2.8倍,這說明KRR在對血糖值進(jìn)行預(yù)測時,預(yù)測的精度要高于SVR的同時,訓(xùn)練和預(yù)測時間也同樣高于SVR。

【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)時代醫(yī)療信息安全現(xiàn)狀分析和發(fā)展對策[J]. 劉磊,鄭姍姍.  包頭醫(yī)學(xué). 2020(01)
[2]基于XGBoost對肺鱗癌和肺腺癌的分類預(yù)測[J]. 冷菲,李巍.  首都醫(yī)科大學(xué)學(xué)報. 2019(06)
[3]支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)在冠狀動脈旁路移植術(shù)后晚期靜脈移植血管病患病風(fēng)險預(yù)測中的應(yīng)用[J]. 鳳思苑,鞏曉文,崔壯,高靜,李長平,劉媛媛,劉寅,馬駿.  中國衛(wèi)生統(tǒng)計. 2019(04)
[4]人工智能技術(shù)在機(jī)械電子工程領(lǐng)域的應(yīng)用[J]. 尚忠華.  科技風(fēng). 2019(17)
[5]基于Adaboost模型的江蘇省冬小麥產(chǎn)量預(yù)測[J]. 張順航,張鳳航,李金澤.  現(xiàn)代農(nóng)業(yè)科技. 2019(12)
[6]社區(qū)2型糖尿病合并腦卒中患病率及相關(guān)因素調(diào)查分析[J]. 高薇,劉開翔,謝席勝,占志朋,趙玉章,馮勝剛,劉濤.  西部醫(yī)學(xué). 2019(04)
[7]妊娠相關(guān)暴發(fā)性1型糖尿病1例報道[J]. 遆紅燕,康芳芳,郭亞莉,張韶君.  中西醫(yī)結(jié)合心腦血管病雜志. 2019(07)
[8]1型糖尿病視網(wǎng)膜病變的綜合防治[J]. 張弘哲,于偉泓.  中國醫(yī)刊. 2019(04)
[9]RGB三通道缺陷檢測投票分類器方法[J]. 李全杰,程良倫,吳珍珍,蔣俊釗.  計算機(jī)工程與設(shè)計. 2019(02)
[10]基于GM-SVR的小樣本條件下化工設(shè)備可靠性預(yù)測[J]. 趙江平,丁潔,陳敬龍.  中國安全生產(chǎn)科學(xué)技術(shù). 2019(01)

碩士論文
[1]基于因子分析耦合XGBoost模型的血糖值回歸與分類預(yù)測[D]. 余力.武漢科技大學(xué) 2019
[2]基于CEEMDAN-ELM的短期血糖預(yù)測模型研究[D]. 郭占麗.鄭州大學(xué) 2017
[3]基于最小二乘法AR模型在血糖預(yù)測中的研究[D]. 安邦.鄭州大學(xué) 2015
[4]基于ARIMA和BPNN的組合預(yù)測模型在血糖預(yù)測中的應(yīng)用[D]. 雍永強(qiáng).鄭州大學(xué) 2015
[5]數(shù)據(jù)驅(qū)動的血糖預(yù)測方法研究[D]. 莫雪.北京化工大學(xué) 2014
[6]血糖預(yù)測模型及低血糖預(yù)警技術(shù)研究[D]. 申艷蕊.鄭州大學(xué) 2014
[7]數(shù)據(jù)驅(qū)動的血糖預(yù)測方法及其應(yīng)用[D]. 吳向偉.北京化工大學(xué) 2013
[8]重癥監(jiān)護(hù)病人的數(shù)據(jù)驅(qū)動模型預(yù)測血糖控制[D]. 江旭.北京化工大學(xué) 2013



本文編號:3550518

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/3550518.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6b775***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com