天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

烏魯木齊市成人2型糖尿病發(fā)病風(fēng)險(xiǎn)模型的建立與評(píng)估

發(fā)布時(shí)間:2020-07-28 12:06
【摘要】:目的:建立烏魯木齊市成人2型糖尿病發(fā)病風(fēng)險(xiǎn)模型并進(jìn)行評(píng)估。方法:采用隨機(jī)整群抽樣的方式在烏魯木齊市米東區(qū)和新市區(qū)分別抽取A社區(qū)衛(wèi)生服務(wù)中心(A社區(qū))和B社區(qū)衛(wèi)生服務(wù)中心(B社區(qū)),于2018年7月至2019年1月分別在A社區(qū)和B社區(qū)招募年齡為35~74歲居民并進(jìn)行問卷調(diào)查、體格測量、體脂檢測和實(shí)驗(yàn)室檢測。以A社區(qū)的研究數(shù)據(jù)作為訓(xùn)練集,在訓(xùn)練集中分別運(yùn)用單因素Logistic回歸和隨機(jī)森林算法篩選變量,再應(yīng)用多因素Logistic回歸建立糖尿病發(fā)病風(fēng)險(xiǎn)模型,采用十折交叉驗(yàn)證對(duì)模型進(jìn)行內(nèi)部驗(yàn)證,再用B社區(qū)居民的研究數(shù)據(jù)對(duì)建立的糖尿病發(fā)病風(fēng)險(xiǎn)模型進(jìn)行外部驗(yàn)證,通過受試者工作特征曲線下面積(AUC)和統(tǒng)計(jì)學(xué)檢驗(yàn)?zāi)P皖A(yù)測值和實(shí)際觀測值間的差異來分別評(píng)價(jià)模型的區(qū)分度和校準(zhǔn)度。結(jié)果:在A社區(qū)和B社區(qū)最終分別招募1221名和1004名研究對(duì)象。通過B社區(qū)居民的研究數(shù)據(jù)對(duì)單因素logistic回歸篩選變量后用多因素logistic回歸(方法一)建立的糖尿病發(fā)病風(fēng)險(xiǎn)模型進(jìn)行評(píng)估,其靈敏度為70.1%,特異度為64.6%,預(yù)測一致率為65.4%,AUC為0.717,95%CI(0.672,0.761);通過B社區(qū)居民的研究數(shù)據(jù)對(duì)隨機(jī)森林算法篩選變量后用多因素logistic回歸(方法二)建立的糖尿病風(fēng)險(xiǎn)預(yù)測模型進(jìn)行評(píng)估,其靈敏度為70.1%,特異度為60.9%,預(yù)測一致率為62.4%,AUC為0.708,95%CI(0.664,0.749),兩種預(yù)測方法AUC的差異無統(tǒng)計(jì)學(xué)意義,即兩種預(yù)測方法的區(qū)分度無差別,區(qū)分度均較高。兩種預(yù)測方法各自糖尿病發(fā)生的預(yù)測值和實(shí)際觀測值的差異經(jīng)Hosmer-Lemeshow(H-L)檢驗(yàn)發(fā)現(xiàn)均無統(tǒng)計(jì)學(xué)意義,即兩種預(yù)測方法均有良好的校準(zhǔn)度;從模型預(yù)測值和實(shí)際觀測值間的關(guān)系圖上可同樣看出,兩種預(yù)測方法各自的校準(zhǔn)度較好。結(jié)論:通過方法一和方法二建立的糖尿病發(fā)病風(fēng)險(xiǎn)模型,具有較高的預(yù)測效能,兩種預(yù)測方法都具有較高的區(qū)分度和良好的校準(zhǔn)度。
【學(xué)位授予單位】:新疆醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R587.1;R181.3
【圖文】:

糖尿病,森林,風(fēng)險(xiǎn)預(yù)測,算法分析


變量平均重要性得分(分)圖 1 糖尿病風(fēng)險(xiǎn)預(yù)測隨機(jī)森林算法分析結(jié)果變量平均重要性Figure1 Analysis results of random forests algorithm for diabetes mellitus risk prediction.5.2 隨機(jī)森林算法篩選變量運(yùn)用隨機(jī)森林算法篩選 A 社區(qū) 1221 名研究數(shù)據(jù)庫中糖尿病相關(guān)的變量,得

數(shù)據(jù)分類,錯(cuò)誤率,森林


圖 2 逐步隨機(jī)森林袋外數(shù)據(jù)分類錯(cuò)誤率圖Figure2 Classification error rate chart of stepwise random forests out of bag data1.6 多因素 Logistic 回歸分析隨機(jī)森林算法篩選出的糖尿病家族史、高血壓、血清肌酐、年齡、咸菜泡菜和新鮮瓜果攝入頻率等 25 個(gè)變量作為自變量,以是否患糖尿。ㄙx值:是=1,否=0

曲線,篩選變量,多因素,森林


32圖 4 多因素 Logistic 回歸的 ROC 曲線(隨機(jī)森林算法回歸篩選變量)e4 ROC curve of multivariate logistic regression model(random forests alscreening variables)

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 沈智勇;蘇

本文編號(hào):2772859


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/2772859.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fb3f5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com