基于機(jī)器學(xué)習(xí)和非侵入特征的Ⅱ型糖尿病篩檢研究
發(fā)布時(shí)間:2022-01-11 05:18
慢性疾病是人類(lèi)生命健康的一大威脅。而在眾多的慢性病中,糖尿病不僅損害了人們的身體健康,而且造成了沉重的經(jīng)濟(jì)和社會(huì)負(fù)擔(dān);而有效的早期篩檢可以有效提高人類(lèi)的生活質(zhì)量,降低疾病負(fù)擔(dān),減少健康壽命損失年。然而,基于人群的大規(guī)模人口篩查不僅有較長(zhǎng)的時(shí)間周期,而且會(huì)耗費(fèi)巨額的人力物力。隨著近年來(lái)機(jī)器學(xué)習(xí)的興起與發(fā)展,越來(lái)越多的研究人員開(kāi)始將機(jī)器學(xué)習(xí)模型作為篩檢和預(yù)測(cè)的工具。為了提高人群的健康水平,在本研究中使用了人口學(xué)指標(biāo)、身體測(cè)量指標(biāo)、問(wèn)卷調(diào)查、腸道微生物菌群作為非侵入的指標(biāo),來(lái)建立了糖尿病的篩檢預(yù)測(cè)模型。本文分別選用了美國(guó)疾控中心(centers for disease control and prevention,CDC)的全國(guó)健康與營(yíng)養(yǎng)調(diào)查(National Health and Nutrition Examination Survey,NHANES)和全人類(lèi)微生物組計(jì)劃(Integrative Human Microbiome Project,iHMP)中Ⅱ型糖尿。╰ype 2 diabetes mellitus,T2DM)的數(shù)據(jù),來(lái)進(jìn)行糖尿病的篩檢與預(yù)測(cè)工作。首先,2011年到201...
【文章來(lái)源】:遼寧大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:47 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
五折交叉驗(yàn)證下不同機(jī)器學(xué)習(xí)算法前50個(gè)集成模型性能使用上述選擇出來(lái)的12個(gè)特征,共計(jì)算出6個(gè)不同模型,包括三種不同的機(jī)器學(xué)習(xí)模型及他們的聚類(lèi)學(xué)習(xí)模型
第2章基于人體學(xué)指標(biāo)的篩檢模型17表2-5模型在測(cè)試集和外部驗(yàn)證集的性能表現(xiàn)AUC敏感性特異度準(zhǔn)確率陽(yáng)性預(yù)測(cè)值測(cè)試集LDA0.8640.6970.8290.8080.429RF0.8360.8300.6480.6760.303SVM0.7960.6300.8640.8270.460EELDA0.8670.7580.7770.7740.385EERF0.8500.7760.7700.7710.383EESVM0.8610.7520.7830.7780.390外部驗(yàn)證集LDA0.8460.7590.7620.7610.418RF0.8280.8880.5940.6480.331SVM0.8110.7200.7890.7760.435EELDA0.8490.8190.7090.7300.389EERF0.8360.8130.7130.7310.390EESVM0.8480.8240.7140.7340.394EE=簡(jiǎn)單聚類(lèi)學(xué)習(xí)(easyensemble)圖2-3外部驗(yàn)證集中三種機(jī)器學(xué)習(xí)及其聚類(lèi)學(xué)習(xí)方法的ROC曲線(xiàn)A.LDA及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)B.RF及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)C.SVM及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)D.三種機(jī)器學(xué)習(xí)及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)
P = 0.210)。在外部驗(yàn)證集中,不同方法的簡(jiǎn)單聚類(lèi)學(xué)習(xí)均在一定程度上提高了模型的性能,LDA 提高了 AUC 值的 0.004(Z = 2.734, P = 0.006)、RF 提高了AUC 值的 0.008(Z = 2.991, P = 0.002)、SVM 提高了 AUC 值的 0.037(Z = 5.908, P < 0.001)。 基于外部驗(yàn)證集的應(yīng)用聚類(lèi)學(xué)習(xí)方法模型性能的提高可以將此類(lèi)模型應(yīng)用與大規(guī)模人群的Ⅱ型糖尿病的篩查工作。為了更好的打成這一目的,我們建立了基于聚類(lèi)學(xué)習(xí)的Ⅱ型糖尿病的預(yù)測(cè)網(wǎng)站(http://112.126.70.33/diabetes),該網(wǎng)站分別提供了用于個(gè)人和人群的Ⅱ型糖尿病篩檢程序,對(duì)于個(gè)人使用者來(lái)說(shuō),給出了個(gè)人的患病概率;對(duì)于研究者來(lái)說(shuō),該網(wǎng)站會(huì)給出其中每個(gè)樣本在 3 個(gè)不同機(jī)器學(xué)習(xí)模型及其聚類(lèi)學(xué)習(xí)模型中的預(yù)測(cè)概率。圖 2-4 給出了該網(wǎng)站的主頁(yè)內(nèi)容。
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)算法的2型糖尿病患者3個(gè)月血糖預(yù)測(cè)[J]. 覃偉,高敏,沈瑩,史宇暉,吳濤,趙艾,孫昕霙. 中華疾病控制雜志. 2019(11)
碩士論文
[1]漢族與蒙古族2型糖尿病相關(guān)腸道菌群差異分析[D]. 謝丹.中央民族大學(xué) 2019
[2]決策樹(shù)模型在2型糖尿病診斷中的應(yīng)用[D]. 馬爾麗.沈陽(yáng)師范大學(xué) 2018
本文編號(hào):3582167
【文章來(lái)源】:遼寧大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:47 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
五折交叉驗(yàn)證下不同機(jī)器學(xué)習(xí)算法前50個(gè)集成模型性能使用上述選擇出來(lái)的12個(gè)特征,共計(jì)算出6個(gè)不同模型,包括三種不同的機(jī)器學(xué)習(xí)模型及他們的聚類(lèi)學(xué)習(xí)模型
第2章基于人體學(xué)指標(biāo)的篩檢模型17表2-5模型在測(cè)試集和外部驗(yàn)證集的性能表現(xiàn)AUC敏感性特異度準(zhǔn)確率陽(yáng)性預(yù)測(cè)值測(cè)試集LDA0.8640.6970.8290.8080.429RF0.8360.8300.6480.6760.303SVM0.7960.6300.8640.8270.460EELDA0.8670.7580.7770.7740.385EERF0.8500.7760.7700.7710.383EESVM0.8610.7520.7830.7780.390外部驗(yàn)證集LDA0.8460.7590.7620.7610.418RF0.8280.8880.5940.6480.331SVM0.8110.7200.7890.7760.435EELDA0.8490.8190.7090.7300.389EERF0.8360.8130.7130.7310.390EESVM0.8480.8240.7140.7340.394EE=簡(jiǎn)單聚類(lèi)學(xué)習(xí)(easyensemble)圖2-3外部驗(yàn)證集中三種機(jī)器學(xué)習(xí)及其聚類(lèi)學(xué)習(xí)方法的ROC曲線(xiàn)A.LDA及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)B.RF及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)C.SVM及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)D.三種機(jī)器學(xué)習(xí)及其聚類(lèi)學(xué)習(xí)ROC曲線(xiàn)
P = 0.210)。在外部驗(yàn)證集中,不同方法的簡(jiǎn)單聚類(lèi)學(xué)習(xí)均在一定程度上提高了模型的性能,LDA 提高了 AUC 值的 0.004(Z = 2.734, P = 0.006)、RF 提高了AUC 值的 0.008(Z = 2.991, P = 0.002)、SVM 提高了 AUC 值的 0.037(Z = 5.908, P < 0.001)。 基于外部驗(yàn)證集的應(yīng)用聚類(lèi)學(xué)習(xí)方法模型性能的提高可以將此類(lèi)模型應(yīng)用與大規(guī)模人群的Ⅱ型糖尿病的篩查工作。為了更好的打成這一目的,我們建立了基于聚類(lèi)學(xué)習(xí)的Ⅱ型糖尿病的預(yù)測(cè)網(wǎng)站(http://112.126.70.33/diabetes),該網(wǎng)站分別提供了用于個(gè)人和人群的Ⅱ型糖尿病篩檢程序,對(duì)于個(gè)人使用者來(lái)說(shuō),給出了個(gè)人的患病概率;對(duì)于研究者來(lái)說(shuō),該網(wǎng)站會(huì)給出其中每個(gè)樣本在 3 個(gè)不同機(jī)器學(xué)習(xí)模型及其聚類(lèi)學(xué)習(xí)模型中的預(yù)測(cè)概率。圖 2-4 給出了該網(wǎng)站的主頁(yè)內(nèi)容。
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)算法的2型糖尿病患者3個(gè)月血糖預(yù)測(cè)[J]. 覃偉,高敏,沈瑩,史宇暉,吳濤,趙艾,孫昕霙. 中華疾病控制雜志. 2019(11)
碩士論文
[1]漢族與蒙古族2型糖尿病相關(guān)腸道菌群差異分析[D]. 謝丹.中央民族大學(xué) 2019
[2]決策樹(shù)模型在2型糖尿病診斷中的應(yīng)用[D]. 馬爾麗.沈陽(yáng)師范大學(xué) 2018
本文編號(hào):3582167
本文鏈接:http://sikaile.net/yixuelunwen/nfm/3582167.html
最近更新
教材專(zhuān)著