天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于異質(zhì)性模型的精準(zhǔn)醫(yī)療研究

發(fā)布時(shí)間:2020-03-23 23:45
【摘要】:萬事萬物都有其獨(dú)特性,每個個體既存在共性又有其獨(dú)特性。隨著精準(zhǔn)醫(yī)療的興起,機(jī)器學(xué)習(xí)模型已被引入醫(yī)療診斷領(lǐng)域,但這些模型只是抽象的概括了總體的發(fā)展趨勢,將總體趨勢還原到個體時(shí),結(jié)論往往會出現(xiàn)偏差。文章結(jié)合混合模型和機(jī)器學(xué)習(xí)模型提出異質(zhì)性模型,不但能有效的解釋異質(zhì)性總體,而且能夠充分發(fā)揮機(jī)器學(xué)習(xí)的高效精準(zhǔn)的特性,并對數(shù)據(jù)有良好的擬合效果。文章基于嬰兒出生指標(biāo)數(shù)據(jù)集,使用回歸分析、機(jī)器學(xué)習(xí)、混合模型等分析方法,從模型誤差量表和判別分析結(jié)果顯示:隨機(jī)森林的判別準(zhǔn)確率達(dá)到91%,分類效果最好。通過統(tǒng)計(jì)描述分析發(fā)現(xiàn)每個受試者母親存在很高的異質(zhì)性,因此引入線性混合模型處理個體異質(zhì)性,使用極大似然估計(jì)結(jié)合EM算法對線性混合模型的參數(shù)進(jìn)行估計(jì),并以隨機(jī)效應(yīng)_ib作為個體的異質(zhì)性。同理,處理分類數(shù)據(jù)引入廣義線性混合模型,使用懲罰似然估計(jì)進(jìn)行參數(shù)估計(jì)。將異質(zhì)性引入機(jī)器學(xué)習(xí)模型,所有的異質(zhì)性模型都比原模型好,模型誤差平方和SSE只有原來的1/4,甚至更少,支持向量機(jī)回歸改善效果最好,交叉驗(yàn)證結(jié)果最小、誤差最小且只有原來的1/8。求解個體的異質(zhì)性引入機(jī)器學(xué)習(xí)模型,異質(zhì)性模型在判別分析上有極大提升,決策樹提升最多,從69%提升到91%,隨機(jī)森林分類效果最好,判別準(zhǔn)確率達(dá)100%。因此,提取的異質(zhì)性變量對模型有極大的優(yōu)化作用,顯著改進(jìn)了誤差方差和第一類錯誤;根據(jù)異質(zhì)性變量對總體進(jìn)行聚類分析,加入異質(zhì)性變量的聚類使聚類變得更加簡潔有效。
【圖文】:

散點(diǎn)圖,殘差,散點(diǎn)圖,擬合


Estimate Std. Error t value Pr(>ercept) 2714.722 187.528 14.476 < 2e-16OKE1 -229.419 66.654 -3.442 0.00062E2 260.117 92.789 2.803 0.00526E3 193.92 72.852 2.662 0.00803 -6.011 5.554 -1.082 0.279T 1.899 1.04 1.826 0.0685結(jié)果來看,SMOKE 變量的回歸系數(shù)為-229 是 LWT 變量系數(shù)的幾十倍,說明 SMOKE 變量對嬰兒體重影響程度 AGE 變量。RACE 變量(RACE2,RACE3 表示的是第的影響大小,當(dāng)個體不屬于 RACE2、RACE3 時(shí)表示屬于型引入分類變量的效果)的回歸系數(shù)是 260 和 193,表示極大影響。通過對回歸后的殘差正態(tài)性檢驗(yàn),對殘差正 沒有足夠證據(jù)拒絕原假設(shè)。再看看殘差圖與正態(tài) Q-Q 圖點(diǎn)呈現(xiàn)出一條直線狀態(tài),說明殘差分布與正態(tài)分布很接效,分析合理。

回歸樹,數(shù)據(jù)集,葉節(jié)點(diǎn)


第 2 章 機(jī)器學(xué)習(xí)模型在醫(yī)療診斷的應(yīng)用區(qū)分性大的變量,從而作為決策樹的節(jié)點(diǎn)。假設(shè)訓(xùn)練數(shù)性向量(即節(jié)點(diǎn)),此時(shí)的信息熵增量為 Ga in ( D,A ) =I ( D )訓(xùn)練集 D 的熵, E ( D ,A )表示在分裂屬性 A 的條件熵。以用 R 軟件對嬰兒出生體重?cái)?shù)據(jù)集做決策樹回歸預(yù)測模型示,SMOKE 變量作為第一拆分變量(即根節(jié)點(diǎn)),即表的信息增量,接下來的是葉節(jié)點(diǎn),左邊第一個葉節(jié)點(diǎn)是增量來選擇,,同理右邊第一個葉節(jié)點(diǎn)是 RACE 變量。從圖嬰兒均值為 2842g,吸煙和高齡(AGE>32)嬰兒體重均值嬰兒體重均值大約在 3400g。根據(jù)回歸樹結(jié)果可以得出 S出生體重的主要因素。
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R-05;TP181

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 苑杰;王萌;杜蕾;王靜;;從精準(zhǔn)醫(yī)學(xué)談抑郁的異質(zhì)性[J];中華行為醫(yī)學(xué)與腦科學(xué)雜志;2018年09期

2 沈琳;陳千紅;譚紅專;;缺失數(shù)據(jù)的識別與處理[J];中南大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2013年12期

3 胡玄子;陳小雪;錢葉亮;姜正龍;趙彤洲;;數(shù)據(jù)處理中缺失數(shù)據(jù)填充方法的研究[J];湖北工業(yè)大學(xué)學(xué)報(bào);2013年05期

4 花琳琳;施念;楊永利;趙天儀;施學(xué)忠;;不同缺失值處理方法對隨機(jī)缺失數(shù)據(jù)處理效果的比較[J];鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2012年03期

5 方匡南;吳見彬;朱建平;謝邦昌;;隨機(jī)森林方法研究綜述[J];統(tǒng)計(jì)與信息論壇;2011年03期

6 魏秀菊;李青;李潤平;;4379例嬰兒出生體重分析[J];中國婦幼保健;2011年02期

7 王愛平;張功營;劉方;;EM算法研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年09期

8 董樂紅;耿國華;高原;;Boosting算法綜述[J];計(jì)算機(jī)應(yīng)用與軟件;2006年08期

9 于玲;吳鐵軍;;集成學(xué)習(xí):Boosting算法綜述[J];模式識別與人工智能;2004年01期

10 米杰,程紅,侯冬青,趙小元,魯杰,張志坤;嬰兒出生體重和母親孕期體重指數(shù)與胰島素抵抗綜合征的關(guān)系[J];中國藥物與臨床;2003年03期



本文編號:2597454

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2597454.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ace8d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com