天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

混合型缺失數(shù)據(jù)填補(bǔ)方法比較與應(yīng)用

發(fā)布時(shí)間:2021-05-09 21:52
  目的針對(duì)混合型缺失數(shù)據(jù),使用幾種填補(bǔ)方法在缺失填補(bǔ)中的應(yīng)用并評(píng)價(jià)填補(bǔ)效果。方法結(jié)合實(shí)際數(shù)據(jù),模擬出不同缺失比例(10%、20%、30%、50%),采用MissForest、因子分析(FAMD)、K-最近鄰填補(bǔ)法(KNN)和基于鏈?zhǔn)椒匠潭嘀夭逖a(bǔ)(MICE)四種方法進(jìn)行填補(bǔ);采用錯(cuò)分類比例(PFC)、正則化均方根誤差(NRMSE)和回歸系數(shù)估計(jì)值比較填補(bǔ)效果。結(jié)果20FAMD與MissForest相比,對(duì)分類變量填補(bǔ)表現(xiàn)優(yōu)越。缺失比例是10%時(shí),FAMD與MissForest表現(xiàn)優(yōu)于KNN和MICE;缺失比例是20%時(shí)FAMD明顯優(yōu)于其它三種方法,但是MissForest表現(xiàn)亦可;缺失比例是30%時(shí),四種模型表現(xiàn)明顯下降,處理效果均不太理想;缺失比例是50%時(shí),雖然FAMD仍有兩個(gè)變量符合優(yōu)良標(biāo)準(zhǔn),但對(duì)某些變量估計(jì)誤差較大,其它三種方法填補(bǔ)均失效。結(jié)論20FAMD填補(bǔ)方法總體表現(xiàn)較好,面對(duì)混合型缺失數(shù)據(jù)時(shí)可以考慮優(yōu)先選用。 

【文章來源】:中國衛(wèi)生統(tǒng)計(jì). 2020,37(03)北大核心CSCD

【文章頁數(shù)】:5 頁

【文章目錄】:
原理與方法
    1.MissForest 填補(bǔ)
    2.FMAD填補(bǔ)
    3. KNN填補(bǔ)
    4. MICE填補(bǔ)
模擬分析
    1. 模擬思路
    2. 模擬完整數(shù)據(jù)集與模型構(gòu)建
    3. 評(píng)價(jià)指標(biāo)
    4. 模擬結(jié)果
實(shí)例應(yīng)用
    1. 資料來源
    2. 分析方法及評(píng)價(jià)標(biāo)準(zhǔn)
結(jié)果與分析
    1. 四種方法的NRMSE和PFC
    2. 不同缺失比例下變量的回歸系數(shù)
討 論


【參考文獻(xiàn)】:
期刊論文
[1]基于R軟件的缺失數(shù)據(jù)MICE填補(bǔ)效果研究[J]. 章濤,朱麟,季加?xùn)|,袁中尚,薛付忠,李秀君.  中國衛(wèi)生統(tǒng)計(jì). 2015(04)
[2]缺失森林算法在缺失值填補(bǔ)中的應(yīng)用[J]. 沈琳,胡國清,陳立章,譚紅專.  中國衛(wèi)生統(tǒng)計(jì). 2014(05)



本文編號(hào):3178088

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3178088.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶049df***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com