混合型缺失數(shù)據(jù)填補(bǔ)方法比較與應(yīng)用
發(fā)布時(shí)間:2021-05-09 21:52
目的針對(duì)混合型缺失數(shù)據(jù),使用幾種填補(bǔ)方法在缺失填補(bǔ)中的應(yīng)用并評(píng)價(jià)填補(bǔ)效果。方法結(jié)合實(shí)際數(shù)據(jù),模擬出不同缺失比例(10%、20%、30%、50%),采用MissForest、因子分析(FAMD)、K-最近鄰填補(bǔ)法(KNN)和基于鏈?zhǔn)椒匠潭嘀夭逖a(bǔ)(MICE)四種方法進(jìn)行填補(bǔ);采用錯(cuò)分類比例(PFC)、正則化均方根誤差(NRMSE)和回歸系數(shù)估計(jì)值比較填補(bǔ)效果。結(jié)果20FAMD與MissForest相比,對(duì)分類變量填補(bǔ)表現(xiàn)優(yōu)越。缺失比例是10%時(shí),FAMD與MissForest表現(xiàn)優(yōu)于KNN和MICE;缺失比例是20%時(shí)FAMD明顯優(yōu)于其它三種方法,但是MissForest表現(xiàn)亦可;缺失比例是30%時(shí),四種模型表現(xiàn)明顯下降,處理效果均不太理想;缺失比例是50%時(shí),雖然FAMD仍有兩個(gè)變量符合優(yōu)良標(biāo)準(zhǔn),但對(duì)某些變量估計(jì)誤差較大,其它三種方法填補(bǔ)均失效。結(jié)論20FAMD填補(bǔ)方法總體表現(xiàn)較好,面對(duì)混合型缺失數(shù)據(jù)時(shí)可以考慮優(yōu)先選用。
【文章來源】:中國衛(wèi)生統(tǒng)計(jì). 2020,37(03)北大核心CSCD
【文章頁數(shù)】:5 頁
【文章目錄】:
原理與方法
1.MissForest 填補(bǔ)
2.FMAD填補(bǔ)
3. KNN填補(bǔ)
4. MICE填補(bǔ)
模擬分析
1. 模擬思路
2. 模擬完整數(shù)據(jù)集與模型構(gòu)建
3. 評(píng)價(jià)指標(biāo)
4. 模擬結(jié)果
實(shí)例應(yīng)用
1. 資料來源
2. 分析方法及評(píng)價(jià)標(biāo)準(zhǔn)
結(jié)果與分析
1. 四種方法的NRMSE和PFC
2. 不同缺失比例下變量的回歸系數(shù)
討 論
【參考文獻(xiàn)】:
期刊論文
[1]基于R軟件的缺失數(shù)據(jù)MICE填補(bǔ)效果研究[J]. 章濤,朱麟,季加?xùn)|,袁中尚,薛付忠,李秀君. 中國衛(wèi)生統(tǒng)計(jì). 2015(04)
[2]缺失森林算法在缺失值填補(bǔ)中的應(yīng)用[J]. 沈琳,胡國清,陳立章,譚紅專. 中國衛(wèi)生統(tǒng)計(jì). 2014(05)
本文編號(hào):3178088
【文章來源】:中國衛(wèi)生統(tǒng)計(jì). 2020,37(03)北大核心CSCD
【文章頁數(shù)】:5 頁
【文章目錄】:
原理與方法
1.MissForest 填補(bǔ)
2.FMAD填補(bǔ)
3. KNN填補(bǔ)
4. MICE填補(bǔ)
模擬分析
1. 模擬思路
2. 模擬完整數(shù)據(jù)集與模型構(gòu)建
3. 評(píng)價(jià)指標(biāo)
4. 模擬結(jié)果
實(shí)例應(yīng)用
1. 資料來源
2. 分析方法及評(píng)價(jià)標(biāo)準(zhǔn)
結(jié)果與分析
1. 四種方法的NRMSE和PFC
2. 不同缺失比例下變量的回歸系數(shù)
討 論
【參考文獻(xiàn)】:
期刊論文
[1]基于R軟件的缺失數(shù)據(jù)MICE填補(bǔ)效果研究[J]. 章濤,朱麟,季加?xùn)|,袁中尚,薛付忠,李秀君. 中國衛(wèi)生統(tǒng)計(jì). 2015(04)
[2]缺失森林算法在缺失值填補(bǔ)中的應(yīng)用[J]. 沈琳,胡國清,陳立章,譚紅專. 中國衛(wèi)生統(tǒng)計(jì). 2014(05)
本文編號(hào):3178088
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3178088.html
最近更新
教材專著