多次交叉驗(yàn)證對PLSDA模型的影響研究
本文選題:交叉驗(yàn)證 + PLSDA; 參考:《中國衛(wèi)生統(tǒng)計》2017年01期
【摘要】:目的比較一次交叉驗(yàn)證和多次交叉驗(yàn)證對PLSDA最優(yōu)模型的影響,探討在個體正確分組和少數(shù)個體錯分時,多次交叉驗(yàn)證對PLSDA最優(yōu)模型穩(wěn)定性的影響。方法打亂數(shù)據(jù)集中個體順序進(jìn)行多次交叉驗(yàn)證,通過一次交叉驗(yàn)證和多次交叉驗(yàn)證的方法對模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)進(jìn)行分析,使用成分?jǐn)?shù)和MSEP等參數(shù)值來評價模型變異性和穩(wěn)定性。結(jié)果模擬數(shù)據(jù)結(jié)果,僅進(jìn)行1次交叉驗(yàn)證結(jié)果成分?jǐn)?shù)為3,MSEP值為0.3792;在不打亂數(shù)據(jù)標(biāo)簽時,5000次交叉驗(yàn)證結(jié)果中,成分?jǐn)?shù)范圍是2~6,MSEP值的范圍0.2569~0.5794;打亂5%的標(biāo)簽時,5000次交叉驗(yàn)證結(jié)果中,成分?jǐn)?shù)范圍是1~8,MSEP值的范圍0.2061~0.6463;真實(shí)數(shù)據(jù)結(jié)果,進(jìn)行1次交叉驗(yàn)證結(jié)果成分?jǐn)?shù)為4,MSEP值為0.1376;10000次交叉驗(yàn)證成分?jǐn)?shù)范圍是4~10,MSEP范圍是0.0802~0.3761。結(jié)論一次交叉驗(yàn)證結(jié)果不穩(wěn)定,在應(yīng)用PLSDA建模時,多次交叉驗(yàn)證在少量個體錯分時能夠獲得穩(wěn)定模型,建議使用多次交叉驗(yàn)證確保PLSDA模型穩(wěn)定性。
[Abstract]:Aim to compare the effects of one cross validation and multiple cross validation on the stability of PLSDA optimal model, and to explore the effect of multiple cross validation on the stability of PLSDA optimal model when individuals are correctly grouped and a few individuals are misclassified. Methods the individuals in the data set were scrambled for multiple cross validation, and the simulated data and real data were analyzed by one cross validation and multiple cross validation. Parameters such as fraction and MSEP are used to evaluate the variability and stability of the model. Results the result of only one cross validation was 0.3792, and the score range was 0.2569 / 0.5794 when the data label was not tampered with 5000 times. The range of MSEP is 0.2061U 0.6463.The result of one cross validation is 0.137610000. The range of MSEP is 0.0802 / 0.3761. the result of one cross validation is 0.0802 / 0.3761.The result is as follows: (1) the range of MSEP is 0.2061 / 0.463.The result of one cross validation is 0.137610 000 times, and the range of MSEP is 0.0802 / 0.3761. Conclusion the results of one cross validation are unstable. When using PLSDA model, multiple cross validation can obtain a stable model when a few individuals misdivide. It is suggested that multiple cross validation should be used to ensure the stability of PLSDA model.
【作者單位】: 哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室;
【基金】:黑龍江省自然基金重點(diǎn)項(xiàng)目(ZD201314) 國家自然基金(81502889)
【分類號】:O212.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉學(xué)藝;李平;郜傳厚;;極限學(xué)習(xí)機(jī)的快速留一交叉驗(yàn)證算法[J];上海交通大學(xué)學(xué)報;2011年08期
2 杜偉杰;王瑞波;李濟(jì)洪;;基于均衡7×2交叉驗(yàn)證的模型選擇方法[J];太原師范學(xué)院學(xué)報(自然科學(xué)版);2013年01期
3 高紅;;基于交叉驗(yàn)證的錯誤率估計分析[J];科技信息;2011年25期
4 李艷芳;王鈺;李濟(jì)洪;;幾種交叉驗(yàn)證檢驗(yàn)的可重復(fù)性[J];太原師范學(xué)院學(xué)報(自然科學(xué)版);2013年04期
5 何春;;模型選擇中交叉驗(yàn)證量的改進(jìn)[J];生物數(shù)學(xué)學(xué)報;2010年02期
6 胡軍艷;王鈺;李濟(jì)洪;;泛化誤差的三種交叉驗(yàn)證估計方法的比較[J];太原師范學(xué)院學(xué)報(自然科學(xué)版);2013年01期
7 胡局新;張功杰;;基于K折交叉驗(yàn)證的選擇性集成分類算法[J];科技通報;2013年12期
8 家會臣;靳竹萱;李濟(jì)洪;;Logistic模型選擇中三種交叉驗(yàn)證策略的比較[J];太原師范學(xué)院學(xué)報(自然科學(xué)版);2012年01期
9 聞斌,江其保;通過交叉驗(yàn)證準(zhǔn)則選擇線性模型[J];華東交通大學(xué)學(xué)報;2005年02期
10 聞斌;歐衛(wèi)華;;利用交叉驗(yàn)證準(zhǔn)則選擇線性模型[J];常熟理工學(xué)院學(xué)報;2009年02期
相關(guān)碩士學(xué)位論文 前5條
1 李艷芳;基于均衡5x2交叉驗(yàn)證的分類算法對照研究[D];山西大學(xué);2014年
2 胡軍艷;基于生物信息數(shù)據(jù)的幾種交叉驗(yàn)證方法比較[D];山西大學(xué);2013年
3 杜偉杰;均衡m×2交叉驗(yàn)證方法[D];山西大學(xué);2013年
4 趙存秀;交叉驗(yàn)證中數(shù)據(jù)分布對分類性能的影響分析[D];山西大學(xué);2013年
5 范永東;模型選擇中的交叉驗(yàn)證方法綜述[D];山西大學(xué);2013年
,本文編號:1907222
本文鏈接:http://sikaile.net/kejilunwen/yysx/1907222.html