基于遞歸特征消除方法的隨機(jī)森林算法
本文關(guān)鍵詞: 隨機(jī)森林 遞歸 特征消除 變量選擇 機(jī)器學(xué)習(xí) 出處:《統(tǒng)計(jì)與決策》2017年21期 論文類(lèi)型:期刊論文
【摘要】:基于隨機(jī)森林算法中的相關(guān)預(yù)測(cè)因子進(jìn)行變量選擇,在高維回歸或分類(lèi)框架中,變量選擇是一項(xiàng)艱巨的任務(wù),甚至在高度相關(guān)的預(yù)測(cè)中變得更加具有挑戰(zhàn)性,文章提供了在回歸模型上置換重要性測(cè)量的理論研究,這使我們能夠描述相關(guān)性預(yù)測(cè)和排名的重要性之間的影響。相比于原始隨機(jī)森林算法使用重要性排名做變量選擇,研究結(jié)果使用了遞歸特征消除(RFE)方法做變量選擇。通過(guò)實(shí)驗(yàn)證明了RFE-RF方法對(duì)機(jī)器學(xué)習(xí)算法的正確預(yù)測(cè)有很大的幫助。
[Abstract]:Variable selection based on correlation prediction factors in stochastic forest algorithm is a difficult task in high-dimensional regression or classification framework, and even becomes more challenging in highly correlated prediction. This paper provides a theoretical study of permutation importance measurement on regression model, which enables us to describe the influence between correlation prediction and rank importance. Compared with the original random forest algorithm, importance ranking is used to select variables. The results show that the recursive feature cancellation (RFE-RF) method is used to select variables, and the experimental results show that the RFE-RF method is of great help to the correct prediction of machine learning algorithms.
【作者單位】: 蘭州交通大學(xué)電子與信息工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61163010) 甘肅自然科學(xué)基金資助項(xiàng)目(1308RJZA111)
【分類(lèi)號(hào)】:F224
【相似文獻(xiàn)】
相關(guān)期刊論文 前8條
1 孟杰;;隨機(jī)森林模型在財(cái)務(wù)失敗預(yù)警中的應(yīng)用[J];統(tǒng)計(jì)與決策;2014年04期
2 劉微;羅林開(kāi);王華珍;;基于隨機(jī)森林的基金重倉(cāng)股預(yù)測(cè)[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年S1期
3 錢(qián)爭(zhēng)鳴;李海波;于艷萍;;個(gè)人住房按揭貸款違約風(fēng)險(xiǎn)研究[J];經(jīng)濟(jì)研究;2010年S1期
4 高仁祥,張世英,劉豹;基于神經(jīng)網(wǎng)絡(luò)的變量選擇方法[J];系統(tǒng)工程學(xué)報(bào);1998年02期
5 楊璐,高自友;用神經(jīng)網(wǎng)絡(luò)進(jìn)行變量選擇[J];北方交通大學(xué)學(xué)報(bào);1999年03期
6 趙進(jìn)文;模型構(gòu)建中變量選擇的影響分析[J];東北財(cái)經(jīng)大學(xué)學(xué)報(bào);2002年06期
7 李揚(yáng);朱建鋒;謝邦昌;;變量選擇方法及其在健康食品市場(chǎng)研究中的應(yīng)用探究[J];統(tǒng)計(jì)與信息論壇;2013年10期
8 齊曉麗;梁慧超;馮彥妍;;回歸模型構(gòu)建中變量選擇的研究[J];河北工業(yè)大學(xué)學(xué)報(bào);2009年06期
相關(guān)博士學(xué)位論文 前1條
1 岳明;基于隨機(jī)森林和規(guī)則集成法的酒類(lèi)市場(chǎng)預(yù)測(cè)與發(fā)展戰(zhàn)略[D];天津大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 韓燕龍;基于隨機(jī)森林的指數(shù)化投資組合構(gòu)建研究[D];華南理工大學(xué);2015年
2 馮盼峰;基于隨機(jī)森林兩階段逐步變量選擇算法的研究及應(yīng)用[D];福建農(nóng)林大學(xué);2016年
3 吳恒;基于LDA和隨機(jī)森林的活躍微博預(yù)測(cè)研究[D];合肥工業(yè)大學(xué);2017年
4 陳奕佳;基于隨機(jī)森林理論的北京市二手房估價(jià)模型研究[D];北京交通大學(xué);2015年
5 李麗;基于隨機(jī)森林算法的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)研究[D];西南財(cái)經(jīng)大學(xué);2012年
6 彭國(guó)蘭;隨機(jī)森林在企業(yè)信用評(píng)估中的應(yīng)用[D];廈門(mén)大學(xué);2007年
7 楊蘊(yùn)涵;多種分類(lèi)模型在個(gè)人信用評(píng)估中的應(yīng)用[D];重慶大學(xué);2015年
8 趙冬琦;基于變量選擇的股指期貨對(duì)股票市場(chǎng)影響的實(shí)證研究[D];蘭州大學(xué);2015年
9 溫征;縱向和生存數(shù)據(jù)聯(lián)合模型的一個(gè)變量選擇問(wèn)題[D];云南師范大學(xué);2016年
10 黃亞慧;偏t正態(tài)數(shù)據(jù)下基于最小一乘的回歸估計(jì)和變量選擇[D];重慶大學(xué);2016年
,本文編號(hào):1508366
本文鏈接:http://sikaile.net/jingjifazhanlunwen/1508366.html