基于邊緣函數(shù)的修剪隨機(jī)森林算法
本文關(guān)鍵詞: 隨機(jī)森林 修剪 樣本的邊緣函數(shù) 嵌套子森林 -se法則 出處:《統(tǒng)計與決策》2017年07期 論文類型:期刊論文
【摘要】:對隨機(jī)森林做修剪的目的就是要把隨機(jī)森林中重要的分類器找到,使得修剪后得到的子森林不僅具有可解釋性,而且能充分利用數(shù)據(jù)的信息量。文章提出一種新的修剪隨機(jī)森林方法,基于樣本的邊緣函數(shù),采用逐步向后算法,得到嵌套子森林,采用1-se法則挑選最優(yōu)子森林。在兩份實際數(shù)據(jù)中和已有隨機(jī)森林的修剪方法做了對比,結(jié)果表明,所提出的方法,在修剪后子森林預(yù)測率的分布和子森林中分類器個數(shù)的分布,以及選出的解釋變量三個指標(biāo)上均具有優(yōu)勢。
[Abstract]:The purpose of pruning random forest is to find the important classifier in random forest, so that the pruned sub-forest is not only interpretable. This paper presents a new pruning random forest method, which is based on the edge function of the sample, and uses step by step backward algorithm to obtain the nested sub-forest. The 1-se rule is used to select the optimal sub-forest. The results show that the proposed method is compared with the pruning method of the existing random forest in two actual data. After pruning, the distribution of prediction rate and the number of classifiers in the sub-forest, as well as the selected explanatory variables, all have advantages.
【作者單位】: 廣州科技貿(mào)易職業(yè)學(xué)院公教部;
【分類號】:O211.6
【正文快照】: 0引言隨機(jī)森林是基于決策樹的分類器集成算法,自2001年Leo Breiman提出隨機(jī)森林[1]算法以來,它在分類和預(yù)測方面顯示出強(qiáng)大的優(yōu)勢,并被廣泛應(yīng)用到生物、地理、生態(tài)、全基因組關(guān)聯(lián)性研究等領(lǐng)域[2-6]。目前研究修剪隨機(jī)森林的文獻(xiàn)可分為兩類,一類是在隨機(jī)森林生成之后,對它做修
【相似文獻(xiàn)】
相關(guān)會議論文 前7條
1 謝程利;王金橋;盧漢清;;核森林及其在目標(biāo)檢測中的應(yīng)用[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年
2 武曉巖;方慶偉;;基因表達(dá)數(shù)據(jù)分析的隨機(jī)森林方法及算法改進(jìn)[A];黑龍江省第十次統(tǒng)計科學(xué)討論會論文集[C];2008年
3 張?zhí)忑?梁龍;王康;李華;;隨機(jī)森林結(jié)合激光誘導(dǎo)擊穿光譜技術(shù)用于的鋼鐵分類[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年
4 相玉紅;張卓勇;;組蛋白去乙;敢种苿┑臉(gòu)效關(guān)系研究[A];第十一屆全國計算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2011年
5 張濤;李貞子;武曉巖;李康;;隨機(jī)森林回歸分析方法及在代謝組學(xué)中的應(yīng)用[A];2011年中國衛(wèi)生統(tǒng)計學(xué)年會會議論文集[C];2011年
6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機(jī)森林和k-近鄰法在某型坦克變速箱狀態(tài)識別中的應(yīng)用[A];第八屆全國轉(zhuǎn)子動力學(xué)學(xué)術(shù)討論會論文集[C];2008年
7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2009年
相關(guān)博士學(xué)位論文 前5條
1 張乾;基于隨機(jī)森林的視覺數(shù)據(jù)分類關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2016年
2 曹正鳳;隨機(jī)森林算法優(yōu)化研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年
3 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年
4 岳明;基于隨機(jī)森林和規(guī)則集成法的酒類市場預(yù)測與發(fā)展戰(zhàn)略[D];天津大學(xué);2008年
5 李書艷;單點氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預(yù)測及其機(jī)制研究[D];蘭州大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 錢維;藥品不良反應(yīng)監(jiān)測中隨機(jī)森林方法的建立與實現(xiàn)[D];第二軍醫(yī)大學(xué);2012年
2 韓燕龍;基于隨機(jī)森林的指數(shù)化投資組合構(gòu)建研究[D];華南理工大學(xué);2015年
3 賀捷;隨機(jī)森林在文本分類中的應(yīng)用[D];華南理工大學(xué);2015年
4 張文婷;交通環(huán)境下基于改進(jìn)霍夫森林的目標(biāo)檢測與跟蹤[D];華南理工大學(xué);2015年
5 李強(qiáng);基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測[D];南京理工大學(xué);2015年
6 朱玟謙;一種收斂性隨機(jī)森林在人臉檢測中的應(yīng)用研究[D];武漢理工大學(xué);2015年
7 肖宇;基于序列圖像的手勢檢測與識別算法研究[D];電子科技大學(xué);2014年
8 李慧;一種改進(jìn)的隨機(jī)森林并行分類方法在運營商大數(shù)據(jù)的應(yīng)用[D];電子科技大學(xué);2015年
9 趙亞紅;面向多類標(biāo)分類的隨機(jī)森林算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 黎成;基于隨機(jī)森林和ReliefF的致病SNP識別方法[D];西安電子科技大學(xué);2014年
,本文編號:1490131
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1490131.html