天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于新型不純度度量的代價敏感隨機(jī)森林分類器

發(fā)布時間:2018-03-21 09:08

  本文選題:代價敏感學(xué)習(xí) 切入點(diǎn):隨機(jī)森林 出處:《計(jì)算機(jī)科學(xué)》2017年S2期  論文類型:期刊論文


【摘要】:針對不平衡數(shù)據(jù)集的有效分類問題,提出一種結(jié)合代價敏感學(xué)習(xí)和隨機(jī)森林算法的分類器。首先提出了一種新型不純度度量,該度量不僅考慮了決策樹的總代價,還考慮了同一節(jié)點(diǎn)對于不同樣本的代價差異;其次,執(zhí)行隨機(jī)森林算法,對數(shù)據(jù)集作K次抽樣,構(gòu)建K個基礎(chǔ)分類器;然后,基于提出的不純度度量,通過分類回歸樹(CART)算法來構(gòu)建決策樹,從而形成決策樹森林;最后,隨機(jī)森林通過投票機(jī)制做出數(shù)據(jù)分類決策。在UCI數(shù)據(jù)庫上進(jìn)行實(shí)驗(yàn),與傳統(tǒng)隨機(jī)森林和現(xiàn)有的代價敏感隨機(jī)森林分類器相比,該分類器在分類精度、AUC面積和Kappa系數(shù)這3種性能度量上都具有良好的表現(xiàn)。
[Abstract]:For the efficient classification of unbalanced datasets, a classifier combining cost sensitive learning and stochastic forest algorithm is proposed. Firstly, a new measure of impureness is proposed, which not only considers the total cost of decision tree, but also considers the total cost of the decision tree. The cost difference of the same node for different samples is also considered. Secondly, the random forest algorithm is implemented to sample the data set for K times, and K basic classifier is constructed. Then, based on the proposed measurement of impurity, The decision tree is constructed by the classification and regression tree (CARTT) algorithm, and the decision tree forest is formed. Finally, the random forest makes the data classification decision through the voting mechanism. The experiment is carried out on the UCI database. Compared with the traditional stochastic forest classifier and the existing cost sensitive stochastic forest classifier, the proposed classifier has a good performance in terms of classification accuracy, AUC area and Kappa coefficient.
【作者單位】: 西南石油大學(xué)計(jì)算機(jī)科學(xué)學(xué)院;
【分類號】:TP181

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王象剛;;基于K均值隨機(jī)森林快速算法及入侵檢測中的應(yīng)用[J];科技通報;2013年08期

2 張華偉;王明文;甘麗新;;基于隨機(jī)森林的文本分類模型研究[J];山東大學(xué)學(xué)報(理學(xué)版);2006年03期

3 邱一卉;林成德;;基于隨機(jī)森林方法的異常樣本檢測方法[J];福建工程學(xué)院學(xué)報;2007年04期

4 馬昕;王雪;楊洋;;基于隨機(jī)森林算法的大學(xué)生異動情況的預(yù)測[J];江蘇科技大學(xué)學(xué)報(自然科學(xué)版);2012年01期

5 楊帆;林琛;周綺鳳;符長虹;羅林開;;基于隨機(jī)森林的潛在k近鄰算法及其在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用[J];系統(tǒng)工程理論與實(shí)踐;2012年04期

6 聶斌;王卓;杜建強(qiáng);朱明峰;林劍鳴;艾國平;熊玲珠;;基于粗糙集和隨機(jī)森林算法輔助糖尿病并發(fā)癥分類研究[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2014年03期

7 郭穎婕;劉曉燕;郭茂祖;鄒權(quán);;植物抗性基因識別中的隨機(jī)森林分類方法[J];計(jì)算機(jī)科學(xué)與探索;2012年01期

8 邱一卉;林成德;;基于隨機(jī)森林和單類支持向量機(jī)的電信行業(yè)客戶流失預(yù)測[J];廈門大學(xué)學(xué)報(自然科學(xué)版);2013年05期

9 于化龍;高尚;趙靖;秦斌;;基于過采樣技術(shù)和隨機(jī)森林的不平衡微陣列數(shù)據(jù)分類方法研究[J];計(jì)算機(jī)科學(xué);2012年05期

10 姚登舉;楊靜;詹曉娟;;基于隨機(jī)森林的特征選擇算法[J];吉林大學(xué)學(xué)報(工學(xué)版);2014年01期

相關(guān)會議論文 前10條

1 謝秋玲;;應(yīng)用于心電圖分類的KNN-SVM分類器研究[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年

2 李蘭春;王雙成;杜瑞杰;;認(rèn)知結(jié)構(gòu)評估的動態(tài)貝葉斯網(wǎng)絡(luò)分類器方法[A];2011年中國智能自動化學(xué)術(shù)會議論文集(第一分冊)[C];2011年

3 邵小健;段華;賀國平;;一種改進(jìn)的最少核分類器[A];中國運(yùn)籌學(xué)會第七屆學(xué)術(shù)交流會論文集(上卷)[C];2004年

4 付煥煥;李俊;張潔;;入侵檢測中機(jī)器學(xué)習(xí)算法的集成[A];中國電子學(xué)會第十七屆信息論學(xué)術(shù)年會論文集[C];2010年

5 寧可慶;汪家升;彭月祥;;用于多傳感器信息融合的人工神經(jīng)網(wǎng)絡(luò)故障分類器[A];第十七屆全國測控計(jì)量儀器儀表學(xué)術(shù)年會(MCMI'2007)論文集(下冊)[C];2007年

6 湯志康;談蔚欣;王偉智;;多分類器融合的交通狀態(tài)預(yù)測[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年

7 薛忠;李艷;謝維信;;一種改進(jìn)的模糊聯(lián)想分類器[A];信息科學(xué)與微電子技術(shù):中國科協(xié)第三屆青年學(xué)術(shù)年會論文集[C];1998年

8 王雙成;畢玉江;裴t(yī)q;;商品進(jìn)出口影響分析的動態(tài)貝葉斯網(wǎng)絡(luò)分類器方法[A];第十三屆中國管理科學(xué)學(xué)術(shù)年會論文集[C];2011年

9 趙鍇;黃應(yīng)清;蔣曉瑜;汪熙;;一種提高SVM分類器識別效率的特征選擇方法[A];第六屆全國信號和智能信息處理與應(yīng)用學(xué)術(shù)會議論文集[C];2012年

10 李陶深;韋艷艷;;一種改進(jìn)的基于投票的類向量方法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年

相關(guān)博士學(xué)位論文 前7條

1 張乾;基于隨機(jī)森林的視覺數(shù)據(jù)分類關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2016年

2 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年

3 張文博;多類別智能分類器方法研究[D];西安電子科技大學(xué);2014年

4 任亞峰;基于標(biāo)注和未標(biāo)注數(shù)椐的虛假評論識別研究[D];武漢大學(xué);2015年

5 嚴(yán)志永;在劃分?jǐn)?shù)據(jù)空間的視角下基于決策邊界的分類器研究[D];浙江大學(xué);2011年

6 孔志周;多分類器系統(tǒng)中信息融合方法研究[D];中南大學(xué);2011年

7 毛莎莎;基于貪婪優(yōu)化和投影變換的集成分類器算法研究[D];西安電子科技大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 朱琪;基于最大平衡度與最大共識的改進(jìn)隨機(jī)森林算法研究[D];吉林大學(xué);2016年

2 馬驪;隨機(jī)森林算法的優(yōu)化改進(jìn)研究[D];暨南大學(xué);2016年

3 程政;城市道路短時車流量預(yù)測模型研究[D];中國科學(xué)技術(shù)大學(xué);2016年

4 陳實(shí);基于隨機(jī)森林的神經(jīng)肽剪切位點(diǎn)預(yù)測方法研究[D];華中科技大學(xué);2015年

5 胡宗杰;基于極值隨機(jī)森林的慢性胃炎中醫(yī)問診證候分類研究[D];華東理工大學(xué);2017年

6 康雅文;基于隨機(jī)森林的醫(yī)療行業(yè)供應(yīng)商的等級評估模型[D];安徽大學(xué);2017年

7 郭振宇;基于約簡隨機(jī)森林的電影票房預(yù)測分析[D];天津大學(xué);2016年

8 李磊;隨機(jī)森林及數(shù)據(jù)可視化在棉蚜等級預(yù)測中的應(yīng)用研究[D];山東農(nóng)業(yè)大學(xué);2017年

9 牛志華;基于Spark分布式平臺的隨機(jī)森林分類算法研究[D];中國民航大學(xué);2017年

10 王日升;基于Spark的一種改進(jìn)的隨機(jī)森林算法研究[D];太原理工大學(xué);2017年

,

本文編號:1643180

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1643180.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶29a90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com