一種結(jié)合隨機(jī)森林和鄰域粗糙集的特征選擇方法
發(fā)布時(shí)間:2018-01-13 03:16
本文關(guān)鍵詞:一種結(jié)合隨機(jī)森林和鄰域粗糙集的特征選擇方法 出處:《小型微型計(jì)算機(jī)系統(tǒng)》2017年06期 論文類型:期刊論文
更多相關(guān)文章: 腫瘤基因數(shù)據(jù) 隨機(jī)森林特征封裝 Relief算法 鄰域粗糙集 特征選擇
【摘要】:針對(duì)腫瘤基因數(shù)據(jù)具有高維小樣本的特性,為了提高傳統(tǒng)基因分類方法的正確率,提出一種結(jié)合隨機(jī)森林和鄰域粗糙集的特征基因選擇方法(Random Forest and Neighborhood Rough Set,RFNRS).該方法首先利用Relief算法,對(duì)原始的腫瘤基因數(shù)據(jù)進(jìn)行權(quán)重選擇,去除權(quán)重較低的特征子集;接著引入基于隨機(jī)森林的封裝式特征選擇算法(Random Forest Wrapper Feature Select,RFWFS),以模型準(zhǔn)確率作為評(píng)判準(zhǔn)則,篩選特征子集;然后引入鄰域粗糙集針對(duì)連續(xù)性的特征子集進(jìn)行尋優(yōu)處理;最后利用多個(gè)經(jīng)典分類算法處理特征子集.經(jīng)實(shí)驗(yàn)結(jié)果表明,該方法不僅在腫瘤基因特征子集的選擇上具有良好的性能,同時(shí)在算法的分類性能上也有所提高.
[Abstract]:In order to improve the accuracy of traditional gene classification methods, tumor gene data have the characteristics of high dimension and small sample. In this paper, a method of feature gene selection based on random Forest and Neighborhood Rough Set combined with random forest and neighborhood rough sets is proposed. Firstly, the Relief algorithm is used to select the weight of the original tumor gene data to remove the feature subset with lower weight. Then the random Forest Wrapper Feature selection algorithm based on random forest is introduced. The accuracy of the model is used as the criterion to select the feature subset. Then the neighborhood rough set is introduced to optimize the feature subset of continuity. Finally, several classical classification algorithms are used to deal with feature subsets. The experimental results show that this method not only has good performance in the selection of tumor gene feature subset, but also improves the classification performance of the algorithm.
【作者單位】: 蘭州交通大學(xué)電子與信息工程學(xué)院;
【基金】:國家自然科學(xué)基金項(xiàng)目(61163010)資助 甘肅省自然科學(xué)基金項(xiàng)目(1308RJZA111)資助 蘭州市科技計(jì)劃項(xiàng)目(2015-2-99)資助
【分類號(hào)】:R73;TP18
【正文快照】: 1引言隨著基因信息技術(shù)的飛速發(fā)展,基因數(shù)據(jù)[1-2]的獲取也變得越來越容易和方便,基因數(shù)據(jù)為探索生物的發(fā)病原因和為提高醫(yī)療臨床診斷效率提供良好的診斷依據(jù),如何利用有效手段分析高維、小樣本的基因數(shù)據(jù)是目前研究的熱點(diǎn).基因數(shù)據(jù)本身所具有的高維性、小樣本性、噪屬性高、冗
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 劉永春;宋弘;;基于隨機(jī)森林的乳腺腫瘤診斷研究[J];電視技術(shù);2014年15期
相關(guān)碩士學(xué)位論文 前2條
1 蔣雪晴;基于隨機(jī)森林和BSS特征的PET-CT肺腫瘤分割[D];蘇州大學(xué);2016年
2 陳巖;基于有監(jiān)督奇異值分解和類隨機(jī)森林決策方法的腫瘤特征基因篩選研究[D];杭州電子科技大學(xué);2009年
,本文編號(hào):1417223
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1417223.html
最近更新
教材專著