基于遺傳算法的隨機(jī)森林模型在特征基因篩選中的應(yīng)用
本文關(guān)鍵詞:基于遺傳算法的隨機(jī)森林模型在特征基因篩選中的應(yīng)用
更多相關(guān)文章: 隨機(jī)森林 遺傳算法 特征基因篩選
【摘要】:目的探索基于遺傳算法的隨機(jī)森林模型在特征基因篩選中的效果和特點(diǎn)。方法通過(guò)本文構(gòu)建的基于遺傳算法的隨機(jī)森林模型(GARF)對(duì)真實(shí)基因數(shù)據(jù)和模擬數(shù)據(jù)進(jìn)行特征基因篩選,以篩選后基因進(jìn)行判別分析,計(jì)算ROC曲線下面積AUC值,同時(shí)觀察GARF方法對(duì)模擬實(shí)驗(yàn)中預(yù)設(shè)的差異基因排序結(jié)果。結(jié)果對(duì)真實(shí)基因數(shù)據(jù)和模擬數(shù)據(jù)的分析結(jié)果均顯示,采用GARF方法篩選得到的特征基因建立判別模型能獲得更好的分類(lèi)效果,在模擬實(shí)驗(yàn)中與隨機(jī)森林相比能將預(yù)設(shè)的差異基因排在更靠前的位置。結(jié)論 GARF方法能夠有效地用于基因芯片數(shù)據(jù)特征基因篩選,在FDR控制上具備潛力,具有研究?jī)r(jià)值。
【作者單位】: 杭州師范大學(xué)醫(yī)學(xué)院健康管理系;山東大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)系;哈爾濱醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室;
【關(guān)鍵詞】: 隨機(jī)森林 遺傳算法 特征基因篩選
【基金】:浙江省自然科學(xué)基金項(xiàng)目(LQ12H26002) 杭州師范大學(xué)科研啟動(dòng)基金項(xiàng)目(2011QDL12)
【分類(lèi)號(hào)】:Q811.4
【正文快照】: 特征基因篩選是基因組學(xué)研究的主要目的之一,不僅要求能夠通過(guò)篩選到的特征變量對(duì)樣本進(jìn)行有效分類(lèi),而且要保證篩選得到的特征變量集有較小的假發(fā)現(xiàn)率(false discovery rate,FDR),否則將極大增加生物學(xué)驗(yàn)證的工作量,浪費(fèi)大量資源,甚至無(wú)法實(shí)現(xiàn)生物學(xué)驗(yàn)證。近年來(lái),隨機(jī)森林(ran
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 方正;李益洲;肖嘉敏;李功兵;文志寧;李夢(mèng)龍;;基于復(fù)雜網(wǎng)絡(luò)的隨機(jī)森林算法預(yù)測(cè)氨基酸突變對(duì)蛋白質(zhì)穩(wěn)定性的影響(英文)[J];化學(xué)研究與應(yīng)用;2011年05期
2 張光亞;方柏山;;基于氨基酸組成分布的嗜熱和嗜冷蛋白隨機(jī)森林分類(lèi)模型[J];生物工程學(xué)報(bào);2008年02期
3 來(lái)海鋒;韓斌;厲力華;陳巖;祝磊;代琦;;基于集成類(lèi)隨機(jī)森林方法的神經(jīng)膠質(zhì)瘤特征基因選擇的研究[J];生物物理學(xué)報(bào);2010年09期
4 郭穎婕;劉曉燕;郭茂祖;鄒權(quán);;植物抗性基因識(shí)別中的隨機(jī)森林分類(lèi)方法[J];計(jì)算機(jī)科學(xué)與探索;2012年01期
5 王瑩;;用隨機(jī)森林算法預(yù)測(cè)六類(lèi)酶的亞類(lèi)[J];陰山學(xué)刊(自然科學(xué)版);2014年02期
6 金宇;周可新;方穎;劉欣;;基于隨機(jī)森林模型預(yù)估氣候變化對(duì)動(dòng)物物種潛在生境的影響[J];生態(tài)與農(nóng)村環(huán)境學(xué)報(bào);2014年04期
7 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹(shù)的集合體和后向消除策略去分類(lèi)P-糖蛋白化合物[A];第十屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 白楊;基于隨機(jī)森林的外顯子剪接增強(qiáng)子識(shí)別[D];哈爾濱工業(yè)大學(xué);2010年
2 郭穎婕;基于隨機(jī)森林的植物抗性基因識(shí)別方法研究[D];哈爾濱工業(yè)大學(xué);2011年
3 姚俊杰;基于隨機(jī)森林的致病SNPs檢測(cè)方法研究[D];湖南大學(xué);2012年
4 李強(qiáng);基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測(cè)[D];南京理工大學(xué);2015年
5 黎成;基于隨機(jī)森林和ReliefF的致病SNP識(shí)別方法[D];西安電子科技大學(xué);2014年
6 王星支;核受體蛋白、生物熒光蛋白的預(yù)測(cè)算法研究[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2015年
,本文編號(hào):917578
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/917578.html