基于遺傳算法的隨機森林模型在特征基因篩選中的應用
本文關(guān)鍵詞:基于遺傳算法的隨機森林模型在特征基因篩選中的應用
更多相關(guān)文章: 隨機森林 遺傳算法 特征基因篩選
【摘要】:目的探索基于遺傳算法的隨機森林模型在特征基因篩選中的效果和特點。方法通過本文構(gòu)建的基于遺傳算法的隨機森林模型(GARF)對真實基因數(shù)據(jù)和模擬數(shù)據(jù)進行特征基因篩選,以篩選后基因進行判別分析,計算ROC曲線下面積AUC值,同時觀察GARF方法對模擬實驗中預設的差異基因排序結(jié)果。結(jié)果對真實基因數(shù)據(jù)和模擬數(shù)據(jù)的分析結(jié)果均顯示,采用GARF方法篩選得到的特征基因建立判別模型能獲得更好的分類效果,在模擬實驗中與隨機森林相比能將預設的差異基因排在更靠前的位置。結(jié)論 GARF方法能夠有效地用于基因芯片數(shù)據(jù)特征基因篩選,在FDR控制上具備潛力,具有研究價值。
【作者單位】: 杭州師范大學醫(yī)學院健康管理系;山東大學公共衛(wèi)生學院生物統(tǒng)計學系;哈爾濱醫(yī)科大學衛(wèi)生統(tǒng)計學教研室;
【關(guān)鍵詞】: 隨機森林 遺傳算法 特征基因篩選
【基金】:浙江省自然科學基金項目(LQ12H26002) 杭州師范大學科研啟動基金項目(2011QDL12)
【分類號】:Q811.4
【正文快照】: 特征基因篩選是基因組學研究的主要目的之一,不僅要求能夠通過篩選到的特征變量對樣本進行有效分類,而且要保證篩選得到的特征變量集有較小的假發(fā)現(xiàn)率(false discovery rate,FDR),否則將極大增加生物學驗證的工作量,浪費大量資源,甚至無法實現(xiàn)生物學驗證。近年來,隨機森林(ran
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 方正;李益洲;肖嘉敏;李功兵;文志寧;李夢龍;;基于復雜網(wǎng)絡的隨機森林算法預測氨基酸突變對蛋白質(zhì)穩(wěn)定性的影響(英文)[J];化學研究與應用;2011年05期
2 張光亞;方柏山;;基于氨基酸組成分布的嗜熱和嗜冷蛋白隨機森林分類模型[J];生物工程學報;2008年02期
3 來海鋒;韓斌;厲力華;陳巖;祝磊;代琦;;基于集成類隨機森林方法的神經(jīng)膠質(zhì)瘤特征基因選擇的研究[J];生物物理學報;2010年09期
4 郭穎婕;劉曉燕;郭茂祖;鄒權(quán);;植物抗性基因識別中的隨機森林分類方法[J];計算機科學與探索;2012年01期
5 王瑩;;用隨機森林算法預測六類酶的亞類[J];陰山學刊(自然科學版);2014年02期
6 金宇;周可新;方穎;劉欣;;基于隨機森林模型預估氣候變化對動物物種潛在生境的影響[J];生態(tài)與農(nóng)村環(huán)境學報;2014年04期
7 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機)化學學術(shù)會議論文摘要集[C];2009年
中國碩士學位論文全文數(shù)據(jù)庫 前6條
1 白楊;基于隨機森林的外顯子剪接增強子識別[D];哈爾濱工業(yè)大學;2010年
2 郭穎婕;基于隨機森林的植物抗性基因識別方法研究[D];哈爾濱工業(yè)大學;2011年
3 姚俊杰;基于隨機森林的致病SNPs檢測方法研究[D];湖南大學;2012年
4 李強;基于多視角特征融合與隨機森林的蛋白質(zhì)結(jié)晶預測[D];南京理工大學;2015年
5 黎成;基于隨機森林和ReliefF的致病SNP識別方法[D];西安電子科技大學;2014年
6 王星支;核受體蛋白、生物熒光蛋白的預測算法研究[D];內(nèi)蒙古農(nóng)業(yè)大學;2015年
,本文編號:917578
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/917578.html