基于改進(jìn)的隨機(jī)森林算法的結(jié)核病易感基因挑選研究
發(fā)布時(shí)間:2023-03-04 03:35
本文旨在改進(jìn)隨機(jī)森林算法來(lái)篩選特征基因,希望找出較少的差異基因從而有助于病情的分析,但是人類(lèi)的基因數(shù)量龐大,想要針對(duì)某一疾病快速找出差異基因是一件不容易的事情。隨機(jī)森林可以計(jì)算出每個(gè)特征基因?qū)Ψ诸?lèi)的重要性,而且也適用于處理大量數(shù)據(jù),所以研究使用隨機(jī)森林算法對(duì)特征基因進(jìn)行篩選。隨機(jī)森林在建立決策樹(shù)時(shí)對(duì)樣本和特征選擇具有隨機(jī)性,其計(jì)算出的特征重要性會(huì)受到噪聲的影響,甚至可能出現(xiàn)比較重要的特征基因被噪聲淹沒(méi)的現(xiàn)象。為了減少噪聲對(duì)篩選結(jié)果的不良影響,根據(jù)隨機(jī)森林結(jié)合多元統(tǒng)計(jì)中的向后剔除法思想的基礎(chǔ)上再改進(jìn)算法,將原改進(jìn)中沒(méi)有標(biāo)準(zhǔn)的參數(shù)進(jìn)一步的標(biāo)準(zhǔn)化。主要通過(guò)結(jié)合K折交叉驗(yàn)證和隨機(jī)森林模型的建立,每一次產(chǎn)生新的訓(xùn)練樣本都會(huì)建立隨機(jī)森林模型,并計(jì)算其準(zhǔn)確率,在這過(guò)程中引入誤差增量作為閾值,利用該閾值來(lái)判斷是否停止交叉驗(yàn)證建立隨機(jī)森林模型。若誤差增量超過(guò)指定參數(shù)則停止迭代,選擇準(zhǔn)確率最高的隨機(jī)森林模型來(lái)計(jì)算基因重要性,將基因的重要性值從大到小依次排列,然后剔除末尾一定比例的特征基因,剩下的基因數(shù)據(jù)重復(fù)以上步驟進(jìn)行K折交叉驗(yàn)證建立隨機(jī)森林模型,一直循環(huán)重復(fù)篩選直到剩下所需的特征基因數(shù)量。為了對(duì)比改進(jìn)隨...
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容及組織結(jié)構(gòu)安排
1.4 本文的創(chuàng)新點(diǎn)
第2章 基因數(shù)據(jù)挑選理論基礎(chǔ)介紹
2.1 基因數(shù)據(jù)介紹
2.2 特征篩選
2.3 隨機(jī)森林
2.4 支持向量機(jī)
2.5 本章小結(jié)
第3章 實(shí)證分析
3.1 實(shí)證背景和數(shù)據(jù)來(lái)源簡(jiǎn)介
3.2 改進(jìn)隨機(jī)森林算法理論
3.3 數(shù)據(jù)預(yù)處理
3.4 實(shí)證過(guò)程
3.5 實(shí)證結(jié)果對(duì)比分析
3.6 實(shí)證結(jié)論
第4章 總結(jié)與展望
4.1 總結(jié)
4.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果
致謝
本文編號(hào):3753648
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容及組織結(jié)構(gòu)安排
1.4 本文的創(chuàng)新點(diǎn)
第2章 基因數(shù)據(jù)挑選理論基礎(chǔ)介紹
2.1 基因數(shù)據(jù)介紹
2.2 特征篩選
2.3 隨機(jī)森林
2.4 支持向量機(jī)
2.5 本章小結(jié)
第3章 實(shí)證分析
3.1 實(shí)證背景和數(shù)據(jù)來(lái)源簡(jiǎn)介
3.2 改進(jìn)隨機(jī)森林算法理論
3.3 數(shù)據(jù)預(yù)處理
3.4 實(shí)證過(guò)程
3.5 實(shí)證結(jié)果對(duì)比分析
3.6 實(shí)證結(jié)論
第4章 總結(jié)與展望
4.1 總結(jié)
4.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果
致謝
本文編號(hào):3753648
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/3753648.html
最近更新
教材專(zhuān)著