基于Bagging Dtrace模型的基因差異網(wǎng)絡分析
發(fā)布時間:2020-12-26 01:33
不同病理狀態(tài)下的基因調(diào)控網(wǎng)絡模式發(fā)生改變,表明其對應的基因連接關系已改變。本文嘗試尋找那些連接關系改變的關鍵基因,以區(qū)分不同亞型的癌癥。從研究歷史文獻發(fā)現(xiàn),通常采用直接法和間接法來估計差異網(wǎng)絡。當考慮到時間花度和預測精度時,我們一般選擇直接估計法。由于樣本數(shù)據(jù)較少,因而,這些差異網(wǎng)絡估計法可能未能充分的利用其樣本信息。基于此,文本提出采用Bagging算法集成直接估計法來估計差異網(wǎng)絡,通過有放回的采樣,增加了數(shù)據(jù)的多樣性以及對數(shù)據(jù)的充分利用。在模擬數(shù)據(jù)上,將本文提出的模型與Dtrace模型進行對比分析,模擬實驗結(jié)果顯示本文提出的模型比Dtrace模型效果更優(yōu)。在真實數(shù)據(jù)集分析,將我們的方法應用到不同亞型乳腺癌基因表達數(shù)據(jù)的分析上,采用穩(wěn)定性選擇算法選擇調(diào)優(yōu)參數(shù),最后模型確定了5個關鍵基因。通過調(diào)查研究文獻發(fā)現(xiàn),本文找到的5個關鍵基因?qū)^(qū)分不同亞型的乳腺癌有非常重要的作用。
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:33 頁
【學位級別】:碩士
【部分圖文】:
圖1:對差異網(wǎng)絡的間接估計與直接估計,間接估計是分別計算兩個差異網(wǎng)絡,再來計算最后差??異網(wǎng)絡;直接估計是直接計算得到一個差異網(wǎng)絡??
選擇變量方面的效果較差。而Lasso的提出,則克服了以上方法的不足。??Lasso是通過加入對各系數(shù)的A范數(shù)懲罰,使系數(shù)向量產(chǎn)生稀疏,從而達到??變量選擇的作用。通過圖形直觀理解見圖2丨17],用紅色環(huán)線表示目標最小二乘函??5??
在數(shù)據(jù)推動下,本文將不同病理狀態(tài)下的基因表達數(shù)據(jù)與靜態(tài)基因調(diào)控網(wǎng)絡??數(shù)據(jù)有機結(jié)合,構建了新的差異網(wǎng)絡分析模型一一應用Bagging?Dtrace模型推斷??基因差異網(wǎng)絡,模型結(jié)構見圖3。本章將詳細介紹Bagging算法應用到差異網(wǎng)絡推??斷以及參數(shù)選擇中,本文的算法的整體框架如算法3所示:??12??
本文編號:2938775
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:33 頁
【學位級別】:碩士
【部分圖文】:
圖1:對差異網(wǎng)絡的間接估計與直接估計,間接估計是分別計算兩個差異網(wǎng)絡,再來計算最后差??異網(wǎng)絡;直接估計是直接計算得到一個差異網(wǎng)絡??
選擇變量方面的效果較差。而Lasso的提出,則克服了以上方法的不足。??Lasso是通過加入對各系數(shù)的A范數(shù)懲罰,使系數(shù)向量產(chǎn)生稀疏,從而達到??變量選擇的作用。通過圖形直觀理解見圖2丨17],用紅色環(huán)線表示目標最小二乘函??5??
在數(shù)據(jù)推動下,本文將不同病理狀態(tài)下的基因表達數(shù)據(jù)與靜態(tài)基因調(diào)控網(wǎng)絡??數(shù)據(jù)有機結(jié)合,構建了新的差異網(wǎng)絡分析模型一一應用Bagging?Dtrace模型推斷??基因差異網(wǎng)絡,模型結(jié)構見圖3。本章將詳細介紹Bagging算法應用到差異網(wǎng)絡推??斷以及參數(shù)選擇中,本文的算法的整體框架如算法3所示:??12??
本文編號:2938775
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2938775.html
最近更新
教材專著