基于多元學(xué)生t分布的基因網(wǎng)絡(luò)擾動分析方法研究
發(fā)布時間:2024-04-10 03:32
推斷不同生物學(xué)條件下的基因網(wǎng)絡(luò)擾動對于理解復(fù)雜疾病的機制有著很重要的作用。通常,我們使用假設(shè)數(shù)據(jù)服從多元正態(tài)分布的高斯圖模型建模,來推斷基因網(wǎng)絡(luò)的擾動。但是,由于數(shù)據(jù)會受到極端異常值的影響,因此這個假設(shè)通常不符合實際情況。本文基于多元學(xué)生t分布,提出了一個更魯棒的差異圖模型來推斷不同條件下的基因網(wǎng)絡(luò)擾動。因為多元t分布有著重尾的性質(zhì),所以它比正態(tài)分布對異常值的魯棒性更強。同時,我們利用fused lasso懲罰來考慮不同條件之間網(wǎng)絡(luò)的相似性。本文利用期望極大化算法來求解這個優(yōu)化模型。模擬實驗的結(jié)果表明,我們的方法優(yōu)于對比的方法。將本文提出的方法應(yīng)用于乳腺癌的不同亞型和膠質(zhì)母細胞瘤的不同亞型中,推斷不同亞型之間的基因網(wǎng)絡(luò)擾動,發(fā)現(xiàn)了幾個驅(qū)動基因網(wǎng)絡(luò)擾動的關(guān)鍵基因。
【文章頁數(shù)】:43 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 引言
1.1 研究背景
1.2 研究現(xiàn)狀
1.3 本文的主要工作和創(chuàng)新點
1.4 本文的組織結(jié)構(gòu)
第二章 預(yù)備知識
2.1 高斯圖模型
2.2 多元t分布
2.3 極大似然估計
2.4 期望極大化算法
2.4.1 隱變量
2.4.2 期望極大化算法主要思想及步驟
第三章 模型的建立與求解
3.1 模型的提出
3.2 算法
3.3 調(diào)優(yōu)參數(shù)的選擇
第四章 實驗
4.1 模擬實驗
4.1.1 數(shù)據(jù)的生成
4.1.2 模擬實驗結(jié)果分析
4.2 真實數(shù)據(jù)分析
4.2.1 對乳腺癌數(shù)據(jù)的分析
4.2.2 對膠質(zhì)母細胞瘤數(shù)據(jù)的分析
第五章 總結(jié)與展望
參考文獻
致謝
本文編號:3950079
【文章頁數(shù)】:43 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 引言
1.1 研究背景
1.2 研究現(xiàn)狀
1.3 本文的主要工作和創(chuàng)新點
1.4 本文的組織結(jié)構(gòu)
第二章 預(yù)備知識
2.1 高斯圖模型
2.2 多元t分布
2.3 極大似然估計
2.4 期望極大化算法
2.4.1 隱變量
2.4.2 期望極大化算法主要思想及步驟
第三章 模型的建立與求解
3.1 模型的提出
3.2 算法
3.3 調(diào)優(yōu)參數(shù)的選擇
第四章 實驗
4.1 模擬實驗
4.1.1 數(shù)據(jù)的生成
4.1.2 模擬實驗結(jié)果分析
4.2 真實數(shù)據(jù)分析
4.2.1 對乳腺癌數(shù)據(jù)的分析
4.2.2 對膠質(zhì)母細胞瘤數(shù)據(jù)的分析
第五章 總結(jié)與展望
參考文獻
致謝
本文編號:3950079
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3950079.html
最近更新
教材專著