基于癌癥組學數(shù)據(jù)網(wǎng)絡分析的驅動基因識別算法研究
發(fā)布時間:2023-04-23 06:18
癌癥本質(zhì)上與基因變異有關,目前人們普遍認為,有一小部分發(fā)生變異的基因具有選擇生長優(yōu)勢,對癌癥發(fā)生發(fā)展過程有促進作用,一般稱之為驅動基因。大部分發(fā)生變異的基因對癌癥發(fā)生發(fā)展沒有促進作用,稱之為乘客基因。在眾多的乘客基因中識別驅動基因是癌癥研究的熱點問題。圍繞這一目標,很多驅動基因識別算法應運而生,特別地,鑒于基因之間存在相互作用關系,且從網(wǎng)絡角度可以更加系統(tǒng)地研究癌癥特點,因此,已有很多基于網(wǎng)絡的方法被用來挖掘癌癥驅動基因。但是仍然有很多特征對驅動基因識別有影響,例如基因長度對突變概率的影響、先驗知識的影響以及網(wǎng)絡拓撲結構特征的影響等。另外,除了對單一癌癥識別驅動基因外,有研究表明不同癌癥之間可能存在相同的特點和致病基因。本文針對上述問題開展了系統(tǒng)性研究,主要工作如下:(1)提出了一種基于基因長度校正突變概率的驅動基因識別算法LNDriver,本算法考慮了基因長度對基因突變概率的影響。對于體細胞突變數(shù)據(jù),通過廣義加性模型,根據(jù)突變基因長度,對其突變概率進行校正,從而過濾由于長度過長產(chǎn)生的假陽性基因。然后根據(jù)蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡,將篩選后的基因突變數(shù)據(jù)與表達數(shù)據(jù)整合并構建二分圖,最后...
【文章頁數(shù)】:115 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 引言
1.2 課題研究背景及意義
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 基于突變頻率的驅動突變/基因識別算法
1.3.2 基于功能影響的驅動突變/基因識別算法
1.3.3 基于結構基因組的驅動突變/基因識別算法
1.3.4 基于通路和網(wǎng)絡分析的驅動基因識別算法
1.3.5 驅動通路或驅動模塊識別算法
1.4 本文的研究內(nèi)容和安排
第二章 相關知識概述
2.1 引言
2.2 驅動基因與乘客基因
2.3 TCGA數(shù)據(jù)庫
2.4 多組學數(shù)據(jù)
2.4.1 基因組數(shù)據(jù)
2.4.2 轉錄組數(shù)據(jù)
2.4.3 蛋白質(zhì)組數(shù)據(jù)
2.5 復雜網(wǎng)絡
2.5.1 網(wǎng)絡的定義
2.5.2 網(wǎng)絡的表示方法
2.5.3 網(wǎng)絡的分類
2.5.4 網(wǎng)絡的一般屬性
2.5.5 網(wǎng)絡的中心性
2.6 本章小結
第三章 基于二分圖的驅動基因識別
3.1 引言
3.2 Driver Net算法
3.3 基于基因長度校正的癌癥驅動基因識別算法
3.3.1 算法流程
3.3.2 實驗數(shù)據(jù)
3.3.3 實驗結果
3.3.4 總結與討論
3.4 基于基因長度校正及共表達網(wǎng)絡的驅動基因識別算法
3.4.1 算法流程
3.4.2 實驗數(shù)據(jù)
3.4.3 實驗結果
3.4.4 總結與討論
3.5 本章小結
第四章 基于隨機游走算法的驅動基因識別
4.1 引言
4.2 隨機游走算法相關知識簡介
4.2.1 傳統(tǒng)隨機游走算法
4.2.2 重啟動隨機游走算法介紹
4.3 算法流程
4.3.1 癌癥相關網(wǎng)絡的構建
4.3.2 種子基因的選擇
4.3.3 網(wǎng)絡節(jié)點中心性計算
4.3.4 改進的隨機游走算法
4.4 實驗結果
4.4.1 實驗數(shù)據(jù)
4.4.2 對已知癌癥基因預測性能評估
4.4.3 轉移矩陣改進分析
4.4.4 種子節(jié)點選擇的分析
4.4.5 前10個候選驅動基因分析
4.5 本章小結
第五章 基于多層網(wǎng)絡的驅動基因識別
5.1 引言
5.2 傳統(tǒng)NMF算法簡介
5.3 算法流程
5.3.1 多層網(wǎng)絡的構建
5.3.2 Driver-MulJNMF算法介紹
5.3.3 算法評估
5.3.4 參數(shù)選擇
5.4 實驗結果
5.4.1 實驗數(shù)據(jù)
5.4.2 Hallmark富集分析及比較
5.4.3 文獻檢索分析
5.4.4 通路和功能富集分析
5.4.5 生存分析
5.5 本章小結
第六章 總結與展望
6.1 工作總結
6.2 研究展望
參考文獻
攻讀博士學位期間取得的研究成果
致謝
本文編號:3799268
【文章頁數(shù)】:115 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 引言
1.2 課題研究背景及意義
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 基于突變頻率的驅動突變/基因識別算法
1.3.2 基于功能影響的驅動突變/基因識別算法
1.3.3 基于結構基因組的驅動突變/基因識別算法
1.3.4 基于通路和網(wǎng)絡分析的驅動基因識別算法
1.3.5 驅動通路或驅動模塊識別算法
1.4 本文的研究內(nèi)容和安排
第二章 相關知識概述
2.1 引言
2.2 驅動基因與乘客基因
2.3 TCGA數(shù)據(jù)庫
2.4 多組學數(shù)據(jù)
2.4.1 基因組數(shù)據(jù)
2.4.2 轉錄組數(shù)據(jù)
2.4.3 蛋白質(zhì)組數(shù)據(jù)
2.5 復雜網(wǎng)絡
2.5.1 網(wǎng)絡的定義
2.5.2 網(wǎng)絡的表示方法
2.5.3 網(wǎng)絡的分類
2.5.4 網(wǎng)絡的一般屬性
2.5.5 網(wǎng)絡的中心性
2.6 本章小結
第三章 基于二分圖的驅動基因識別
3.1 引言
3.2 Driver Net算法
3.3 基于基因長度校正的癌癥驅動基因識別算法
3.3.1 算法流程
3.3.2 實驗數(shù)據(jù)
3.3.3 實驗結果
3.3.4 總結與討論
3.4 基于基因長度校正及共表達網(wǎng)絡的驅動基因識別算法
3.4.1 算法流程
3.4.2 實驗數(shù)據(jù)
3.4.3 實驗結果
3.4.4 總結與討論
3.5 本章小結
第四章 基于隨機游走算法的驅動基因識別
4.1 引言
4.2 隨機游走算法相關知識簡介
4.2.1 傳統(tǒng)隨機游走算法
4.2.2 重啟動隨機游走算法介紹
4.3 算法流程
4.3.1 癌癥相關網(wǎng)絡的構建
4.3.2 種子基因的選擇
4.3.3 網(wǎng)絡節(jié)點中心性計算
4.3.4 改進的隨機游走算法
4.4 實驗結果
4.4.1 實驗數(shù)據(jù)
4.4.2 對已知癌癥基因預測性能評估
4.4.3 轉移矩陣改進分析
4.4.4 種子節(jié)點選擇的分析
4.4.5 前10個候選驅動基因分析
4.5 本章小結
第五章 基于多層網(wǎng)絡的驅動基因識別
5.1 引言
5.2 傳統(tǒng)NMF算法簡介
5.3 算法流程
5.3.1 多層網(wǎng)絡的構建
5.3.2 Driver-MulJNMF算法介紹
5.3.3 算法評估
5.3.4 參數(shù)選擇
5.4 實驗結果
5.4.1 實驗數(shù)據(jù)
5.4.2 Hallmark富集分析及比較
5.4.3 文獻檢索分析
5.4.4 通路和功能富集分析
5.4.5 生存分析
5.5 本章小結
第六章 總結與展望
6.1 工作總結
6.2 研究展望
參考文獻
攻讀博士學位期間取得的研究成果
致謝
本文編號:3799268
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3799268.html
最近更新
教材專著