基于生物信息學方法構建乳腺癌無肺轉移生存列線圖
發(fā)布時間:2023-05-25 00:16
乳腺癌是全球女性最常見的惡性疾病。隨著診療手段的不斷提高,原發(fā)性乳腺癌對患者的生命威脅已得到有效控制,相比之下,乳腺癌發(fā)生轉移則會導致患者死亡,且成為首要原因。經(jīng)研究發(fā)現(xiàn),乳腺腫瘤細胞有向特定器官轉移的傾向性,肺部是乳腺癌最常見的轉移部位之一。我們希望能通過有限的生物標志物來識別具有高度肺轉移風險的乳腺癌患者。經(jīng)過對GEO數(shù)據(jù)庫的全面檢索,我們得到了符合研究標準的兩個數(shù)據(jù)集:GSE5327和GSE2603。在訓練集GSE5327中,我們通過單基因log-rank檢驗初步篩選出與乳腺癌肺轉移相關的基因,并對這些基因進行GO生物功能和KEGG信號通路富集分析。通過一種穩(wěn)健的基于似然函數(shù)的生存分析建模方法,我們確定了用于構建乳腺癌無肺轉移生存列線圖的最佳基因。在模型構建完成之后,我們在訓練集GSE5327和驗證集GSE2603中分別對該預測列線圖的有效性進行了評估。通過初步的單因素生存分析,共有319個基因被認為與乳腺癌的肺轉移有關。同時,這些基因所富集的GO生物功能和KEGG信號通路也得到確認。通過rbsurv算法,我們選擇了其中6個最優(yōu)基因來構建乳腺癌無肺轉移生存列線圖:GOLGB1,T...
【文章頁數(shù)】:52 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 概述
1.2 乳腺癌
1.2.1 轉移性乳腺癌簡介
1.2.2 轉移性乳腺癌的精準治療
1.3 生物信息學
1.3.1 高通量測序技術
1.3.2 GEO數(shù)據(jù)庫(Gene Expression Omnibus)
1.3.3 生物信息學分析是篩選乳腺癌轉移相關基因的重要手段
1.4 信號通路的富集分析與WebGestalt
1.5 生存分析
1.5.1 生存曲線和log-rank檢驗
1.5.2 穩(wěn)健的基于似然比的生存分析建模方法
1.5.3 時間依賴的ROC曲線
第2章 材料與方法
2.1 從GEO數(shù)據(jù)庫獲取微陣列數(shù)據(jù)集
2.2 數(shù)據(jù)分析與方法
2.2.1 數(shù)據(jù)的預處理
2.2.2 初步篩選與乳腺癌肺轉移相關的基因
2.2.3 構建乳腺癌無肺轉移生存列線圖
2.2.4 對乳腺癌無肺轉移生存列線圖的內部驗證和外部驗證
2.2.5 對乳腺癌無肺轉移生存列線圖中基因的初步探索
第3章 結果
3.1 初步篩選與乳腺癌肺轉移有關的基因
3.2 確定最佳基因并構建乳腺癌無肺轉移生存列線圖
3.3 乳腺癌無肺轉移生存列線圖的內部驗證和外部驗證
3.4 對乳腺癌無肺轉移生存列線圖中基因的初步探索
第4章 討論
第5章 結論與展望
致謝
參考文獻
攻讀學位期間的研究成果
綜述
參考文獻
本文編號:3822561
【文章頁數(shù)】:52 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 概述
1.2 乳腺癌
1.2.1 轉移性乳腺癌簡介
1.2.2 轉移性乳腺癌的精準治療
1.3 生物信息學
1.3.1 高通量測序技術
1.3.2 GEO數(shù)據(jù)庫(Gene Expression Omnibus)
1.3.3 生物信息學分析是篩選乳腺癌轉移相關基因的重要手段
1.4 信號通路的富集分析與WebGestalt
1.5 生存分析
1.5.1 生存曲線和log-rank檢驗
1.5.2 穩(wěn)健的基于似然比的生存分析建模方法
1.5.3 時間依賴的ROC曲線
第2章 材料與方法
2.1 從GEO數(shù)據(jù)庫獲取微陣列數(shù)據(jù)集
2.2 數(shù)據(jù)分析與方法
2.2.1 數(shù)據(jù)的預處理
2.2.2 初步篩選與乳腺癌肺轉移相關的基因
2.2.3 構建乳腺癌無肺轉移生存列線圖
2.2.4 對乳腺癌無肺轉移生存列線圖的內部驗證和外部驗證
2.2.5 對乳腺癌無肺轉移生存列線圖中基因的初步探索
第3章 結果
3.1 初步篩選與乳腺癌肺轉移有關的基因
3.2 確定最佳基因并構建乳腺癌無肺轉移生存列線圖
3.3 乳腺癌無肺轉移生存列線圖的內部驗證和外部驗證
3.4 對乳腺癌無肺轉移生存列線圖中基因的初步探索
第4章 討論
第5章 結論與展望
致謝
參考文獻
攻讀學位期間的研究成果
綜述
參考文獻
本文編號:3822561
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3822561.html
最近更新
教材專著