胃癌遺傳風險預測模型及多組學生存預測模型構(gòu)建
發(fā)布時間:2018-02-12 21:15
本文關(guān)鍵詞: 胃癌 SNP GRS 遺傳風險 預測模型 胃癌 組學數(shù)據(jù) 降維 生存分析 預測模型 出處:《南京醫(yī)科大學》2017年碩士論文 論文類型:學位論文
【摘要】:胃癌是常見的消化系統(tǒng)腫瘤之一。我國是胃癌的高發(fā)地區(qū),其發(fā)病率及死亡率均占所有惡性腫瘤的第二位,給我國帶來嚴重的疾病負擔。由于胃癌早期發(fā)現(xiàn)較為困難,大量患者診斷時已是晚期,即使對其進行以姑息手術(shù)為主的綜合治療,多數(shù)患者依然會出現(xiàn)復發(fā)或轉(zhuǎn)移,預后較差。而對于早期的胃癌患者,可以施行根治性手術(shù)切除為主的治療方法,且預后良好。因此,胃癌的早期發(fā)現(xiàn)和早期診斷對于提高患者的預后狀況意義重大。建立胃癌風險預測模型,對胃癌高危人群輔以常規(guī)胃鏡檢查等方法,以實現(xiàn)對胃癌的早發(fā)現(xiàn)和早診斷,將大大改善胃癌患者的預后。與此同時,對于胃癌患者建立胃癌預后評估模型,從而指導臨床治療方案,也將利于提高胃癌患者的預后,有效改善胃癌患者的生活質(zhì)量。胃癌的發(fā)生發(fā)展是一個多因素、多階段的生物學過程,遺傳因素在胃癌的發(fā)病機制中起到了至關(guān)重要的作用。目前,基于全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS)等方法已經(jīng)發(fā)現(xiàn)數(shù)十個與胃癌易感性相關(guān)的單核苷酸多態(tài)性位點(single-nucleotide polymorphism,SNP);谖赴┻z傳易感性的研究成果,建立胃癌遺傳風險預測模型,對于篩查胃癌高危人群,實現(xiàn)胃癌患者的早診早治,改善胃癌患者的總體生存情況有著非常重要的意義。胃癌患者的預后是影響患者生存質(zhì)量及醫(yī)生選擇治療方案的重要依據(jù)。目前在臨床實踐中,應(yīng)用臨床指標對腫瘤患者預后進行預測已經(jīng)很普遍,而高維分子學指標的應(yīng)用卻很少。聯(lián)合使用臨床指標與分子學指標將有效提高預測模型的適用性和準確性。本研究將基于現(xiàn)有的胃癌遺傳易感性位點,采用不同的方法,嘗試建立胃癌遺傳風險預測模型;同時,聯(lián)合臨床變量及多組學數(shù)據(jù),采用不同的策略,進行胃癌多組學的生存分析,為胃癌預后判斷提供參考。第一部分基于全基因組關(guān)聯(lián)研究(GWAS)的胃癌遺傳風險預測模型構(gòu)建背景:胃癌是我國消化系統(tǒng)第一大腫瘤,嚴重威脅著人民的生命健康。對于早期的胃癌患者,可以施行根治性手術(shù)切除為主的治療方法,且預后良好。而對于中晚期胃癌患者,多數(shù)患者無法手術(shù)或只能采用姑息手術(shù),并聯(lián)合化學治療和放射治療,預后較差。胃癌起病隱匿,待患者出現(xiàn)臨床癥狀時多數(shù)已發(fā)展為中晚期。近年來,盡管胃癌的治療有了長足的進步,但胃癌的早期診斷仍然不如人意。根據(jù)胃癌遺傳易感性位點,建立胃癌風險預測模型,對于篩查胃癌高危人群,實現(xiàn)胃癌的早診早治,改善胃癌患者預后及提高生存質(zhì)量有著重要的意義。方法:采用病例-對照的研究方法,結(jié)合既往報道的胃癌易感性SNPs位點,使用中國人群 dbGaP(the Database of Genotypes and Phenotypes)胃癌 GWAS 數(shù)據(jù),采用 sGRS(simple genetic risk score)、wGRS(weighted genetic risk score)、1GRS(Lasso genetic risk score)和 dGRS(doubly weighted genetic risk score)四種遺傳風險評分方法,建立胃癌風險預測模型,并在本課題組胃癌GWAS數(shù)據(jù)中對模型預測效果進行了外部獨立樣本的驗證。使用AUC(area under the curve)、凈重分類指數(shù)(netreclassification improvement,NRI)和整體鑒別指數(shù)(integrated discrimination improvement,IDI)對模型預測效果進行評估。結(jié)果:分別以四種模型中遺傳風險評分最低的一組為參比組,sGRS≥12組,相對危險度為5.32;wGRSP75組,相對危險度為3.28;1GRSP75組,相對危險度為3.51;dGRSP75組,相對危險度為3.71,差異均有統(tǒng)計學意義。四種模型中,dGRS 模型具有最大的 AUC(0.647,95%CI:0.629-0.666),且 NRI 和 IDI較其他模型均有提高。該結(jié)果在本課題組驗證數(shù)據(jù)中得到驗證。結(jié)論:四種遺傳風險預測模型對胃癌患者均有一定的區(qū)分力,且dGRS模型對胃癌遺傳風險具有最優(yōu)的預測效果。第二部分基于多組學的胃癌生存預測模型構(gòu)建背景:具有相同臨床及組織病理學特征的胃癌患者其預后可能存在很大差別,提示胃癌患者可能有很多的未知的信息隱藏在分子學指標當中,如:遺傳變異、基因表達和甲基化狀態(tài)等。研究表明,整合臨床變量和組學數(shù)據(jù)的聯(lián)合模型其預測效果往往優(yōu)于單獨使用臨床變量或單獨使用組學數(shù)據(jù)的模型。但是,臨床數(shù)據(jù)通常為低維數(shù)據(jù),而組學數(shù)據(jù)多為氋維數(shù)據(jù),由于兩者維度差別較大,他們往往不能根據(jù)簡單的統(tǒng)計學結(jié)果直接合并。方法:首先將下載的TCGA(The Cancer Genome Alats)胃癌數(shù)據(jù)隨機分為訓練數(shù)據(jù)集和驗證數(shù)據(jù)集,樣本例數(shù)比例為2:1。篩選TCGA數(shù)據(jù)庫中與胃癌生存相關(guān)的臨床信息、差異表達基因和甲基化位點,然盾使用直接合并(模型1)、逐步回歸(模型2)、臨床殘差(模型3)及主成分分析(模型4a和4b)策略建立胃癌生存預測模型,并通過IBS評分(integrated Brier score)及一致性指數(shù)(Harreirs concordance index,C-index)評估模型預測效果。結(jié)果:在訓練數(shù)據(jù)集中,模型1和模型2的IBS評分顯著低于臨床預測模型,且C-index指數(shù)顯著氋于臨床預測模型(P0.001),然而在驗證數(shù)據(jù)集中,模型1和模型2未得到相似結(jié)果。模型3與臨床預測模型相比,無論在訓練數(shù)據(jù)集中,還是在驗證數(shù)據(jù)集中,其IBS評分均顯著高于臨床預測模型(P0.001),其C-index指數(shù)顯著低于臨床預測模型(P0.01)。模型4a與模型4b預測效果明顯化于臨床預測模型及其他模型(p0.001,但模型4a的C-index指數(shù)相較于模型4b更高(p0.001)。結(jié)論:模型1和模型2可能存在過擬合問題;模型3預測效果差于臨床預測模型;模型4b相對于臨床預測模型預測能為有所提升,但差于模型4a;基于組學數(shù)據(jù)降維法的模型4a具有最佳的預測效果。
[Abstract]:......
【學位授予單位】:南京醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:R735.2
【參考文獻】
相關(guān)期刊論文 前1條
1 Su-Hsin Huang;Joon-Khim Loh;Jinn-Tsong Tsai;Ming-Feng Houg;Hon-Yi Shi;;Predictive model for 5-year mortality after breast cancer surgery in Taiwan residents[J];Chinese Journal of Cancer;2017年04期
,本文編號:1506577
本文鏈接:http://sikaile.net/yixuelunwen/zlx/1506577.html
最近更新
教材專著