基于組學(xué)數(shù)據(jù)的癌癥生物學(xué)通路分析方法研究
發(fā)布時間:2020-09-17 18:48
癌癥是現(xiàn)今最致命的疾病之一。到2030年,在世界范圍內(nèi),每年將有一千三百萬人死于癌癥。微陣列和下一代測序等高通量技術(shù)的出現(xiàn),推動了全基因組范圍內(nèi)癌癥的研究。生物學(xué)標(biāo)志物的識別是高通量測序技術(shù)的一個重要應(yīng)用,作為疾病的分子特征,可以用來為臨床輔助決策。盡管生物學(xué)標(biāo)志物已廣泛應(yīng)用,但是仍存在很多問題。其一是在疾病的發(fā)展和治療反應(yīng)中識別出的很多基因標(biāo)志物缺乏合理的生物學(xué)功能解釋,其二是針對癌癥這種異質(zhì)性疾病,基因標(biāo)志物的可重復(fù)性是一大挑戰(zhàn)。鑒于可靠臨床基因標(biāo)志物識別的困難,研究人員需要利用生物學(xué)的先驗知識以加強(qiáng)數(shù)據(jù)驅(qū)動的方法來識別具有魯棒性的生物學(xué)標(biāo)志物。因此,基于生物學(xué)通路的方法被開發(fā)出來。通過整合通路分析和基因組數(shù)據(jù)評估在患者亞群和個體腫瘤中哪些通路被調(diào)控來指導(dǎo)靶向治療,基于生物學(xué)通路的方法能夠幫助我們在功能機(jī)制上深入了解癌癥致病機(jī)理。然而,現(xiàn)有的大多數(shù)通路分析方法沒有考慮到通路復(fù)雜的相互作用,并且沒有融合多組學(xué)數(shù)據(jù)。本文針對上述問題,對基于網(wǎng)絡(luò)的通路分析和基于通路的癌癥診斷進(jìn)行了深入的研究。全文首先系統(tǒng)的介紹了通路分析的主要方法及其特點(diǎn),總結(jié)了通路分析面臨的主要困難和研究現(xiàn)狀。然后針對性的提出若干基于網(wǎng)絡(luò)的通路分析方法及基于通路的癌癥分類方法,具體分為以下幾個方面。(1)大規(guī)模生物網(wǎng)絡(luò)的建立,使得基于網(wǎng)絡(luò)的通路分析方法成為研究熱點(diǎn)。在全基因組范圍生物網(wǎng)絡(luò)中,通路的交互不局限于通路內(nèi)部基因的相互交互,通路內(nèi)部的基因與通路鄰近的基因也存在著廣泛的交互;诖,本文提出了一種基于加權(quán)基因交互網(wǎng)絡(luò)的通路分析方法,首先通過整合蛋白質(zhì)相互作用數(shù)據(jù),基因表達(dá)譜數(shù)據(jù),分別構(gòu)建了全基因組水平表型特異性的基因關(guān)聯(lián)網(wǎng)絡(luò),然后通過考慮關(guān)聯(lián)網(wǎng)絡(luò)邊的權(quán)重和度,利用Limited K-walks算法,將每一個通路分別在表型特異性關(guān)聯(lián)網(wǎng)絡(luò)中尋找網(wǎng)絡(luò)中與通路密切相關(guān)的基因,并擴(kuò)增為兩個小網(wǎng)絡(luò),最后通過評價擴(kuò)展后的這兩個小網(wǎng)絡(luò)的差異性來識別與癌癥相關(guān)的通路。在公開的數(shù)據(jù)集上,本文的方法與其他方法進(jìn)行了比較,實驗結(jié)果表明,本文的方法能夠有效的識別出與癌癥相關(guān)的通路。(2)各組學(xué)海量數(shù)據(jù)的快速積累,為揭示癌癥致病機(jī)理提供了有力的數(shù)據(jù)支持。眾多組學(xué)數(shù)據(jù)中,轉(zhuǎn)錄組學(xué)和表觀基因組學(xué)關(guān)系最為密切;诖,本文提出了一種基于網(wǎng)絡(luò)融合多組學(xué)數(shù)據(jù)的通路分析方法。該方法通過主成分分析和稀疏典型相關(guān)分析整合DNA甲基化和基因表達(dá)數(shù)據(jù)計算表型特異性網(wǎng)絡(luò)邊的權(quán)重。構(gòu)建每個表型下的加權(quán)網(wǎng)絡(luò),然后把通路依次嵌入網(wǎng)絡(luò)中進(jìn)行擴(kuò)展,擴(kuò)展后的通路基因集作為基因列表進(jìn)行經(jīng)典的富集分析,以此來評估通路與相關(guān)癌癥的關(guān)系。該方法在三個公開數(shù)據(jù)集上進(jìn)行了驗證分析,實驗結(jié)果表明,本文的方法通過融合DNA甲基化和基因表達(dá)數(shù)據(jù)在樣本數(shù)量較少的情況下結(jié)合經(jīng)典的通路分析能有效的識別出與癌癥相關(guān)的通路。同時該方法可以基于大規(guī)模的生物網(wǎng)絡(luò)研究原始通路間和擴(kuò)展通路間的交互關(guān)系,為從系統(tǒng)學(xué)的角度研究通路在癌癥中的作用提供了新的角度。(3)精準(zhǔn)醫(yī)療概念的提出,使得通用性醫(yī)療開始向個性化、精準(zhǔn)醫(yī)療轉(zhuǎn)變。隨著個性化通路分析方法相繼被開發(fā)出來,基于個性化通路的癌癥研究成為了最近研究的熱點(diǎn)之一。本文首先對三種類型通路用于癌癥分類的效果進(jìn)行了比較分析,實驗結(jié)果表明基于OR-pathway的方法分類效果最好。然后本文構(gòu)建了基于個性化分析識別風(fēng)險通路模型,將該模型應(yīng)用到乳腺癌數(shù)據(jù)集中進(jìn)行實驗分析,實驗結(jié)果表明該方法能夠有效的識別出與乳腺癌相關(guān)的通路。(4)組學(xué)數(shù)據(jù)具有維數(shù)高、樣本少、高噪聲等特點(diǎn),這些特點(diǎn)在數(shù)據(jù)挖掘中容易導(dǎo)致維數(shù)災(zāi)難和過擬合等問題,使得很多經(jīng)典的機(jī)器學(xué)習(xí)方法失去了其效能。基于此,本文提出了一種基于通路集成學(xué)習(xí)的癌癥分類方法。該方法首先通過差異基因集和通路基因列表求得差異通路基因列表,然后以每個差異通路基因列表構(gòu)造基分類器。最后通過相關(guān)算法進(jìn)行基分類器篩選,選取最優(yōu)基分類器集合構(gòu)建集成學(xué)習(xí)分類器進(jìn)行癌癥診斷。本文的方法在三個公開數(shù)據(jù)集上與其他方法進(jìn)行了比較分析,實驗結(jié)果表明,本文方法不但具有最優(yōu)的分類性能,而且結(jié)果具有很好的魯棒性。同時,集成學(xué)習(xí)器中的基分類器具有明確生物學(xué)意義,識別出了臨床相關(guān)的核心生物學(xué)通路和癌癥潛在的生物學(xué)過程,可以幫助研究人員理解癌癥發(fā)病和預(yù)后機(jī)理。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TP181;R73-3
本文編號:2821091
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TP181;R73-3
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 黃聰;黃毅;王凱;石欣;;細(xì)胞色素P450:腫瘤研究中的新熱點(diǎn)[J];現(xiàn)代生物醫(yī)學(xué)進(jìn)展;2011年08期
2 楊長盛;陶亮;曹振田;汪世義;;基于成對差異性度量的選擇性集成方法[J];模式識別與人工智能;2010年04期
本文編號:2821091
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2821091.html
最近更新
教材專著