基于TCGA數(shù)據(jù)庫結(jié)腸癌m-RNA差異表達(dá)基因及預(yù)后分析
發(fā)布時間:2021-09-25 02:02
目的:本研究通過對公共數(shù)據(jù)庫TCGA(The Cancer Genome Atlas)的高通量數(shù)據(jù)——結(jié)腸癌m-RNA表達(dá)譜芯片進(jìn)行生物信息學(xué)分析,探索結(jié)腸癌導(dǎo)致的基因表達(dá)水平改變,對癌組織與癌旁組織的差異表達(dá)基因進(jìn)行共表達(dá)網(wǎng)絡(luò)分析,并估計結(jié)腸癌患者的生存期,為探索結(jié)腸癌的分子機(jī)制和預(yù)后分析提供基礎(chǔ)科學(xué)依據(jù)。方法:在公開閱覽的TCGA網(wǎng)站(http://cancer genome.nih.gov/)下載大腸癌基因表達(dá)譜數(shù)據(jù)集,包括:(1)32例結(jié)腸癌(結(jié)腸癌組)和32例癌旁組織(癌旁組)的mRNA測序數(shù)據(jù)3級(原計數(shù)和期望最大化(RSEM)歸一化RNA-seq讀取計數(shù));(2)507例結(jié)腸癌患者的m-RNA以及臨床信息。經(jīng)合并、整合后利用R軟件質(zhì)控后對32對結(jié)腸癌組和癌旁組的20531個基因進(jìn)行m-RNA差異表達(dá)分析以及差異表達(dá)基因的熱圖制作,對差異表達(dá)基因進(jìn)行共表達(dá)網(wǎng)絡(luò)分析,對507例結(jié)腸癌患者進(jìn)行生存分析。結(jié)果:在結(jié)腸癌數(shù)據(jù)集中32對結(jié)腸癌組和癌旁組的20531個基因中篩選出結(jié)腸癌中2939個基因有顯著的表達(dá)差異,其中上調(diào)基因1533個,下調(diào)基因1406個。對2939個差異表達(dá)基因...
【文章來源】:山西醫(yī)科大學(xué)山西省
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
CRC差異表達(dá)基因的聚類分析
山西醫(yī)科大學(xué)(博)碩士學(xué)位論文12圖1CRC差異表達(dá)基因的聚類分析2939個差異表達(dá)基因可有效地將32對樣本分成癌組織(聚類樹左半)和癌旁組織(聚類樹右半)。紅色即高表達(dá)基因,綠色即低表達(dá)基因。3.3CRC加權(quán)基因共表達(dá)網(wǎng)絡(luò)構(gòu)建3.3.1設(shè)定軟閾值利用R軟件flashClust函數(shù)繪制32對樣本的聚類樹形圖,如圖2所示。利用pickSoftThreshold函數(shù)計算不同的軟閾值下某節(jié)點連接度的對數(shù)log(k)與該節(jié)點出現(xiàn)的概率的對數(shù)之間的相關(guān)系數(shù)log(p(k))、斜率(slope)、截斷指數(shù)模型的相關(guān)系數(shù)(truncated.R.sq)、鄰接系數(shù)的均值(mean.k)、中位數(shù)(median.k)和最大值(max.k)如表3所示。對log(k)與log(p(k))按照軟閾值β的不同進(jìn)行作圖。見圖3。圖264例樣本聚類結(jié)果
山西醫(yī)科大學(xué)(博)碩士學(xué)位論文13表3篩選軟閾值PowerSFT.R.sqslopetruncated.R.sqmean.k.median.k.max.k.10.02050.6890.984567.0005.63e+02791.0020.1580-1.1800.949170.0001.63e+02338.0030.5880-2.1500.96264.1005.84e+01191.0040.8150-2.3000.96828.4002.37e+01124.0050.9080-2.2800.97614.2001.07e+0187.4060.9310-2.2200.9677.7505.14e+0064.9070.9530-2.0700.9764.5702.66e+0050.2080.9630-1.9600.9812.8701.43e+0039.8090.9670-1.8700.9861.8908.07e-0132.10100.9650-1.8000.9851.3004.79e-0126.30120.9600-1.6900.9790.6791.77e-0118.30140.9650-1.6000.9810.3917.00e-0213.10160.9410-1.5500.9460.2423.06e-029.71180.9490-1.4900.9470.1591.38e-027.32200.9490-1.4600.9460.1086.44e-035.75圖3軟閾值的確定圖3中左側(cè)圖橫軸為軟閾值(β值),縱軸為為不同軟閾值對應(yīng)的相關(guān)系數(shù),相關(guān)系數(shù)越高,
本文編號:3408870
【文章來源】:山西醫(yī)科大學(xué)山西省
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
CRC差異表達(dá)基因的聚類分析
山西醫(yī)科大學(xué)(博)碩士學(xué)位論文12圖1CRC差異表達(dá)基因的聚類分析2939個差異表達(dá)基因可有效地將32對樣本分成癌組織(聚類樹左半)和癌旁組織(聚類樹右半)。紅色即高表達(dá)基因,綠色即低表達(dá)基因。3.3CRC加權(quán)基因共表達(dá)網(wǎng)絡(luò)構(gòu)建3.3.1設(shè)定軟閾值利用R軟件flashClust函數(shù)繪制32對樣本的聚類樹形圖,如圖2所示。利用pickSoftThreshold函數(shù)計算不同的軟閾值下某節(jié)點連接度的對數(shù)log(k)與該節(jié)點出現(xiàn)的概率的對數(shù)之間的相關(guān)系數(shù)log(p(k))、斜率(slope)、截斷指數(shù)模型的相關(guān)系數(shù)(truncated.R.sq)、鄰接系數(shù)的均值(mean.k)、中位數(shù)(median.k)和最大值(max.k)如表3所示。對log(k)與log(p(k))按照軟閾值β的不同進(jìn)行作圖。見圖3。圖264例樣本聚類結(jié)果
山西醫(yī)科大學(xué)(博)碩士學(xué)位論文13表3篩選軟閾值PowerSFT.R.sqslopetruncated.R.sqmean.k.median.k.max.k.10.02050.6890.984567.0005.63e+02791.0020.1580-1.1800.949170.0001.63e+02338.0030.5880-2.1500.96264.1005.84e+01191.0040.8150-2.3000.96828.4002.37e+01124.0050.9080-2.2800.97614.2001.07e+0187.4060.9310-2.2200.9677.7505.14e+0064.9070.9530-2.0700.9764.5702.66e+0050.2080.9630-1.9600.9812.8701.43e+0039.8090.9670-1.8700.9861.8908.07e-0132.10100.9650-1.8000.9851.3004.79e-0126.30120.9600-1.6900.9790.6791.77e-0118.30140.9650-1.6000.9810.3917.00e-0213.10160.9410-1.5500.9460.2423.06e-029.71180.9490-1.4900.9470.1591.38e-027.32200.9490-1.4600.9460.1086.44e-035.75圖3軟閾值的確定圖3中左側(cè)圖橫軸為軟閾值(β值),縱軸為為不同軟閾值對應(yīng)的相關(guān)系數(shù),相關(guān)系數(shù)越高,
本文編號:3408870
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/3408870.html
最近更新
教材專著