基于GEO/TCGA數(shù)據(jù)庫(kù)識(shí)別GNG2基因在乳腺癌發(fā)生發(fā)展中的作用研究
發(fā)布時(shí)間:2021-01-06 14:10
第一部分基于GEO/TCGA數(shù)據(jù)庫(kù)識(shí)別乳腺癌差異基因 GNG2目的:整合GEO和TCGA大樣本數(shù)據(jù)庫(kù),采用生物信息學(xué)方法篩選出在乳腺癌中具有重要研究?jī)r(jià)值的差異基因,為進(jìn)一步發(fā)現(xiàn)乳腺癌新的治療靶點(diǎn)和預(yù)后標(biāo)志物提供理論依據(jù)。方法:從GEO數(shù)據(jù)庫(kù)下載乳腺癌和正常對(duì)照的m RNA表達(dá)數(shù)據(jù),共計(jì)三個(gè)芯片(GSE45827,GSE50428,GSE57297),204個(gè)樣本被納入差異基因篩選體系,其中乳腺癌樣本有181個(gè),正常對(duì)照樣本有23個(gè)。同時(shí),每個(gè)芯片所對(duì)應(yīng)的平臺(tái)注釋文件也被下載下來(lái)。之后,根據(jù)注釋文件將探針轉(zhuǎn)換為基因名稱(如果一個(gè)基因名稱對(duì)應(yīng)多個(gè)探針,則取平均值)。將三個(gè)芯片的原始數(shù)據(jù)合并之后,利用R(3.5.1)中的Sva包進(jìn)行批次矯正。接下來(lái),利用R(3.5.1)中的limma包對(duì)矯正后的數(shù)據(jù)進(jìn)行差異分析,篩選標(biāo)準(zhǔn)為:FDR≤0.05,|log Fold Change(FC)|≥1,adjust P≤0.01,并利用TCGA數(shù)據(jù)庫(kù)對(duì)篩選的差異基因進(jìn)行驗(yàn)證。隨后,使用R(3.5.1)中的pheatmap包對(duì)差異基因進(jìn)行聚類(lèi)分析;使用R(3.5.1)中的Cluster Profiler包對(duì)...
【文章來(lái)源】:重慶醫(yī)科大學(xué)重慶市
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
實(shí)驗(yàn)流程圖
重慶醫(yī)科大學(xué)碩士研究生學(xué)位論文26圖1.2聯(lián)合分析體系的批次矯正(A.批次矯正前B.批次矯正后)Figure1.2Batchnormalizationofjointanalysissystem(A.BeforebatchnormalizationB.Afterbatchnormalization)批次矯正成功之后,便可進(jìn)行下游的差異基因分析。使用基于R運(yùn)行環(huán)境的Limma程序包對(duì)聯(lián)合分析體系進(jìn)行差異分析,以|logFoldChange|≥1.2,adjustP<0.01為篩選條件,共篩選出1321個(gè)差異基因,其中上調(diào)的基因有624個(gè),下調(diào)的有697個(gè)。使用Pheatmap程序包對(duì)差異基因進(jìn)行聚類(lèi)分析,聚類(lèi)熱圖如圖1.3所示。按|logFlodChange|值進(jìn)行排序,乳腺癌中上調(diào)的前十個(gè)基因和下調(diào)的前十個(gè)基因在熱圖中進(jìn)行分開(kāi)展示。
重慶醫(yī)科大學(xué)碩士研究生學(xué)位論文27圖1.3差異基因熱圖Figure1.3Heatmapofdifferentialexpressiongenes3.2差異基因驗(yàn)證為了進(jìn)一步證實(shí)基于GEO數(shù)據(jù)庫(kù)分析得來(lái)的差異基因的準(zhǔn)確性,我們利用TCGA數(shù)據(jù)庫(kù)進(jìn)行驗(yàn)證。我們從TCGA數(shù)據(jù)庫(kù)共下載到1230個(gè)乳腺樣本,包括1109個(gè)乳腺癌樣本和121個(gè)正常組織樣本。從基于GEO聯(lián)合分析體系篩選得來(lái)的差異基因中隨機(jī)選擇5個(gè)上調(diào)和5個(gè)下調(diào)的差異基因,用TCGA中的數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明這些差異基因在TCGA數(shù)據(jù)庫(kù)中呈一致的差異趨勢(shì)(如圖1.4),提示基于聯(lián)合分析體系得來(lái)的差異基因是準(zhǔn)確可靠的。圖1.4差異基因驗(yàn)證(表達(dá)值取2的對(duì)數(shù)處理)Figure1.4Verificationofdifferentialexpressiongenes(Theexpressionvalueislogarithmicof2)3.3GO和KEGG富集分析
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)女性乳腺癌篩查指南[J]. 黃育北. 中國(guó)腫瘤臨床. 2019(09)
[2]全球女性乳腺癌流行情況研究[J]. 師金,梁迪,李道娟,王立群,靳晶,張亞琛,賀宇彤. 中國(guó)腫瘤. 2017(09)
[3]基于Cytoscape的蛋白質(zhì)網(wǎng)絡(luò)可視化聚類(lèi)分析插件[J]. 唐羽,李敏. 生物信息學(xué). 2014(01)
[4]乳腺癌病因的高危因素分析[J]. 祁玉娟. 青海醫(yī)藥雜志. 2009(04)
[5]Perl程序設(shè)計(jì)語(yǔ)言綜述[J]. 劉步權(quán),廖湘科,吳慶波. 計(jì)算機(jī)工程與應(yīng)用. 2002(18)
碩士論文
[1]GPC4在白色脂肪細(xì)胞褐變過(guò)程中的作用及其機(jī)制[D]. 李秋錦.重慶醫(yī)科大學(xué) 2019
[2]乳腺癌100例臨床預(yù)后的COX分析[D]. 任虎虎.新疆醫(yī)科大學(xué) 2010
本文編號(hào):2960712
【文章來(lái)源】:重慶醫(yī)科大學(xué)重慶市
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
實(shí)驗(yàn)流程圖
重慶醫(yī)科大學(xué)碩士研究生學(xué)位論文26圖1.2聯(lián)合分析體系的批次矯正(A.批次矯正前B.批次矯正后)Figure1.2Batchnormalizationofjointanalysissystem(A.BeforebatchnormalizationB.Afterbatchnormalization)批次矯正成功之后,便可進(jìn)行下游的差異基因分析。使用基于R運(yùn)行環(huán)境的Limma程序包對(duì)聯(lián)合分析體系進(jìn)行差異分析,以|logFoldChange|≥1.2,adjustP<0.01為篩選條件,共篩選出1321個(gè)差異基因,其中上調(diào)的基因有624個(gè),下調(diào)的有697個(gè)。使用Pheatmap程序包對(duì)差異基因進(jìn)行聚類(lèi)分析,聚類(lèi)熱圖如圖1.3所示。按|logFlodChange|值進(jìn)行排序,乳腺癌中上調(diào)的前十個(gè)基因和下調(diào)的前十個(gè)基因在熱圖中進(jìn)行分開(kāi)展示。
重慶醫(yī)科大學(xué)碩士研究生學(xué)位論文27圖1.3差異基因熱圖Figure1.3Heatmapofdifferentialexpressiongenes3.2差異基因驗(yàn)證為了進(jìn)一步證實(shí)基于GEO數(shù)據(jù)庫(kù)分析得來(lái)的差異基因的準(zhǔn)確性,我們利用TCGA數(shù)據(jù)庫(kù)進(jìn)行驗(yàn)證。我們從TCGA數(shù)據(jù)庫(kù)共下載到1230個(gè)乳腺樣本,包括1109個(gè)乳腺癌樣本和121個(gè)正常組織樣本。從基于GEO聯(lián)合分析體系篩選得來(lái)的差異基因中隨機(jī)選擇5個(gè)上調(diào)和5個(gè)下調(diào)的差異基因,用TCGA中的數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明這些差異基因在TCGA數(shù)據(jù)庫(kù)中呈一致的差異趨勢(shì)(如圖1.4),提示基于聯(lián)合分析體系得來(lái)的差異基因是準(zhǔn)確可靠的。圖1.4差異基因驗(yàn)證(表達(dá)值取2的對(duì)數(shù)處理)Figure1.4Verificationofdifferentialexpressiongenes(Theexpressionvalueislogarithmicof2)3.3GO和KEGG富集分析
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)女性乳腺癌篩查指南[J]. 黃育北. 中國(guó)腫瘤臨床. 2019(09)
[2]全球女性乳腺癌流行情況研究[J]. 師金,梁迪,李道娟,王立群,靳晶,張亞琛,賀宇彤. 中國(guó)腫瘤. 2017(09)
[3]基于Cytoscape的蛋白質(zhì)網(wǎng)絡(luò)可視化聚類(lèi)分析插件[J]. 唐羽,李敏. 生物信息學(xué). 2014(01)
[4]乳腺癌病因的高危因素分析[J]. 祁玉娟. 青海醫(yī)藥雜志. 2009(04)
[5]Perl程序設(shè)計(jì)語(yǔ)言綜述[J]. 劉步權(quán),廖湘科,吳慶波. 計(jì)算機(jī)工程與應(yīng)用. 2002(18)
碩士論文
[1]GPC4在白色脂肪細(xì)胞褐變過(guò)程中的作用及其機(jī)制[D]. 李秋錦.重慶醫(yī)科大學(xué) 2019
[2]乳腺癌100例臨床預(yù)后的COX分析[D]. 任虎虎.新疆醫(yī)科大學(xué) 2010
本文編號(hào):2960712
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2960712.html
最近更新
教材專著