一種基于PPI網(wǎng)絡的乳腺癌差異基因分析算法
發(fā)布時間:2021-01-28 03:16
為了提高對于乳腺癌差異基因篩選的準確率,從分子層面出發(fā),結合拷貝數(shù)與基因表達兩方面特征,分析了乳腺癌差異表達基因,研究了乳腺癌的發(fā)病機制,為乳腺癌的診療提供了新的研究思路.在癌癥基因組圖譜中下載乳腺癌的拷貝數(shù)和基因表達數(shù)據(jù),利用R軟件通過卡方檢驗提取乳腺癌拷貝數(shù)差異基因,結合edgeR差異基因分析算法,篩選乳腺癌差異表達基因,利用ks檢驗關聯(lián)兩方面差異基因,分析其相關性,結合string數(shù)據(jù)庫構造蛋白質(zhì)互作網(wǎng)絡,篩選核心基因,通過生存分析和GO富集分析驗證結果的準確性.以基因差異表達倍數(shù)大于1,p值小于0.05為標準,篩選出基因表達差異基因共有10 579個,上調(diào)基因7 543個,下調(diào)基因3 036個,經(jīng)驗證發(fā)現(xiàn),ATAD2B等8個基因與乳腺癌的發(fā)生發(fā)展密切相關.
【文章來源】:北京郵電大學學報. 2020,43(04)北大核心
【文章頁數(shù)】:7 頁
【部分圖文】:
1~4號染色體拷貝數(shù)變異部分圈圖
為了分析基因在癌癥樣本與正常樣本中不同的表達情況,下載TCGA mRNA基因表達數(shù)據(jù)1 222個,其中R軟件分析得到的正常樣本數(shù)目為113個,癌癥樣品數(shù)為1 109個,以差異倍數(shù)大于1,即差異倍數(shù)為2倍以上.矯正后的p值小于0.05為過濾標準,利用R軟件edgeR包進行分析,得到具有顯著差異表達基因共有10 579個,其中上調(diào)基因7 543個,下調(diào)基因3 036個.如圖2所示,其中橫坐標為矯正后的p值,橫坐標越大,基因表達差異越明顯,縱坐標為差異倍數(shù),越往兩邊發(fā)散表示基因表達的差異越大,其中中間虛線上半部分表示基因表達上調(diào),下半部分表示基因表達下調(diào).2.3 乳腺癌拷貝數(shù)與差異表達基因聯(lián)合篩選
通過string數(shù)據(jù)庫導入差異表達基因后,構造出蛋白質(zhì)互作網(wǎng)絡,并利用cytoscape軟件對網(wǎng)絡進行編輯,核心差異基因之間的連接關系如圖3所示.利用R軟件統(tǒng)計核心基因的排序情況如圖4所示,其中縱坐標代表核心基因名稱,橫軸數(shù)值代表核心基因的連接情況,數(shù)值越大代表連接節(jié)點數(shù)越多,基因越核心.圖4 蛋白質(zhì)互作網(wǎng)絡核心基因統(tǒng)計
【參考文獻】:
期刊論文
[1]乳腺癌患者血清BRMS1mRNA的表達及意義分析[J]. 史源,胡建民. 臨床研究. 2019(11)
[2]APOBEC3基因拷貝數(shù)變異與乳腺癌易感性的關聯(lián)[J]. 姜鑫釗,張明龍,杜媛媛,李芙蓉,趙大龍,馬洪星,黎碧達,張洋,李石,鄭立紅. 基因組學與應用生物學. 2019(03)
[3]PD-1/PD-L1在非特殊型浸潤性乳腺癌中的表達及意義[J]. 李瑩瑩,董麗儒,李宇陽,熊艷杰,宋旭東. 廣東醫(yī)學. 2018(11)
碩士論文
[1]基于乳腺癌基因組數(shù)據(jù)的分析與可視化平臺實現(xiàn)[D]. 鄒杰民.湖南大學 2017
[2]單雙側原發(fā)性乳腺癌HER-2基因擴增差異及與臨床預后關系分析[D]. 董赟.南昌大學 2016
本文編號:3004258
【文章來源】:北京郵電大學學報. 2020,43(04)北大核心
【文章頁數(shù)】:7 頁
【部分圖文】:
1~4號染色體拷貝數(shù)變異部分圈圖
為了分析基因在癌癥樣本與正常樣本中不同的表達情況,下載TCGA mRNA基因表達數(shù)據(jù)1 222個,其中R軟件分析得到的正常樣本數(shù)目為113個,癌癥樣品數(shù)為1 109個,以差異倍數(shù)大于1,即差異倍數(shù)為2倍以上.矯正后的p值小于0.05為過濾標準,利用R軟件edgeR包進行分析,得到具有顯著差異表達基因共有10 579個,其中上調(diào)基因7 543個,下調(diào)基因3 036個.如圖2所示,其中橫坐標為矯正后的p值,橫坐標越大,基因表達差異越明顯,縱坐標為差異倍數(shù),越往兩邊發(fā)散表示基因表達的差異越大,其中中間虛線上半部分表示基因表達上調(diào),下半部分表示基因表達下調(diào).2.3 乳腺癌拷貝數(shù)與差異表達基因聯(lián)合篩選
通過string數(shù)據(jù)庫導入差異表達基因后,構造出蛋白質(zhì)互作網(wǎng)絡,并利用cytoscape軟件對網(wǎng)絡進行編輯,核心差異基因之間的連接關系如圖3所示.利用R軟件統(tǒng)計核心基因的排序情況如圖4所示,其中縱坐標代表核心基因名稱,橫軸數(shù)值代表核心基因的連接情況,數(shù)值越大代表連接節(jié)點數(shù)越多,基因越核心.圖4 蛋白質(zhì)互作網(wǎng)絡核心基因統(tǒng)計
【參考文獻】:
期刊論文
[1]乳腺癌患者血清BRMS1mRNA的表達及意義分析[J]. 史源,胡建民. 臨床研究. 2019(11)
[2]APOBEC3基因拷貝數(shù)變異與乳腺癌易感性的關聯(lián)[J]. 姜鑫釗,張明龍,杜媛媛,李芙蓉,趙大龍,馬洪星,黎碧達,張洋,李石,鄭立紅. 基因組學與應用生物學. 2019(03)
[3]PD-1/PD-L1在非特殊型浸潤性乳腺癌中的表達及意義[J]. 李瑩瑩,董麗儒,李宇陽,熊艷杰,宋旭東. 廣東醫(yī)學. 2018(11)
碩士論文
[1]基于乳腺癌基因組數(shù)據(jù)的分析與可視化平臺實現(xiàn)[D]. 鄒杰民.湖南大學 2017
[2]單雙側原發(fā)性乳腺癌HER-2基因擴增差異及與臨床預后關系分析[D]. 董赟.南昌大學 2016
本文編號:3004258
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3004258.html
最近更新
教材專著