加權基因共表達網(wǎng)絡分析(WGCNA)探尋膽管癌樞紐基因
發(fā)布時間:2021-03-07 22:39
目的:膽管癌是起源于膽管上皮細胞的惡性腫瘤。膽管癌患者早期常無臨床癥狀,隨著疾病的進展,可出現(xiàn)腹部不適、乏力、惡心、黃疸、發(fā)熱等癥狀。血清學檢查方面,在出現(xiàn)膽道梗阻時,肝功能檢查可有膽紅素、ALP和GGT升高,轉(zhuǎn)氨酶可輕度升高。由于膽管癌起病隱匿,多數(shù)患者早期無癥狀或無特異性癥狀,這對膽管癌的早期診斷提出了極大的挑戰(zhàn)。加之很多患者對疾病的認識少、意識差,上述因素使得膽管癌的病人早期發(fā)現(xiàn)率低,大部分發(fā)現(xiàn)后均屬于晚期,失去了手術治療時機,只能采取一些保守的治療方法,嚴重影響患者的預后和生活質(zhì)量。因此,此次研究旨在尋找膽管癌患者樞紐基因,以便指導對高危人群進行篩查及對膽管癌患者進行靶向治療。方法:此次研究通過檢索癌癥基因組數(shù)據(jù)庫(TCGA),下載膽管癌的基因表達數(shù)據(jù)(包括RNA-seq count、FPKM)及臨床數(shù)據(jù),其中包括33個為癌癥組織樣本、8個為癌旁組織樣本。我們將基因樣本分為腫瘤組織及癌旁組織樣本,并通過edge R包對基因表達數(shù)據(jù)(RNA-seq count)進行差異表達基因篩選以去除低表達和無差異的基因。將下載的RNA-seq FPKM列表與上一步驟所得差異基因比對并取交集,...
【文章來源】:河北醫(yī)科大學河北省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
WGCNA基本過程
15色)連有大量邊(即網(wǎng)絡關鍵節(jié)點)。軟閾值的選擇標準為使得每個基因網(wǎng)中包含的基因之間的連接服從無尺度網(wǎng)絡分布即連接數(shù)為k的概率p(k)與k的n次方成反比,即p(k)~k-r。在實際應用中研究者通過選擇加權系數(shù)來逼近無尺度網(wǎng)絡分布,使之滿足如下條件:連接節(jié)點個數(shù)的對數(shù)(log(k))與此節(jié)點出現(xiàn)概率的對數(shù)值(log(p(k)))為負相關關系(相關系數(shù)R2≧0.8),同時,不同模塊中的基因的平均連接度相對較高。選擇合適的power值,對相關矩陣進行冪指數(shù)加權運算得到鄰接矩陣。隨后將鄰接矩陣轉(zhuǎn)換成拓撲矩陣=[ωij];蚬脖磉_網(wǎng)絡構建的基礎為節(jié)點的相異程度,轉(zhuǎn)化公式為dij=1-ωij。以基因之間的拓撲相異矩陣dij為基本元素構建分層聚類樹(hierarchicalclusteringtree),聚類樹的不同分支代表不同的基因模塊。靜態(tài)剪切樹和動態(tài)剪切樹是兩種構建聚類樹算法。靜態(tài)剪切樹是通過定義一個固定的高度將群集分支,該方法識別群集的準確度不高。而動態(tài)剪切算法基于樹狀圖的分支形狀,它可挖掘得到靜態(tài)剪切無法檢測出的基因模塊,更重要的是,用動態(tài)剪切算法鑒定出的基因網(wǎng)絡以往的生物實驗結果比較一致[5]。所以,我們常常采用動態(tài)剪切算法劃分基因模塊。圖2隨機與無尺度網(wǎng)絡Fig.2Randomandscale-freenetworks基因模塊劃分后,我們可以將其與臨床特征相聯(lián)系,挑選出與其相關模塊。為了了解各模塊基因網(wǎng)絡調(diào)控的關鍵節(jié)點,我們需要篩選篩選樞紐基因。樞紐基因是指在一個模塊中連通性最高的一系列基因,它們在基因網(wǎng)絡調(diào)控中起到?jīng)Q定性作用并且決定了整個模塊的特征。目前,篩選樞紐基因的方法有多種。在本次研究中,我們采用三種應用較廣泛的方法,其
19圖4基因差異分析火山圖Fig.4volcanicmapofdifferentiallyexpressedgenes3.去除離群樣本將下載的基因FPKM列表與上一步驟所得差異基因比對并取交集,獲取差異基因的FPKM進行后續(xù)數(shù)據(jù)分析。由于臨床數(shù)據(jù)中有6個樣本TNM分級數(shù)據(jù)缺失,繼續(xù)數(shù)據(jù)聯(lián)合分析前先將其剔除。為保證網(wǎng)絡構建的結果可靠,首先需去除離群的樣本數(shù)據(jù)。擬通過不斷去除IAC平均值較小的樣本,直到剩余樣本的聚類樹無明顯離群樣本。我們將計算得到的IAC值繪制成直方圖,其平均IAC值為0.79,如圖5/Fig.5。我們將numbersd設置為-2.5,篩選并去除離群樣本。本次試驗數(shù)據(jù)中,numbersd值無低于閾值的樣本,圖6/Fig.6。最后,我們對35個樣本進行聚類分析,如圖7/Fig.7。圖橫坐標為各樣本名,縱坐標為樣本間相異程度。綜上,35樣本中無明顯離群樣本。
【參考文獻】:
期刊論文
[1]乳腺癌成纖維細胞生長因子受體靶向治療藥物研究進展[J]. 程志遠,王俊男,孫楓原,徐拯,李恒宇. 世界臨床藥物. 2019(03)
[2]膽管癌診斷及預后相關分子標記物研究進展[J]. 唐浩文,蒙軒,呂文平,董家鴻. 解放軍醫(yī)學院學報. 2018(02)
[3]膽管癌流行病學、危險因素及分型、分期的研究進展[J]. 費健,韓天權. 中華肝臟外科手術學電子雜志. 2015(04)
[4]膽管癌診斷與治療——外科專家共識[J]. Chinese Chapter of International Hepato-Pancreato-Biliary Association;Hepatic Surgery Group,Chinese Society of Surgery,Chinese Medical Association;. 臨床肝膽病雜志. 2015(01)
[5]成纖維生長因子受體在非小細胞肺癌中的研究進展[J]. 蒲丹,侯梅. 中國肺癌雜志. 2013(11)
[6]基于WGCNA算法的基因共表達網(wǎng)絡構建理論及其R軟件實現(xiàn)[J]. 宋長新,雷萍,王婷. 基因組學與應用生物學. 2013(01)
本文編號:3069927
【文章來源】:河北醫(yī)科大學河北省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
WGCNA基本過程
15色)連有大量邊(即網(wǎng)絡關鍵節(jié)點)。軟閾值的選擇標準為使得每個基因網(wǎng)中包含的基因之間的連接服從無尺度網(wǎng)絡分布即連接數(shù)為k的概率p(k)與k的n次方成反比,即p(k)~k-r。在實際應用中研究者通過選擇加權系數(shù)來逼近無尺度網(wǎng)絡分布,使之滿足如下條件:連接節(jié)點個數(shù)的對數(shù)(log(k))與此節(jié)點出現(xiàn)概率的對數(shù)值(log(p(k)))為負相關關系(相關系數(shù)R2≧0.8),同時,不同模塊中的基因的平均連接度相對較高。選擇合適的power值,對相關矩陣進行冪指數(shù)加權運算得到鄰接矩陣。隨后將鄰接矩陣轉(zhuǎn)換成拓撲矩陣=[ωij];蚬脖磉_網(wǎng)絡構建的基礎為節(jié)點的相異程度,轉(zhuǎn)化公式為dij=1-ωij。以基因之間的拓撲相異矩陣dij為基本元素構建分層聚類樹(hierarchicalclusteringtree),聚類樹的不同分支代表不同的基因模塊。靜態(tài)剪切樹和動態(tài)剪切樹是兩種構建聚類樹算法。靜態(tài)剪切樹是通過定義一個固定的高度將群集分支,該方法識別群集的準確度不高。而動態(tài)剪切算法基于樹狀圖的分支形狀,它可挖掘得到靜態(tài)剪切無法檢測出的基因模塊,更重要的是,用動態(tài)剪切算法鑒定出的基因網(wǎng)絡以往的生物實驗結果比較一致[5]。所以,我們常常采用動態(tài)剪切算法劃分基因模塊。圖2隨機與無尺度網(wǎng)絡Fig.2Randomandscale-freenetworks基因模塊劃分后,我們可以將其與臨床特征相聯(lián)系,挑選出與其相關模塊。為了了解各模塊基因網(wǎng)絡調(diào)控的關鍵節(jié)點,我們需要篩選篩選樞紐基因。樞紐基因是指在一個模塊中連通性最高的一系列基因,它們在基因網(wǎng)絡調(diào)控中起到?jīng)Q定性作用并且決定了整個模塊的特征。目前,篩選樞紐基因的方法有多種。在本次研究中,我們采用三種應用較廣泛的方法,其
19圖4基因差異分析火山圖Fig.4volcanicmapofdifferentiallyexpressedgenes3.去除離群樣本將下載的基因FPKM列表與上一步驟所得差異基因比對并取交集,獲取差異基因的FPKM進行后續(xù)數(shù)據(jù)分析。由于臨床數(shù)據(jù)中有6個樣本TNM分級數(shù)據(jù)缺失,繼續(xù)數(shù)據(jù)聯(lián)合分析前先將其剔除。為保證網(wǎng)絡構建的結果可靠,首先需去除離群的樣本數(shù)據(jù)。擬通過不斷去除IAC平均值較小的樣本,直到剩余樣本的聚類樹無明顯離群樣本。我們將計算得到的IAC值繪制成直方圖,其平均IAC值為0.79,如圖5/Fig.5。我們將numbersd設置為-2.5,篩選并去除離群樣本。本次試驗數(shù)據(jù)中,numbersd值無低于閾值的樣本,圖6/Fig.6。最后,我們對35個樣本進行聚類分析,如圖7/Fig.7。圖橫坐標為各樣本名,縱坐標為樣本間相異程度。綜上,35樣本中無明顯離群樣本。
【參考文獻】:
期刊論文
[1]乳腺癌成纖維細胞生長因子受體靶向治療藥物研究進展[J]. 程志遠,王俊男,孫楓原,徐拯,李恒宇. 世界臨床藥物. 2019(03)
[2]膽管癌診斷及預后相關分子標記物研究進展[J]. 唐浩文,蒙軒,呂文平,董家鴻. 解放軍醫(yī)學院學報. 2018(02)
[3]膽管癌流行病學、危險因素及分型、分期的研究進展[J]. 費健,韓天權. 中華肝臟外科手術學電子雜志. 2015(04)
[4]膽管癌診斷與治療——外科專家共識[J]. Chinese Chapter of International Hepato-Pancreato-Biliary Association;Hepatic Surgery Group,Chinese Society of Surgery,Chinese Medical Association;. 臨床肝膽病雜志. 2015(01)
[5]成纖維生長因子受體在非小細胞肺癌中的研究進展[J]. 蒲丹,侯梅. 中國肺癌雜志. 2013(11)
[6]基于WGCNA算法的基因共表達網(wǎng)絡構建理論及其R軟件實現(xiàn)[J]. 宋長新,雷萍,王婷. 基因組學與應用生物學. 2013(01)
本文編號:3069927
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3069927.html
最近更新
教材專著