肝癌易感相關(guān)基因及組織基因表達譜生物信息學(xué)分析
發(fā)布時間:2019-10-08 14:08
【摘要】:第一部分 肝癌易感性相關(guān)基因的文獻計量學(xué)與生物信息學(xué)分析研究背景和目的:肝癌在我國屬于發(fā)病率排名前3位的腫瘤,多數(shù)與乙肝病毒感染有關(guān),發(fā)病數(shù)在全世界排名第一。由于多數(shù)肝癌病人確診時已經(jīng)腫瘤晚期,發(fā)現(xiàn)后有效治療手段較少,如果能在早期發(fā)現(xiàn),多數(shù)小肝癌病人能夠獲得臨床痊愈,因而,如何早期發(fā)現(xiàn)肝癌一直是肝癌防治研究的熱點和難點。肝癌的發(fā)病與肝炎病毒感染、黃曲霉毒素接觸等多種危險因素有關(guān),還受吸煙、飲酒、環(huán)境致癌物暴露、生活方式、脂肪肝、糖尿病、代謝綜合征等多種因素的影響。一直以來,防控乙型肝炎,并針對肝癌高風(fēng)險人群進行定期體檢篩查是發(fā)現(xiàn)早期肝癌、提高肝癌生存率的有效方法。由于有肝癌致癌因素的人群眾多,其中只有一小部分人最終發(fā)展為肝癌,大約85—90%的乙肝攜帶者始終都是攜帶者。分子醫(yī)學(xué)研究發(fā)現(xiàn)肝癌易感人群的個體差異對是否發(fā)生肝癌有一定的影響,通過評估患者的臨床特征和基因風(fēng)險,可以優(yōu)化肝癌篩查及癌前病變的防治方案。近年來針對肝癌易感基因的研究很多,為了更好的了解肝癌易感性基因的研究動態(tài)、發(fā)展趨勢、尋找關(guān)鍵基因,本研究運用文獻計量學(xué)和生物信息學(xué)方法對相關(guān)基因的研究文獻及所涉及的相關(guān)基因進行系統(tǒng)分析。肝癌易感基因的研究多是采用針對預(yù)選基因(Candidate Gene Study)的病例-對照研究,根據(jù)基因的功能預(yù)設(shè)可能的目標(biāo)基因,采用PCR-RFLP法、PCR-SSCP技術(shù)、Taqman探針法等實驗技術(shù)。這些方法費用相對較低,但是檢測覆蓋的基因數(shù)量較少。近年來使用全基因組關(guān)聯(lián)研究(Genome-wide Association Studies, GWAS)的方法對肝癌易感基因進行研究,使用的基因芯片能在全基因組范圍內(nèi)同時檢測幾十萬至上百萬個單核苷酸多態(tài)性(Single nucleotide polymorphisms SNP)位點的變異情況,覆蓋幾十萬個基因,因而使得發(fā)現(xiàn)更多超出人們預(yù)料的易感基因成為可能。本研究先全面檢索了Embase、Pubmed和BIOSIS Preview文獻數(shù)據(jù)庫,收集所有肝癌易感相關(guān)基因研究,通過文獻計量學(xué)的方法分析肝癌易感相關(guān)基因的研究狀況,然后匯總所有有文獻支持的易感相關(guān)基因,進行生物信息學(xué)分析,對眾多易感相關(guān)基因進行生物功能學(xué)解釋,尋找其中對肝癌發(fā)病起關(guān)鍵影響的基因。方法:1.文獻收集與分析:從Embase、Pubmed和BIOSIS Preview數(shù)據(jù)庫中檢索2001年1月-2014年1月肝癌易感性相關(guān)基因研究的原始研究文獻;谖墨I挖掘的方法統(tǒng)計肝癌易感相關(guān)基因。另外,隨著肝癌易感相關(guān)基因的原始研究逐漸增多,相關(guān)的META研究也逐漸增加,本研究還進一步匯總分析了截止2015年1月31日以來該領(lǐng)域發(fā)表的META研究文獻。2.基因生物信息學(xué)分析:匯總文獻中的肝癌易感相關(guān)基因,通過基因名稱轉(zhuǎn)換工具Clone/GenelD Converter和Pubmed中的Gene數(shù)據(jù)庫將基因名稱轉(zhuǎn)換為統(tǒng)一的官方名稱。利用在線GATHER軟件將所有的肝癌易感性相關(guān)基因進行GO分類和KEGG通路分析。另外,將統(tǒng)計所得肝癌易感相關(guān)基因上傳至在線STRING 9.1軟件構(gòu)建由導(dǎo)入基因所表達產(chǎn)物組成的蛋白質(zhì)相互作用網(wǎng)絡(luò)。將在線STRING 9.1軟件中所得網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)入Cytoscape 3.0.2軟件,將相應(yīng)網(wǎng)絡(luò)進一步可視化處理,同時利用其插件CentiScape 2.1,計算網(wǎng)絡(luò)及各個節(jié)點的拓?fù)涮匦?并篩選出關(guān)鍵節(jié)點。結(jié)果:1.文獻計量學(xué)研究結(jié)果Embase數(shù)據(jù)庫檢出文獻3362篇, Pubmed/Medline數(shù)據(jù)庫檢出文獻1297篇,BIOSIS Previews檢出文獻3902篇,合并3數(shù)據(jù)庫檢索結(jié)果,去重并按照納入標(biāo)準(zhǔn)進一步篩選,最終納入原始研究文獻708篇,大部分基因只有1-3篇研究文獻支持。截止至2015年1月31日,總共有61篇META,這些META分析使用了708篇原始研究文獻中的研究。研究者大部分為中國人。34個基因進行了META分析研究,分別是:CYP1A1 CYP2E1 EGF EPHX1 ERCC2 GSTM1 GSTP1 GSTT1 HFE HLA-DQ HLA-DQB1 HLA-DRB1 IFNL3 IL10 IL1B IL6 KIF1B MDM2 MIR146A MIR196A2 MIR499A MTHFR NAT2 OGG1 PNPLA3 PTGS2 SOD2 STAT4 TGFB1 TNF TP53 UGT1A7 XRCC1 XRCC3。另外,該領(lǐng)域至今已經(jīng)發(fā)表的GWAS研究有7個,發(fā)現(xiàn)的相關(guān)基因和SNP位點如下:2.基因生物信息學(xué)分析文獻涉及201個肝癌易感相關(guān)基因,不同分級的GO分類741種,其中l(wèi)n(貝葉斯因子)大于10且P值0.001的分類有32種,顯示這些基因主要與細(xì)胞損傷修復(fù)、免疫反應(yīng)、細(xì)胞周期調(diào)節(jié)、炎癥反應(yīng)、DNA損傷修復(fù)、凋亡、抗原遞呈等有關(guān)。KEGG通路66種,其中l(wèi)n大于0的通路有8種。主要是參與細(xì)胞受體信號傳導(dǎo)通路、細(xì)胞周期調(diào)節(jié)、毒物降解、氨基酸、脂肪酸代謝。基因相關(guān)蛋白相互作用網(wǎng)絡(luò)分析,篩選出11個關(guān)鍵基因:TP53、IL6、TGFB1、TNF、ESR1、 VEGFA、HIFIA、STAT1、IFNG、SOD2、CTNNB1。結(jié)論:1.國內(nèi)外對肝癌易感相關(guān)基因的研究越來越多,研究機構(gòu)主要集中在東亞、地中海周邊這些肝癌高發(fā)地區(qū)。該領(lǐng)域的META分析也迅速增加,主要是中國研究者進行的META分析。2.大部分研究結(jié)論缺乏足夠的驗證,不管是GWAS研究還是預(yù)選基因研究都有其優(yōu)缺點,需要在更多大樣本、不同種族不同遺傳背景的研究中進行驗證。3.肝癌易感性相關(guān)基因GO分類及KEGG通路分析發(fā)現(xiàn)易感相關(guān)基因主要集中于:應(yīng)激反應(yīng)、炎癥與免疫反應(yīng)、DNA修復(fù)、細(xì)胞周期調(diào)控、解毒能力等基因集。4.從眾多的肝癌易感相關(guān)基因中發(fā)現(xiàn)了11個關(guān)鍵節(jié)點基因,由于其所具有的重要功能位置,值得后續(xù)進一步研究。第二部分 肝癌基因表達譜生物信息學(xué)分析研究背景和目的肝癌發(fā)病機制及治療一直是個研究熱點,但是相對于其他一些癌癥,肝癌的治療進展相對比較緩慢。肝癌患者診斷的時候多數(shù)已經(jīng)處于腫瘤晚期,手術(shù)根治的機會往往較小,而化療一直有效率不高,近年出現(xiàn)的以索拉非尼為代表的靶向治療為肝癌的生物靶向治療開辟了新的道路,但是索拉非尼的臨床有效率也不高,長期用藥后會面臨耐藥。索拉非尼以外的其他分子靶向藥物的研究雖然很多,但效果卻不理想。對肝癌發(fā)病及進展的分子機制進行深入的研究,尋找合適的分子靶點就成為改善肝癌療效的迫切需要。肝癌的形成過程就象很多其他的腫瘤,會經(jīng)歷一個從癌前病變、低度惡性到高度惡性病變這樣的演變過程,典型的肝癌大部分會經(jīng)歷肝炎、肝硬化、不典型增生結(jié)節(jié)、肝癌這樣一個發(fā)展演進過程。由于基因的不穩(wěn)定性,在這個過程中會不斷出現(xiàn)基因序列突變和表觀遺傳學(xué)改變,這些基因?qū)用娴母淖兌紩䦟?dǎo)致轉(zhuǎn)錄組層面的基因表達異常,并進而改變細(xì)胞的功能,造成細(xì)胞惡性程度的不斷演進。出現(xiàn)功能異常的基因很多,包括促進細(xì)胞增殖、抗凋亡、促進浸潤、轉(zhuǎn)移、血管生成、干細(xì)胞特性、腫瘤細(xì)胞能量代謝方式改變等方面的基因。另外還包括很多對細(xì)胞功能影響較小的基因改變,不同的致病原因?qū)е碌幕蚋淖円膊煌耆嗤?但是會有類似的病理過程,因此可能存在共同的分子病理學(xué)改變,存在共同的激活通路和異常基因。本研究就是通過納入各種病因背景的肝癌基因表達譜來尋找其中的共同分子改變。肝癌組織中出現(xiàn)的表達異;虮姸,如何找到其中的關(guān)鍵基因,以往的研究多數(shù)是針對單個基因,通過病例-對照方法研究某個基因與臨床表型的關(guān)系。但是,癌癥的發(fā)生發(fā)展同時涉及多個基因的功能改變,這些基因不是各自單獨行使功能,它們往往是處于各種調(diào)控通路內(nèi),通過影響整個通路的功能狀態(tài)來改變細(xì)胞的功能。在生物學(xué)過程中,某條通路中多個基因表達的輕微改變并導(dǎo)致的整條通路的功能變化,其生物學(xué)意義顯然遠(yuǎn)遠(yuǎn)高于單個基因的表達倍數(shù)改變。另外,由于很多基因同時調(diào)控多個通路,很多通路之間存在復(fù)雜的交叉網(wǎng)絡(luò)聯(lián)系。近來,系統(tǒng)生物學(xué)的方法已經(jīng)被越來越多的應(yīng)用到基因組的數(shù)據(jù)分析中,它是以基因或蛋白質(zhì)作為節(jié)點,以信號通路或生物過程基因集而非單個基因為考察對象,通過構(gòu)建相互作用模型,從基因的相互作用分析中得到比單個節(jié)點分析更多的信息。因此,可以通過基因表達產(chǎn)物相互作用關(guān)系構(gòu)建相互作用網(wǎng)絡(luò)模型,分析尋找網(wǎng)絡(luò)中的關(guān)鍵節(jié)點,這些關(guān)鍵節(jié)點對于某種異常狀態(tài)的細(xì)胞整體功能的維持有重要意義。通路分析結(jié)合相互作用網(wǎng)絡(luò)分析的方法可以找到那些表達變化不甚顯著,但是在整個通路中處于重要功能位置的基因,這些基因的輕度變化可能對下游的眾多基因功能產(chǎn)生顯著影響,這類基因在既往單純依靠單個基因表達水平來尋找目標(biāo)基因的分析方式中難以被發(fā)現(xiàn)。表達譜芯片可以同時研究組織的數(shù)萬個基因的表達情況,在全基因組層面對細(xì)胞的基因表達的變化進行全面比較,尋找與腫瘤的功能變化相關(guān)的各種基因。美國國立衛(wèi)生研究院生物信息中心基因芯片數(shù)據(jù)庫(GEO)是當(dāng)今最大、最全面的公共基因表達譜數(shù)據(jù)庫,至今已經(jīng)收集了100多萬樣本的表達譜原始數(shù)據(jù),對數(shù)據(jù)從不同的角度進行再分析,可以讓這些數(shù)據(jù)獲得更大的使用價值,也可以減少不要的重復(fù)研究。為了發(fā)現(xiàn)對維持肝癌細(xì)胞異常功能起關(guān)鍵作用的基因,本研究將從GEO數(shù)據(jù)庫下載的肝硬化、不典型增生結(jié)節(jié)和肝癌組織表達譜芯片分別與正常肝組織表達譜芯片進行對比,尋找差異表達基因,然后通過通路分析的方法篩選出肝癌特有的異常通路。另外通過提取差異通路中的基因,進行基因產(chǎn)物蛋白相互作用的分析,找到維持這些通路關(guān)鍵的節(jié)點基因。材料與方法:1.1從GEO數(shù)據(jù)庫檢索下載人類的正常肝組織、肝硬化組織、肝臟不典型增生結(jié)節(jié)組織、肝癌組織的表達譜數(shù)據(jù),芯片選擇GPL570([HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0)。1.2芯片數(shù)據(jù)的分析數(shù)據(jù)分析采用BRB-Array Tools軟件4.4.0-Beta_1版本。R version 3.0.2, hgu133plus2.db (Version:2.10.1)。將肝硬化組織、不典型增生結(jié)節(jié)肝組織、肝癌組織的表達譜分別與正常肝組織表達譜進行對比分析,尋找差異表達基因并分析。1.3蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建將KEGG和Biocarta通路分析顯示有顯著性差異的通路中的表達差異基因上傳至在線STRING 9.1軟件構(gòu)建由導(dǎo)入基因表達產(chǎn)物組成的蛋白質(zhì)相互作用網(wǎng)絡(luò)。1.4網(wǎng)絡(luò)可視化及關(guān)鍵基因的篩選將在線STRING 9.1軟件中所得相互作用網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)入Cytoscape 3.1.1軟件,將相應(yīng)網(wǎng)絡(luò)進一步可視化處理,同時利用其插件CentiScaPe 2.1,計算網(wǎng)絡(luò)及各個節(jié)點的拓?fù)涮匦?并篩選出關(guān)鍵節(jié)點。結(jié)果:根據(jù)納入標(biāo)準(zhǔn)從GEO數(shù)據(jù)庫納入分析的數(shù)據(jù)集11個,共計納入正常肝組織芯片39例,肝硬化組織芯片33例,不典型增生結(jié)節(jié)組織芯片17例,各期肝癌組織芯片286例。對差異表達基因進行GO分類、KEGG和Biocarta通路分析,顯示肝硬化組織、不典型增生結(jié)節(jié)組織和肝癌組織的顯著差異基因集基本沒有重疊,顯示三者間基因表達譜差異性顯著。肝癌基因表達譜差異基因的GO分類主要集中于:細(xì)胞周期的轉(zhuǎn)錄調(diào)控、DNA的復(fù)制、氨基酸的代謝、有絲分裂的調(diào)節(jié),這些均與腫瘤細(xì)胞的高生長狀態(tài)有關(guān)。KEGG通路分析顯示顯著富集通路集中于能量代謝、氨基酸代謝、DNA的復(fù)制、葉酸一碳單位庫、藥物與毒物代謝相關(guān)酶代謝通路,其中表達水平升高的通路有:hsa00670(葉酸的一碳代謝庫)、hsa03030(DNA的復(fù)制通路)、hsa04966(集合管酸分泌通路)、hsa05410(肥厚型心肌病通路)。Biocarta通路富集于細(xì)胞周期調(diào)控、DNA損傷與修復(fù)等通路。根據(jù)通路基因上下調(diào)計數(shù),高表達的富集通路有:h_vdrPathway(維生素D受體調(diào)控的基因表達通路)、h_g2Pathway(細(xì)胞周期中G2/M期檢查點通路)、h_ptc1 Pathway (Sonic Hedgehog受體Ptcl調(diào)節(jié)的細(xì)胞周期通路)、h_cdc25Pathway (DNA損傷應(yīng)答中的cdc25和chkl調(diào)控通路)、h_antisensePathway (RNA聚合酶Ⅲ轉(zhuǎn)錄通路)、h_atrbrcaPathway (BRCA1、BRCA2、ATR相關(guān)腫瘤易感性通路)、h_mcmPathway (DNA復(fù)制中的CDK調(diào)控通路)、h_stathminPathway(微管解聚蛋白Stathmin與乳腺癌抗微管藥耐藥通路)、h_rbPathway (DNA損傷應(yīng)答的RB瘤抑制/檢驗點通路)、h_smPathway(剪接體的組裝通路)、h_ckl Pathway(1型谷氨酸受體調(diào)節(jié)的Ckl/cdk5通路)、h_rac1 Pathway (Rac 1細(xì)胞運動的信號轉(zhuǎn)導(dǎo)通路)、h_EfpPathway(雌激素反應(yīng)蛋白Efp控制的細(xì)胞周期和乳腺癌生長通路)、h_cellcyclePathway(細(xì)胞周期蛋白和細(xì)胞周期的調(diào)控通路)。低表達的通路有:h_nuclearRsPathway(脂代謝和解毒相關(guān)核受體通路)、h_lectinPathway(凝集素誘導(dǎo)的補體途徑X_hcompPathway(補體通路)、h_ghrelinPathway(生長激素釋放肽通路:調(diào)節(jié)食物攝入量與能量平衡)。由于肝癌組表達譜差異基因的富集通路為不同于肝硬化和不典型增生結(jié)節(jié)的特有基因集,將肝癌芯片的KEGG和Biocarta通路分析顯示有顯著性差異的基因依序?qū)隨TRING、Cytoscape并分析后找到43個節(jié)點基因:CYP2C19、 ESR1、CYP2A6、CYP3A4、IGF1、FTCD、GSTA3、CYP2B6、PLG、CAT、HADH、 KNG1、F2、GOT2、PPARA、PKLR、SERPINC1、MDH2、PTGS2、POLE、SHMT2、 GOT1、CCND1、MDH1、CREBBP、CYP3A5、DHFR、SERPINE1、PPARG、 GSTA4、TP53、CDK2、CAD、GAPDH、ATIC、POLA1、PCNA、RFC4、POLD1、 TYMS、TGFB1、CDK1、PKM2經(jīng)過比對NCG 4.0數(shù)據(jù)庫,發(fā)現(xiàn)上述基因中ATIC、CCND1、CREBBP、FTCD、 MDH2、PPARG、TP53屬于多種腫瘤的驅(qū)動基因。結(jié)論:本研究通過對比肝硬化、不典型增生結(jié)節(jié)和肝癌3種病理狀態(tài)下的差異表達基因的GO分類和通路,顯示它們之間基本無重疊,顯示這3種狀態(tài)下的基因表達譜變化不是遞進式的積累,各自代表了不同的分子功能狀態(tài)。后續(xù)基因生物信息學(xué)分析納入的肝癌通路中的基因整體可以代表肝癌特有的病理分子狀態(tài)。通過肝癌基因表達譜芯片的生物信息學(xué)分析,發(fā)現(xiàn)了與肝癌發(fā)生發(fā)展有關(guān)的一批功能基因集和一批對于維持肝癌特有生物功能的分子網(wǎng)絡(luò)有重要作用的關(guān)鍵基因,這些基因經(jīng)過進一步研究后可能成為肝癌靶向治療的分子靶點。另外,本研究從通路與功能基因集的角度來分析差異表達基因數(shù)據(jù),能夠從全局的角度分析基因表達譜組學(xué)數(shù)據(jù),這比單純從單個基因的角度分析差異基因能更好的了解腫瘤細(xì)胞功能的改變,這種方法以后可以用于更多肝癌數(shù)據(jù)及其它疾病基因表達譜數(shù)據(jù)的分析。
【圖文】:
邐第一部分肝癌易感相關(guān)基因及生物信息學(xué)分析邐逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
邐第一部分肝癌易感相關(guān)基因及生物信息學(xué)分析邐逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
【學(xué)位授予單位】:南方醫(yī)科大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:R735.7
,
本文編號:2546330
【圖文】:
邐第一部分肝癌易感相關(guān)基因及生物信息學(xué)分析邐逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
邐第一部分肝癌易感相關(guān)基因及生物信息學(xué)分析邐逡逑preve打tion、International邋Journal邋of邋Cancer邋Int、Tumor邋Biology、Ge打e、逡逑Carcinogenesis、DNA邋and邋cell邋biology逡逑
【學(xué)位授予單位】:南方醫(yī)科大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:R735.7
,
本文編號:2546330
本文鏈接:http://sikaile.net/yixuelunwen/zlx/2546330.html
最近更新
教材專著