K562細胞分化過程中基因轉(zhuǎn)錄調(diào)控的跨組學(xué)整合研究
發(fā)布時間:2017-10-22 07:05
本文關(guān)鍵詞:K562細胞分化過程中基因轉(zhuǎn)錄調(diào)控的跨組學(xué)整合研究
更多相關(guān)文章: RNA測序技術(shù)(RNA-Seq) K562細胞 長非編碼RNA(lncRNA) 基因芯片 基因間區(qū)長非編碼RNA 紅系分化 巨核細胞分化 基因表達調(diào)控網(wǎng)絡(luò) 轉(zhuǎn)錄因子 miRNA
【摘要】:轉(zhuǎn)錄組是研究從基因組到表型的重要中間環(huán)節(jié)。研究轉(zhuǎn)錄組的高通量技術(shù)主要有兩類,一類是以雜交為基礎(chǔ)的基因芯片技術(shù),另一類是以測序為基礎(chǔ)的RNA測序技術(shù)(RNA-Seq);蛐酒瑑r格相對RNA-Seq便宜,但該方法存在很多缺陷,例如所檢測的物種必須是已知基因組序列的物種;雜交本身會產(chǎn)生高的背景值;比較不同實驗組的基因表達水平比較困難,需要復(fù)雜的標(biāo)準化方法。而RNA-Seq不需要探針;可以定量研究轉(zhuǎn)錄本,并能發(fā)現(xiàn)新的轉(zhuǎn)錄本;能夠分析基因組圖譜尚未完成的物種;具有信噪比高、特異性好、所需RNA樣品量少、應(yīng)用范圍廣等優(yōu)勢。RNA-Seq是轉(zhuǎn)錄組研究高效有力的分析工具,對真核生物轉(zhuǎn)錄組分析具有革命性作用。人們利用RNA-Seq研究基因結(jié)構(gòu)(基因邊界UTR和可變剪接)、基因變異(基因融合和編碼區(qū)SNP)、非編碼區(qū)域功能(長非編碼RNA和microRNA前體)以及基因差異表達。隨著測序成本的降低,測序技術(shù)代替基因芯片技術(shù)是大勢所趨。血系分化能夠產(chǎn)生不同類型的細胞,影響著生物體的生長和發(fā)育,研究白血病細胞系的分化機制對血系分化和治療血液疾病具有重要意義。K562細胞屬于紅白血病細胞系(erythroleukemia cell line),類似于巨核細胞(megakaryocytic cell,MK)和紅系細胞(erythroid cell,E)的前體細胞。K562細胞能夠被氯高鐵血紅素hemin誘導(dǎo)成紅系細胞,也能被丙二醇甲醚醋酸酯(phorbol-12-myristate-13-acetate,PMA)誘導(dǎo)成巨核細胞。因此,該細胞可以提供一個研究細胞分化及其轉(zhuǎn)錄調(diào)控的模型。細胞分化的轉(zhuǎn)錄調(diào)控機制十分復(fù)雜,多種生物因子包括microRNA(miRNA)和轉(zhuǎn)錄因子(TF)對基因的表達和翻譯具有重要的調(diào)控作用。本論文首先通過比較GEO數(shù)據(jù)庫中K562細胞紅系分化和巨核細胞分化基因芯片數(shù)據(jù),分析了K562細胞分化相關(guān)轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)。鑒于這兩組數(shù)據(jù)來自不同的實驗組,其實驗處理條件、時間各不相同,為了進一步闡明紅系和巨核細胞分化的機制,本論文分別對K562細胞紅系分化(第2、6、24和48小時)和巨核細胞分化(第2、6、24和48小時)對應(yīng)的多個時間點進行了RNA-Seq測序,同時結(jié)合K562細胞分化相關(guān)TF和mi RNA數(shù)據(jù),利用系統(tǒng)生物學(xué)方法在多個層次上研究K562細胞分化的轉(zhuǎn)錄調(diào)控機制,確認了細胞分化密切相關(guān)的關(guān)鍵基因和信號通路,為進一步研究相關(guān)基因的可變剪接、基因結(jié)構(gòu)、融合基因以及1ncRNA對其影響奠定了基礎(chǔ)。本論文還對K562細胞基因間區(qū)長非編碼RNA (lincRNA)的穩(wěn)定性進行了分析,為進一步研究紅系和巨核細胞分化過程中1ncRNA的作用奠定了基礎(chǔ)?傊,本研究將有助于解釋基因組的功能,揭示細胞分化的轉(zhuǎn)錄調(diào)控機制,加深人們對基因表達和調(diào)控網(wǎng)絡(luò)復(fù)雜性的認識,促進白血病的研究和治療。本論文的主要研究內(nèi)容和成果如下:(1)K562細胞分化相關(guān)轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析我們通過分析GEO數(shù)據(jù)庫中K562細胞紅系分化的多個時間點基因芯片表達譜數(shù)據(jù)(GSE1036,Human Genome HU133A oligonucleotide array GeneChip),發(fā)現(xiàn)281個基因(332個探針)上調(diào)和402個基因(479個探針)下調(diào)。同樣,通過分析GEO數(shù)據(jù)庫中K562細胞巨核細胞分化的多個時間點基因芯片表達譜數(shù)據(jù)(GSE12736,Illumina HumanRef-8 Expression BeadChip),發(fā)現(xiàn)683個基因(755個探針)上調(diào)和735個基因(810個探針)下調(diào)。我們通過對比這兩組分化數(shù)據(jù)確定了紅系分化和巨核細胞分化中表達趨勢相反的88個基因(divergently expressed genes)。利用ChIP-Seq數(shù)據(jù)庫中3個血系分化特異性轉(zhuǎn)錄因子(GATA-2、GATA-1和PU.1)的全基因組綁定圖譜信息,構(gòu)建了基于這88個基因的轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò),并使用qPCR實驗對其中部分基因進行了驗證。通過對該網(wǎng)絡(luò)進行核心基因分析、次級網(wǎng)絡(luò)分析以及G0基因功能富集分析,發(fā)現(xiàn)7個核心基因(SPI1、GATA-2、GATA-1、ID2、JUN、 MYC和EGR-1)和5個相互作用的基因單元(ID2、MYC、 PIM1、STAT5B和SAC3D1)可能與紅系和巨核分化密切相關(guān),尤其是2個共有基因ID2和MYC。這些結(jié)果為紅系和巨核細胞分化研究提供了新的線索和思路。(2)K562細胞分化相關(guān)轉(zhuǎn)錄因子和miRNA共同介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析我們對hemin誘導(dǎo)K562細胞紅系分化過程中第2、6、24和48小時和PMA誘導(dǎo)K562細胞巨核分化過程中第2、6、24和48小時以及未處理K562細胞總共9個樣本分別進行了RNA-Seq測序。9組測序數(shù)據(jù)分別進行質(zhì)量控制、片段(read)匹配分析以及轉(zhuǎn)錄組重建。通過比較處理組和未處理組,在巨核分化過程中確認了4,216個差異表達基因(基因芯片數(shù)據(jù)中只有1,418個差異表達基因),其中234個基因在所有檢測時間點都存在。同樣,在紅系分化過程中確定了1,826個差異表達基因(基因芯片數(shù)據(jù)中只有683個差異表達基因),大部分差異表達基因出現(xiàn)在24小時(1,506個)和48小時(1,016個)兩個檢測時間點。K562細胞巨核分化第2小時就出現(xiàn)了1,959個差異表達基因,而紅系分化直到第6小時才只出現(xiàn)了32個差異表達基因。而且紅系分化過程中差異表達基因數(shù)目比巨核分化過程中差異表達基因少2,390。這些結(jié)果表明巨核分化比紅系分化更劇烈。通過比較K562細胞紅系和巨核細胞分化的RNA-Seq數(shù)據(jù),有195個表達趨勢相反的基因(包括GATA-2EGR-1)顯著富集在notch信號通路。我們運用K-means聚類方法對兩種分化過程分別進行聚類分析,紅系分化過程中的差異表達基因被分為8類,其中第1類(下調(diào))和第4類(上調(diào))基因與細胞分化相關(guān);巨核分化過程中的差異表達基因被分為10類,其中第3類(上調(diào))和第8類(下調(diào))基因與細胞分化相關(guān)。通過分析SRA數(shù)據(jù)庫中紅系和巨核細胞分化相關(guān)的轉(zhuǎn)錄因子GATA-1、 GATA-2、EGR1、MYC、JUN和FOS的ChIP-Seq數(shù)據(jù),分別獲得其全基因組綁定圖譜。它們的靶基因中包含4,863個差異表達基因,分別為4,623個(EGR1),2,794個(FOS),1,724個(GATA1),3,477個(GATA2),3,403個(JUN)和3,215個(MYC)差異表達基因。我們還分析了這6個轉(zhuǎn)錄因子的差異表達靶基因在細胞分化相關(guān)的類中分布情況(包括紅系分化中第1和4類、巨核分化中第3和8類以及表達趨勢相反的基因)。多個轉(zhuǎn)錄因子的聯(lián)合作用更有利于調(diào)控同一個靶基因,有848個差異表達基因可以同時被上述6個轉(zhuǎn)錄因子綁定,其中40個基因是表達趨勢相反的基因。根據(jù)文獻分析,我們確定了14個紅系分化相關(guān)的miRNA和15個巨核分化相關(guān)的miRNA。運用3個常用miRNA靶基因預(yù)測軟件(TargetScan、miRanda和PicTar2)分別預(yù)測每個miRNA的靶基因,其中至少兩個miRNA靶基因預(yù)測軟件都預(yù)測到的靶基因作為每個miRNA高度可信靶基因。我們獲得被紅系分化相關(guān)miRNA綁定的高度可信靶基因有3,846個(其中1,148個差異表達基因)和被巨核分化相關(guān)miRNA綁定的高度可信靶基因5,555個(其中1,670個差異表達基因)。我們分別分析了靶基因數(shù)目最多的5個紅系分化或巨核分化相關(guān)的miRNA在紅系分化的第1和4類、在巨核分化的第3和8類以及在表達趨勢相反的基因中的靶基因分布。我們也確定了243個差異表達基因可以同時被至少3個與紅系分化相關(guān)的miRNA綁定(其中56個基因也可以被6個轉(zhuǎn)錄因子同時綁定)和432個差異表達基因可以同時被至少3個與巨核分化相關(guān)的miRNA綁定(其中102個基因也可以被6個轉(zhuǎn)錄因子同時綁定)。根據(jù)以上研究結(jié)果,本論文構(gòu)建了一個由多個TFs和miRNAs聯(lián)合綁定的差異表達基因構(gòu)成的基因調(diào)控網(wǎng)絡(luò)。通過對該網(wǎng)絡(luò)進行基因功能富集分析、提取網(wǎng)絡(luò)核心基因和次級網(wǎng)絡(luò)以及聚類分析,發(fā)現(xiàn)JUN位于這個網(wǎng)絡(luò)的中心,TGF-beta/Smad信號通路和Ras/ERK信號通路可能與紅系和巨核細胞分化密切相關(guān)。這項研究提供了一個跨組學(xué)整合分析K562細胞紅系和巨核分化的研究方法,促進了紅系和巨核細胞分化機制的研究。(3)K562細胞lincRNA穩(wěn)定性研究lincRNA具有組織和細胞特異性表達特征,其穩(wěn)定性可能與它的生理學(xué)功能密切相關(guān)。然而,lincRNA穩(wěn)定性的機制尚不清楚。我們構(gòu)建了一個lincRNA分析流程,使用iseeRNA、CPAT、CPC和PhyloCSF軟件分別過濾具有編碼潛能的轉(zhuǎn)錄本,獲得了更嚴格的lincRNA數(shù)據(jù)集。本研究發(fā)現(xiàn)K562細胞lincRNA在基因組中每條染色體上普遍轉(zhuǎn)錄,暗示lincRNA在K562細胞中可能發(fā)揮重要作用。通過分析我們的K562細胞RNA-Seq數(shù)據(jù)(PH)和ENCODE組K562細胞RNA-Seq數(shù)據(jù)(GEO數(shù)據(jù)庫中GSM765405數(shù)據(jù)),在PH組中發(fā)現(xiàn)1,804個lincRNAs,其中包括1,564個注釋的lincRNAs口240個預(yù)測的新1incRNAs。在ENCODE組中發(fā)現(xiàn)1,587個lincRNAs,其中包括1,429個注釋的lincRNAs和158個預(yù)測的新lincRNAs。PH組中有87.4%的蛋白編碼基因也在ENCODE組中表達,而PH組中只有44.1%的lincRNA在ENCODE組中表達。我們使用最小自由能分別在FPKM1和FPKM≥1兩種情況下評估了這兩組RNA-Seq數(shù)據(jù)中共有的lincRNAs(795個)和分別獨有的lincRNAs(PH組1009個,ENCODE組792個)穩(wěn)定性,發(fā)現(xiàn)共有的lincRNA更穩(wěn)定,并使用半衰期實驗對其中部分lincRNA的穩(wěn)定性分別進行了驗證。本論文通過分析不同轉(zhuǎn)錄組數(shù)據(jù)中共有的lincRNA和獨有的lincRNA,依據(jù)lincRNA穩(wěn)定性進行分類,研究表明穩(wěn)定的lincRNA(共有的lincRNA)和不穩(wěn)定的lincRNA(獨有的lincRNA)可能參與不同的生物學(xué)進程。
【關(guān)鍵詞】:RNA測序技術(shù)(RNA-Seq) K562細胞 長非編碼RNA(lncRNA) 基因芯片 基因間區(qū)長非編碼RNA 紅系分化 巨核細胞分化 基因表達調(diào)控網(wǎng)絡(luò) 轉(zhuǎn)錄因子 miRNA
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:Q78
【目錄】:
- 中文摘要4-7
- ABSTRACT7-14
- 第一章 緒論14-25
- 1.1 血系分化14-16
- 1.2 白血病K562細胞的分化16-17
- 1.3 多種生物因子對血系分化的影響17-23
- 1.3.1 差異表達基因以及轉(zhuǎn)錄本對血系分化的影響17-18
- 1.3.2 轉(zhuǎn)錄因子對血系分化的影響18-20
- 1.3.3 miRNA對血系分化的影響20-22
- 1.3.4 多種生物因子的聯(lián)合作用對血系分化的影響22-23
- 1.4 本課題的主要研究內(nèi)容23-25
- 第二章 RNA-Seq數(shù)據(jù)分析策略研究25-43
- 2.1 引言25
- 2.2 RNA-Seq實驗流程25-26
- 2.3 RNA-Seq數(shù)據(jù)分析26-42
- 2.3.1 已知參考基因組的RNA-Seq數(shù)據(jù)分析26-42
- 2.3.1.1 reads定位參考基因組27-28
- 2.3.1.2 可視化及注釋28-29
- 2.3.1.3 基因表達譜分析29-32
- 2.3.1.4 長非編碼RNA研究32-33
- 2.3.1.5 可變剪接研究33-40
- 2.3.1.6 融合基因研究40-41
- 2.3.1.7 基因結(jié)構(gòu)研究41-42
- 2.3.2 未知基因組圖譜的RNA-Seq數(shù)據(jù)分析42
- 2.4 展望和挑戰(zhàn)42-43
- 第三章 K562細胞分化相關(guān)轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)研究43-52
- 3.1 引言43
- 3.2 材料與方法43-44
- 3.2.1 細胞培養(yǎng)43-44
- 3.2.2 RNA提取和定量PCR44
- 3.2.3 確認差異表達基因44
- 3.2.4 構(gòu)建基因表達調(diào)控網(wǎng)絡(luò)44
- 3.2.5 確定核心基因和提取次級網(wǎng)絡(luò)44
- 3.2.6 基因功能富集分析44
- 3.3 結(jié)果44-46
- 3.3.1 確認紅系和巨核細胞分化中基因表達趨勢相反的基因44-45
- 3.3.2 構(gòu)建基因調(diào)控網(wǎng)絡(luò)45
- 3.3.3 基因調(diào)控網(wǎng)絡(luò)分析45-46
- 3.4 討論46-51
- 3.5 小結(jié)51-52
- 第四章 K562細胞分化相關(guān)轉(zhuǎn)錄因子和miRNA共同介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析52-75
- 4.1 引言52-53
- 4.2 材料與方法53-61
- 4.2.1 細胞培養(yǎng)53
- 4.2.2 RNA提取、文庫構(gòu)建以及測序53
- 4.2.3 定量PCR實驗53
- 4.2.4 確認差異表達的蛋白編碼基因53-54
- 4.2.5 聚類分析和基因功能富集分析54
- 4.2.6 轉(zhuǎn)錄因子靶基因54-55
- 4.2.7 miRNA靶基因55-57
- 4.2.8 多生物因子聯(lián)合作用的基因調(diào)控網(wǎng)絡(luò)57-59
- 4.2.9 數(shù)據(jù)分析流程59-61
- 4.3 結(jié)果61-69
- 4.3.1 K562細胞紅系和巨核細胞分化轉(zhuǎn)錄組分析61-65
- 4.3.2 聚類分析和基因功能富集分析65-66
- 4.3.3 確認轉(zhuǎn)錄因子靶基因66-67
- 4.3.4 確認miRNA靶基因67-69
- 4.3.5 轉(zhuǎn)錄因子和miRNA共同介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析69
- 4.4 討論69-74
- 4.5 小結(jié)74-75
- 第五章 K562細胞lincRNA穩(wěn)定性研究75-86
- 5.1 引言75-76
- 5.2 材料與方法76-77
- 5.2.1 細胞培養(yǎng)76
- 5.2.2 RNA提取、文庫構(gòu)建和Illumina測序76
- 5.2.3 預(yù)處理RNA-Seq數(shù)據(jù)76
- 5.2.4 獲得注釋lincRNA和新的lincRNA76-77
- 5.2.5 最小自由能77
- 5.2.6 qPCR測定半衰期77
- 5.3 結(jié)果77-81
- 5.3.1 lincRNA分析流程77
- 5.3.2 lincRNA特征77-78
- 5.3.3 比較lincRNA最小自由能和半衰期78-79
- 5.3.4 比較共有的蛋白編碼RNA和lincRNA最小自由能79-81
- 5.4 討論81-85
- 5.5 小結(jié)85-86
- 第六章 總結(jié)與展望86-88
- 6.1 總結(jié)86-87
- 6.2 展望87-88
- 參考文獻88-103
- 附錄103-117
- 致謝117
本文編號:1077247
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/1077247.html
最近更新
教材專著