K562細(xì)胞分化過程中基因轉(zhuǎn)錄調(diào)控的跨組學(xué)整合研究
發(fā)布時(shí)間:2017-10-22 07:05
本文關(guān)鍵詞:K562細(xì)胞分化過程中基因轉(zhuǎn)錄調(diào)控的跨組學(xué)整合研究
更多相關(guān)文章: RNA測(cè)序技術(shù)(RNA-Seq) K562細(xì)胞 長(zhǎng)非編碼RNA(lncRNA) 基因芯片 基因間區(qū)長(zhǎng)非編碼RNA 紅系分化 巨核細(xì)胞分化 基因表達(dá)調(diào)控網(wǎng)絡(luò) 轉(zhuǎn)錄因子 miRNA
【摘要】:轉(zhuǎn)錄組是研究從基因組到表型的重要中間環(huán)節(jié)。研究轉(zhuǎn)錄組的高通量技術(shù)主要有兩類,一類是以雜交為基礎(chǔ)的基因芯片技術(shù),另一類是以測(cè)序?yàn)榛A(chǔ)的RNA測(cè)序技術(shù)(RNA-Seq)。基因芯片價(jià)格相對(duì)RNA-Seq便宜,但該方法存在很多缺陷,例如所檢測(cè)的物種必須是已知基因組序列的物種;雜交本身會(huì)產(chǎn)生高的背景值;比較不同實(shí)驗(yàn)組的基因表達(dá)水平比較困難,需要復(fù)雜的標(biāo)準(zhǔn)化方法。而RNA-Seq不需要探針;可以定量研究轉(zhuǎn)錄本,并能發(fā)現(xiàn)新的轉(zhuǎn)錄本;能夠分析基因組圖譜尚未完成的物種;具有信噪比高、特異性好、所需RNA樣品量少、應(yīng)用范圍廣等優(yōu)勢(shì)。RNA-Seq是轉(zhuǎn)錄組研究高效有力的分析工具,對(duì)真核生物轉(zhuǎn)錄組分析具有革命性作用。人們利用RNA-Seq研究基因結(jié)構(gòu)(基因邊界UTR和可變剪接)、基因變異(基因融合和編碼區(qū)SNP)、非編碼區(qū)域功能(長(zhǎng)非編碼RNA和microRNA前體)以及基因差異表達(dá)。隨著測(cè)序成本的降低,測(cè)序技術(shù)代替基因芯片技術(shù)是大勢(shì)所趨。血系分化能夠產(chǎn)生不同類型的細(xì)胞,影響著生物體的生長(zhǎng)和發(fā)育,研究白血病細(xì)胞系的分化機(jī)制對(duì)血系分化和治療血液疾病具有重要意義。K562細(xì)胞屬于紅白血病細(xì)胞系(erythroleukemia cell line),類似于巨核細(xì)胞(megakaryocytic cell,MK)和紅系細(xì)胞(erythroid cell,E)的前體細(xì)胞。K562細(xì)胞能夠被氯高鐵血紅素hemin誘導(dǎo)成紅系細(xì)胞,也能被丙二醇甲醚醋酸酯(phorbol-12-myristate-13-acetate,PMA)誘導(dǎo)成巨核細(xì)胞。因此,該細(xì)胞可以提供一個(gè)研究細(xì)胞分化及其轉(zhuǎn)錄調(diào)控的模型。細(xì)胞分化的轉(zhuǎn)錄調(diào)控機(jī)制十分復(fù)雜,多種生物因子包括microRNA(miRNA)和轉(zhuǎn)錄因子(TF)對(duì)基因的表達(dá)和翻譯具有重要的調(diào)控作用。本論文首先通過比較GEO數(shù)據(jù)庫(kù)中K562細(xì)胞紅系分化和巨核細(xì)胞分化基因芯片數(shù)據(jù),分析了K562細(xì)胞分化相關(guān)轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)。鑒于這兩組數(shù)據(jù)來(lái)自不同的實(shí)驗(yàn)組,其實(shí)驗(yàn)處理?xiàng)l件、時(shí)間各不相同,為了進(jìn)一步闡明紅系和巨核細(xì)胞分化的機(jī)制,本論文分別對(duì)K562細(xì)胞紅系分化(第2、6、24和48小時(shí))和巨核細(xì)胞分化(第2、6、24和48小時(shí))對(duì)應(yīng)的多個(gè)時(shí)間點(diǎn)進(jìn)行了RNA-Seq測(cè)序,同時(shí)結(jié)合K562細(xì)胞分化相關(guān)TF和mi RNA數(shù)據(jù),利用系統(tǒng)生物學(xué)方法在多個(gè)層次上研究K562細(xì)胞分化的轉(zhuǎn)錄調(diào)控機(jī)制,確認(rèn)了細(xì)胞分化密切相關(guān)的關(guān)鍵基因和信號(hào)通路,為進(jìn)一步研究相關(guān)基因的可變剪接、基因結(jié)構(gòu)、融合基因以及1ncRNA對(duì)其影響奠定了基礎(chǔ)。本論文還對(duì)K562細(xì)胞基因間區(qū)長(zhǎng)非編碼RNA (lincRNA)的穩(wěn)定性進(jìn)行了分析,為進(jìn)一步研究紅系和巨核細(xì)胞分化過程中1ncRNA的作用奠定了基礎(chǔ)?傊,本研究將有助于解釋基因組的功能,揭示細(xì)胞分化的轉(zhuǎn)錄調(diào)控機(jī)制,加深人們對(duì)基因表達(dá)和調(diào)控網(wǎng)絡(luò)復(fù)雜性的認(rèn)識(shí),促進(jìn)白血病的研究和治療。本論文的主要研究?jī)?nèi)容和成果如下:(1)K562細(xì)胞分化相關(guān)轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析我們通過分析GEO數(shù)據(jù)庫(kù)中K562細(xì)胞紅系分化的多個(gè)時(shí)間點(diǎn)基因芯片表達(dá)譜數(shù)據(jù)(GSE1036,Human Genome HU133A oligonucleotide array GeneChip),發(fā)現(xiàn)281個(gè)基因(332個(gè)探針)上調(diào)和402個(gè)基因(479個(gè)探針)下調(diào)。同樣,通過分析GEO數(shù)據(jù)庫(kù)中K562細(xì)胞巨核細(xì)胞分化的多個(gè)時(shí)間點(diǎn)基因芯片表達(dá)譜數(shù)據(jù)(GSE12736,Illumina HumanRef-8 Expression BeadChip),發(fā)現(xiàn)683個(gè)基因(755個(gè)探針)上調(diào)和735個(gè)基因(810個(gè)探針)下調(diào)。我們通過對(duì)比這兩組分化數(shù)據(jù)確定了紅系分化和巨核細(xì)胞分化中表達(dá)趨勢(shì)相反的88個(gè)基因(divergently expressed genes)。利用ChIP-Seq數(shù)據(jù)庫(kù)中3個(gè)血系分化特異性轉(zhuǎn)錄因子(GATA-2、GATA-1和PU.1)的全基因組綁定圖譜信息,構(gòu)建了基于這88個(gè)基因的轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò),并使用qPCR實(shí)驗(yàn)對(duì)其中部分基因進(jìn)行了驗(yàn)證。通過對(duì)該網(wǎng)絡(luò)進(jìn)行核心基因分析、次級(jí)網(wǎng)絡(luò)分析以及G0基因功能富集分析,發(fā)現(xiàn)7個(gè)核心基因(SPI1、GATA-2、GATA-1、ID2、JUN、 MYC和EGR-1)和5個(gè)相互作用的基因單元(ID2、MYC、 PIM1、STAT5B和SAC3D1)可能與紅系和巨核分化密切相關(guān),尤其是2個(gè)共有基因ID2和MYC。這些結(jié)果為紅系和巨核細(xì)胞分化研究提供了新的線索和思路。(2)K562細(xì)胞分化相關(guān)轉(zhuǎn)錄因子和miRNA共同介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析我們對(duì)hemin誘導(dǎo)K562細(xì)胞紅系分化過程中第2、6、24和48小時(shí)和PMA誘導(dǎo)K562細(xì)胞巨核分化過程中第2、6、24和48小時(shí)以及未處理K562細(xì)胞總共9個(gè)樣本分別進(jìn)行了RNA-Seq測(cè)序。9組測(cè)序數(shù)據(jù)分別進(jìn)行質(zhì)量控制、片段(read)匹配分析以及轉(zhuǎn)錄組重建。通過比較處理組和未處理組,在巨核分化過程中確認(rèn)了4,216個(gè)差異表達(dá)基因(基因芯片數(shù)據(jù)中只有1,418個(gè)差異表達(dá)基因),其中234個(gè)基因在所有檢測(cè)時(shí)間點(diǎn)都存在。同樣,在紅系分化過程中確定了1,826個(gè)差異表達(dá)基因(基因芯片數(shù)據(jù)中只有683個(gè)差異表達(dá)基因),大部分差異表達(dá)基因出現(xiàn)在24小時(shí)(1,506個(gè))和48小時(shí)(1,016個(gè))兩個(gè)檢測(cè)時(shí)間點(diǎn)。K562細(xì)胞巨核分化第2小時(shí)就出現(xiàn)了1,959個(gè)差異表達(dá)基因,而紅系分化直到第6小時(shí)才只出現(xiàn)了32個(gè)差異表達(dá)基因。而且紅系分化過程中差異表達(dá)基因數(shù)目比巨核分化過程中差異表達(dá)基因少2,390。這些結(jié)果表明巨核分化比紅系分化更劇烈。通過比較K562細(xì)胞紅系和巨核細(xì)胞分化的RNA-Seq數(shù)據(jù),有195個(gè)表達(dá)趨勢(shì)相反的基因(包括GATA-2EGR-1)顯著富集在notch信號(hào)通路。我們運(yùn)用K-means聚類方法對(duì)兩種分化過程分別進(jìn)行聚類分析,紅系分化過程中的差異表達(dá)基因被分為8類,其中第1類(下調(diào))和第4類(上調(diào))基因與細(xì)胞分化相關(guān);巨核分化過程中的差異表達(dá)基因被分為10類,其中第3類(上調(diào))和第8類(下調(diào))基因與細(xì)胞分化相關(guān)。通過分析SRA數(shù)據(jù)庫(kù)中紅系和巨核細(xì)胞分化相關(guān)的轉(zhuǎn)錄因子GATA-1、 GATA-2、EGR1、MYC、JUN和FOS的ChIP-Seq數(shù)據(jù),分別獲得其全基因組綁定圖譜。它們的靶基因中包含4,863個(gè)差異表達(dá)基因,分別為4,623個(gè)(EGR1),2,794個(gè)(FOS),1,724個(gè)(GATA1),3,477個(gè)(GATA2),3,403個(gè)(JUN)和3,215個(gè)(MYC)差異表達(dá)基因。我們還分析了這6個(gè)轉(zhuǎn)錄因子的差異表達(dá)靶基因在細(xì)胞分化相關(guān)的類中分布情況(包括紅系分化中第1和4類、巨核分化中第3和8類以及表達(dá)趨勢(shì)相反的基因)。多個(gè)轉(zhuǎn)錄因子的聯(lián)合作用更有利于調(diào)控同一個(gè)靶基因,有848個(gè)差異表達(dá)基因可以同時(shí)被上述6個(gè)轉(zhuǎn)錄因子綁定,其中40個(gè)基因是表達(dá)趨勢(shì)相反的基因。根據(jù)文獻(xiàn)分析,我們確定了14個(gè)紅系分化相關(guān)的miRNA和15個(gè)巨核分化相關(guān)的miRNA。運(yùn)用3個(gè)常用miRNA靶基因預(yù)測(cè)軟件(TargetScan、miRanda和PicTar2)分別預(yù)測(cè)每個(gè)miRNA的靶基因,其中至少兩個(gè)miRNA靶基因預(yù)測(cè)軟件都預(yù)測(cè)到的靶基因作為每個(gè)miRNA高度可信靶基因。我們獲得被紅系分化相關(guān)miRNA綁定的高度可信靶基因有3,846個(gè)(其中1,148個(gè)差異表達(dá)基因)和被巨核分化相關(guān)miRNA綁定的高度可信靶基因5,555個(gè)(其中1,670個(gè)差異表達(dá)基因)。我們分別分析了靶基因數(shù)目最多的5個(gè)紅系分化或巨核分化相關(guān)的miRNA在紅系分化的第1和4類、在巨核分化的第3和8類以及在表達(dá)趨勢(shì)相反的基因中的靶基因分布。我們也確定了243個(gè)差異表達(dá)基因可以同時(shí)被至少3個(gè)與紅系分化相關(guān)的miRNA綁定(其中56個(gè)基因也可以被6個(gè)轉(zhuǎn)錄因子同時(shí)綁定)和432個(gè)差異表達(dá)基因可以同時(shí)被至少3個(gè)與巨核分化相關(guān)的miRNA綁定(其中102個(gè)基因也可以被6個(gè)轉(zhuǎn)錄因子同時(shí)綁定)。根據(jù)以上研究結(jié)果,本論文構(gòu)建了一個(gè)由多個(gè)TFs和miRNAs聯(lián)合綁定的差異表達(dá)基因構(gòu)成的基因調(diào)控網(wǎng)絡(luò)。通過對(duì)該網(wǎng)絡(luò)進(jìn)行基因功能富集分析、提取網(wǎng)絡(luò)核心基因和次級(jí)網(wǎng)絡(luò)以及聚類分析,發(fā)現(xiàn)JUN位于這個(gè)網(wǎng)絡(luò)的中心,TGF-beta/Smad信號(hào)通路和Ras/ERK信號(hào)通路可能與紅系和巨核細(xì)胞分化密切相關(guān)。這項(xiàng)研究提供了一個(gè)跨組學(xué)整合分析K562細(xì)胞紅系和巨核分化的研究方法,促進(jìn)了紅系和巨核細(xì)胞分化機(jī)制的研究。(3)K562細(xì)胞lincRNA穩(wěn)定性研究lincRNA具有組織和細(xì)胞特異性表達(dá)特征,其穩(wěn)定性可能與它的生理學(xué)功能密切相關(guān)。然而,lincRNA穩(wěn)定性的機(jī)制尚不清楚。我們構(gòu)建了一個(gè)lincRNA分析流程,使用iseeRNA、CPAT、CPC和PhyloCSF軟件分別過濾具有編碼潛能的轉(zhuǎn)錄本,獲得了更嚴(yán)格的lincRNA數(shù)據(jù)集。本研究發(fā)現(xiàn)K562細(xì)胞lincRNA在基因組中每條染色體上普遍轉(zhuǎn)錄,暗示lincRNA在K562細(xì)胞中可能發(fā)揮重要作用。通過分析我們的K562細(xì)胞RNA-Seq數(shù)據(jù)(PH)和ENCODE組K562細(xì)胞RNA-Seq數(shù)據(jù)(GEO數(shù)據(jù)庫(kù)中GSM765405數(shù)據(jù)),在PH組中發(fā)現(xiàn)1,804個(gè)lincRNAs,其中包括1,564個(gè)注釋的lincRNAs口240個(gè)預(yù)測(cè)的新1incRNAs。在ENCODE組中發(fā)現(xiàn)1,587個(gè)lincRNAs,其中包括1,429個(gè)注釋的lincRNAs和158個(gè)預(yù)測(cè)的新lincRNAs。PH組中有87.4%的蛋白編碼基因也在ENCODE組中表達(dá),而PH組中只有44.1%的lincRNA在ENCODE組中表達(dá)。我們使用最小自由能分別在FPKM1和FPKM≥1兩種情況下評(píng)估了這兩組RNA-Seq數(shù)據(jù)中共有的lincRNAs(795個(gè))和分別獨(dú)有的lincRNAs(PH組1009個(gè),ENCODE組792個(gè))穩(wěn)定性,發(fā)現(xiàn)共有的lincRNA更穩(wěn)定,并使用半衰期實(shí)驗(yàn)對(duì)其中部分lincRNA的穩(wěn)定性分別進(jìn)行了驗(yàn)證。本論文通過分析不同轉(zhuǎn)錄組數(shù)據(jù)中共有的lincRNA和獨(dú)有的lincRNA,依據(jù)lincRNA穩(wěn)定性進(jìn)行分類,研究表明穩(wěn)定的lincRNA(共有的lincRNA)和不穩(wěn)定的lincRNA(獨(dú)有的lincRNA)可能參與不同的生物學(xué)進(jìn)程。
【關(guān)鍵詞】:RNA測(cè)序技術(shù)(RNA-Seq) K562細(xì)胞 長(zhǎng)非編碼RNA(lncRNA) 基因芯片 基因間區(qū)長(zhǎng)非編碼RNA 紅系分化 巨核細(xì)胞分化 基因表達(dá)調(diào)控網(wǎng)絡(luò) 轉(zhuǎn)錄因子 miRNA
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q78
【目錄】:
- 中文摘要4-7
- ABSTRACT7-14
- 第一章 緒論14-25
- 1.1 血系分化14-16
- 1.2 白血病K562細(xì)胞的分化16-17
- 1.3 多種生物因子對(duì)血系分化的影響17-23
- 1.3.1 差異表達(dá)基因以及轉(zhuǎn)錄本對(duì)血系分化的影響17-18
- 1.3.2 轉(zhuǎn)錄因子對(duì)血系分化的影響18-20
- 1.3.3 miRNA對(duì)血系分化的影響20-22
- 1.3.4 多種生物因子的聯(lián)合作用對(duì)血系分化的影響22-23
- 1.4 本課題的主要研究?jī)?nèi)容23-25
- 第二章 RNA-Seq數(shù)據(jù)分析策略研究25-43
- 2.1 引言25
- 2.2 RNA-Seq實(shí)驗(yàn)流程25-26
- 2.3 RNA-Seq數(shù)據(jù)分析26-42
- 2.3.1 已知參考基因組的RNA-Seq數(shù)據(jù)分析26-42
- 2.3.1.1 reads定位參考基因組27-28
- 2.3.1.2 可視化及注釋28-29
- 2.3.1.3 基因表達(dá)譜分析29-32
- 2.3.1.4 長(zhǎng)非編碼RNA研究32-33
- 2.3.1.5 可變剪接研究33-40
- 2.3.1.6 融合基因研究40-41
- 2.3.1.7 基因結(jié)構(gòu)研究41-42
- 2.3.2 未知基因組圖譜的RNA-Seq數(shù)據(jù)分析42
- 2.4 展望和挑戰(zhàn)42-43
- 第三章 K562細(xì)胞分化相關(guān)轉(zhuǎn)錄因子介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)研究43-52
- 3.1 引言43
- 3.2 材料與方法43-44
- 3.2.1 細(xì)胞培養(yǎng)43-44
- 3.2.2 RNA提取和定量PCR44
- 3.2.3 確認(rèn)差異表達(dá)基因44
- 3.2.4 構(gòu)建基因表達(dá)調(diào)控網(wǎng)絡(luò)44
- 3.2.5 確定核心基因和提取次級(jí)網(wǎng)絡(luò)44
- 3.2.6 基因功能富集分析44
- 3.3 結(jié)果44-46
- 3.3.1 確認(rèn)紅系和巨核細(xì)胞分化中基因表達(dá)趨勢(shì)相反的基因44-45
- 3.3.2 構(gòu)建基因調(diào)控網(wǎng)絡(luò)45
- 3.3.3 基因調(diào)控網(wǎng)絡(luò)分析45-46
- 3.4 討論46-51
- 3.5 小結(jié)51-52
- 第四章 K562細(xì)胞分化相關(guān)轉(zhuǎn)錄因子和miRNA共同介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析52-75
- 4.1 引言52-53
- 4.2 材料與方法53-61
- 4.2.1 細(xì)胞培養(yǎng)53
- 4.2.2 RNA提取、文庫(kù)構(gòu)建以及測(cè)序53
- 4.2.3 定量PCR實(shí)驗(yàn)53
- 4.2.4 確認(rèn)差異表達(dá)的蛋白編碼基因53-54
- 4.2.5 聚類分析和基因功能富集分析54
- 4.2.6 轉(zhuǎn)錄因子靶基因54-55
- 4.2.7 miRNA靶基因55-57
- 4.2.8 多生物因子聯(lián)合作用的基因調(diào)控網(wǎng)絡(luò)57-59
- 4.2.9 數(shù)據(jù)分析流程59-61
- 4.3 結(jié)果61-69
- 4.3.1 K562細(xì)胞紅系和巨核細(xì)胞分化轉(zhuǎn)錄組分析61-65
- 4.3.2 聚類分析和基因功能富集分析65-66
- 4.3.3 確認(rèn)轉(zhuǎn)錄因子靶基因66-67
- 4.3.4 確認(rèn)miRNA靶基因67-69
- 4.3.5 轉(zhuǎn)錄因子和miRNA共同介導(dǎo)的基因調(diào)控網(wǎng)絡(luò)分析69
- 4.4 討論69-74
- 4.5 小結(jié)74-75
- 第五章 K562細(xì)胞lincRNA穩(wěn)定性研究75-86
- 5.1 引言75-76
- 5.2 材料與方法76-77
- 5.2.1 細(xì)胞培養(yǎng)76
- 5.2.2 RNA提取、文庫(kù)構(gòu)建和Illumina測(cè)序76
- 5.2.3 預(yù)處理RNA-Seq數(shù)據(jù)76
- 5.2.4 獲得注釋lincRNA和新的lincRNA76-77
- 5.2.5 最小自由能77
- 5.2.6 qPCR測(cè)定半衰期77
- 5.3 結(jié)果77-81
- 5.3.1 lincRNA分析流程77
- 5.3.2 lincRNA特征77-78
- 5.3.3 比較lincRNA最小自由能和半衰期78-79
- 5.3.4 比較共有的蛋白編碼RNA和lincRNA最小自由能79-81
- 5.4 討論81-85
- 5.5 小結(jié)85-86
- 第六章 總結(jié)與展望86-88
- 6.1 總結(jié)86-87
- 6.2 展望87-88
- 參考文獻(xiàn)88-103
- 附錄103-117
- 致謝117
本文編號(hào):1077247
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/1077247.html
最近更新
教材專著