短序列增強子和Alu重復序列影響基因表達的實驗研究和生物信息學分析
發(fā)布時間:2018-06-20 19:05
本文選題:增強子 + 生物信息學 ; 參考:《河北醫(yī)科大學》2015年博士論文
【摘要】:目的:順式作用元件是位于DNA分子中調(diào)節(jié)基因表達的序列,對基因表達調(diào)節(jié)有重要的作用,但是這些順式作用元件的功能及調(diào)節(jié)基因表達的作用機制大部分仍然未被闡明。研究順式作用元件調(diào)控影響基因表達的作用機制,對于研究生物表觀遺傳、分化、衰老和腫瘤發(fā)生等生物學現(xiàn)象具有重要的意義。增強子是一種活化基因的順式作用元件,能夠增強基因表達,在調(diào)節(jié)基因表達過程中發(fā)揮著重要作用;虮磉_調(diào)節(jié)是當前生物學中的一個焦點問題,與衰老,分化,腫瘤發(fā)生等多種生物學現(xiàn)象相關。為了更深地理解這些生物學現(xiàn)象,必須闡明基因表達調(diào)節(jié)的機制。雖然基因表達調(diào)節(jié)機制非常復雜,但是可以用簡化的系統(tǒng)進行研究。為了研究短序列增強子活化基因的作用機制,我們在前期工作中建立了一個簡化的研究系統(tǒng):利用Alu元件抑制GFP報告基因表達,用綠色熒光蛋白表達系統(tǒng)研究短序列DNA及其衍生序列的增強子活性。本研究室在前期工作中,由14個拷貝的Alu同向串聯(lián)(Alu×14)插入到p EGFP-C1質(zhì)粒中GFP報告基因的下游,從而構(gòu)建C1-Alu×14質(zhì)粒。我們發(fā)現(xiàn)將C1-Alu×14質(zhì)粒瞬時轉(zhuǎn)染He La細胞后,Alu×14序列對GFP報告基因表達具有顯著抑制作用;短序列AA(5′-GTGAAATAAATGCAAATAAAGT)插入C1-Alu×14質(zhì)粒中GFP基因和Alu×14序列之間構(gòu)建的C1-AA×2-Alu×14質(zhì)粒瞬時轉(zhuǎn)染He La細胞后,短序列AA可以部分解除Alu×14序列對GFP報告基因表達的抑制作用,表現(xiàn)出一定的增強子活性。在本研究中,我們重點研究的是AA序列及其突變序列調(diào)節(jié)GFP報告基因表達的作用機制及增強子序列的結(jié)構(gòu)對基因表達所產(chǎn)生的影響。Alu元件是人的主要短散布核元件(SINE),有一百多萬拷貝,大約占全部人類基因組的十分之一,在生物進化過程中SINE一直是強制存在,因此多數(shù)學者認為SINE具有重要的生物學功能。然而,至今為止多數(shù)Alu元件的生物學功能仍未闡明。許多證據(jù)表明Alu元件屬于沉默子,其可以抑制基因表達。在細胞核中Alu RNA作為轉(zhuǎn)錄協(xié)同抑制物,是反義轉(zhuǎn)錄組中最多的部分,具有以順式作用或者反式作用的方式下調(diào)正義表達的可能性。我們的前期研究表明Alu元件通過觸發(fā)染色質(zhì)緊密包裝抑制GFP報告基因表達。雖然認為Alu元件屬于沉默子,但是在看家基因和高表達染色體中,Alu元件含量卻十分豐富,這個矛盾現(xiàn)象長期困擾著生物學家。為了研究基因組中Alu元件的生物學意義,我們做了一些關于Alu元件的實驗研究和生物信息學分析。方法:1 DNA模板及引物的合成。委托北京賽百盛基因技術(shù)有限公司合成攜帶適當?shù)暮怂醿?nèi)切酶識別位點的引物及DNA模板。本論文中所用到的引物及DNA模板的名稱和具體序列參見論文的附表。2表達載體的構(gòu)建。2.1 AA及其衍生序列相關表達載體的構(gòu)建。設計帶有合適的2個限制性內(nèi)切酶(Ecor I/Xba I或Kpn I/Nhe I)酶切位點引物,以AA及其衍生序列為模板進行PCR擴增出攜有4個限制性內(nèi)切酶Ecor I/Xba I和Kpn I/Nhe I酶切位點的DNA序列。利用限制性內(nèi)切酶Ecor I/Kpn I分別雙酶切AA及其衍生序列PCR產(chǎn)物和C1-Alu14質(zhì)粒,隨后用T4 DNA Ligase連接同時帶有相同粘性末端的AA及其衍生序列小片段和C1-Alu14表達載體大片段,隨即通過表達載體轉(zhuǎn)化、質(zhì)粒提取等步驟獲得構(gòu)建插入一個AA及其衍生序列的表達載體。分別用HindⅢ/NheⅠ和HindⅢ/XbaⅠ雙酶切含有一個AA及其衍生序列的表達載體,獲取AA及其衍生序列的目的基因小片段和C1-AA-Alu14表達載體大片段,通過T4 DNA Ligase連接以上AA及其衍生序列的目的基因小片段和C1-AA-Alu14表達載體大片段,從而獲得含有兩個AA及其衍生序列的表達載體。2.2 Alu相關表達載體的構(gòu)建。Alu序列為通過PCR擴增含有人染色體Xq13.1中的Alu序列的RP11-29107克隆模板獲得;Lac Z序列(J01636.1)擴增自大腸桿菌;4TMI(5′-GTGAAATAAATGCTTTTTTTGT)是我們在前期研究中發(fā)現(xiàn)的一個具有較高增強子活性的22nt寡核苷酸序列;CMV啟動子擴增自質(zhì)粒pc DNA3.1+(1-882bp),其包含完整的CMV啟動子。質(zhì)粒的構(gòu)建方法同前,所構(gòu)建的表達載體均通過酶切和基因測序(委托北京諾賽基因組研究中心有限公司完成)進行鑒定。3細胞轉(zhuǎn)染包括瞬時轉(zhuǎn)染和穩(wěn)定轉(zhuǎn)染。用脂質(zhì)體轉(zhuǎn)染試劑LipofectamineTM2000瞬時轉(zhuǎn)染處于對數(shù)生長期的He La細胞,利用G418試劑篩選獲得穩(wěn)定轉(zhuǎn)染的He La細胞,詳細方法見論文正文。4熒光顯微鏡觀察將重組質(zhì)粒表達載體轉(zhuǎn)染Hela細胞后,在熒光顯微鏡下觀察計數(shù)GFP熒光陽性細胞數(shù)。首先用熒光顯微鏡在紫外光照射下計數(shù)視野中GFP陽性細胞數(shù),然后再在白光照射下記錄相同視野中的細胞總數(shù),每個樣本至少記錄500個細胞,計算GFP細胞陽性率。實驗數(shù)據(jù)結(jié)果用均數(shù)±標準差(x±SD)表示。GFP熒光細胞陽性率=(GFP熒光陽性細胞個數(shù)/相同視野中細胞總數(shù))×100%5 RT-PCR利用Trizol法從He La細胞中提取總RNA,用DNase I將總RNA中的DNA降解后,通過9-nt隨機引物和逆轉(zhuǎn)錄酶等構(gòu)成的逆轉(zhuǎn)錄體系將RNA逆轉(zhuǎn)錄為c DNA,然后以逆轉(zhuǎn)錄產(chǎn)物為模板,進行PCR擴增GFP基因。6聚丙烯酰胺凝膠電泳(PAGE)通過PAGE觀察22nt寡核苷酸構(gòu)象。為確定AA序列是否通過非典型堿基互補形成二級結(jié)構(gòu),我們委托基因合成公司合成了七個長度為22nt的DNA單鏈,用PAGE和銀染法觀察這七個DNA單鏈的構(gòu)象,本實驗采用含T堿基豐富的序列作為PAGE的marker。在20%的聚丙烯酰胺凝膠中進行不同溫度、不同離子強度、變性膠和非變性膠條件下的PAGE,銀染后,觀察DNA單鏈在不同條件下的電泳遷移率,通過DNA單鏈的電泳遷移率,推測其是否具有形成不同二級結(jié)構(gòu)的能力,從而推測基因空間構(gòu)象和基因生物學功能之間的關系。7流式細胞儀檢測通過流式細胞儀檢測轉(zhuǎn)染質(zhì)粒后的He La細胞中GFP的表達情況,此項工作委托河北醫(yī)科大學第四醫(yī)院科研中心完成。熒光表達強度用GFP標記量表示。GFP標記量等于陽性細胞均道值乘以陽性細胞百分率(超過門值的陽性細胞百分數(shù)),再乘以100。GFP標記量=XM×Gated%×1008生物信息學分析獲取五個不同物種(人、狗、貓、大鼠、小鼠)的α珠蛋白基因簇及其側(cè)翼序列的基因序列,這些序列來源于以下數(shù)據(jù)庫:Homo sapiens(assembly GRCh38)(http://www.ncbi.nlm.nih.gov/genome/?term=hu man);Canis lupus familiaris(assembly Can Fam3.1)(http://www.ncbi.nlm.nih.gov/genome/?term=dog);Felis catus(assembly Felis_catus-6.2)(http://www.ncbi.nlm.nih.gov/genome/?term=cat);Rattus norvegicus(assembly Rnor_6.0)(http://www.ncbi.nlm.nih.gov/genome/?term=rat);Mus musculus(assembly GRCm38.p2)(http://www.ncbi.nlm.nih.gov/genome/?term=mouse。利用重復序列遮蔽服務器(Repeat Masker server)(http://www.repeatmasker.org)檢測α珠蛋白基因簇及其側(cè)翼序列中的重復序列。人類α珠蛋白基因簇及其側(cè)翼序列突變會導致血紅蛋白病,因此我們從以下數(shù)據(jù)庫獲取了人血紅蛋白病患者的α珠蛋白基因簇及其側(cè)翼序列的基因突變數(shù)據(jù):Hb Var database(http://globin.bx.psu.edu/hbvar/menu.html)。結(jié)果1質(zhì)粒表達載體的構(gòu)建及鑒定通過酶切和基因測序兩種檢測手段鑒定本文實驗中所用的質(zhì)粒表達載體均正確。2 AA及其衍生序列對GFP基因表達的影響質(zhì)粒轉(zhuǎn)染He La細胞后,在熒光顯微鏡下觀察計數(shù),通過比較熒光陽性細胞率,我們發(fā)現(xiàn)22R,4TMI,AA可以活化GFP報告基因,而4T,TT,7Pie A和7Pie T不能活化GFP報告基因,結(jié)果具有統(tǒng)計學意義。AA序列中的T堿基逐一突變?yōu)锳,G,C而衍生的15個序列均具有增強子活性,其中大部分突變序列的增強子活性略低于AA序列,結(jié)果具有統(tǒng)計學意義。3 AA序列在轉(zhuǎn)錄水平增強GFP報告基因表達AA序列活化GFP報告基因能力強于7pie A序列,為了研究AA序列活化GFP報告基因的機制,我們利用RT-PCR方法檢測GFP RNA表達水平。為增加實驗的準確性,我們采用三對引物擴增不同位置的GFP RNA。研究發(fā)現(xiàn)AA序列比7pie A和Alu14序列能夠誘導更多的GFP RNA。這些結(jié)果與GFP蛋白檢測結(jié)果一致,從而說明質(zhì)粒中插入AA序列可以增加細胞內(nèi)GFP RNA含量。由于基因的轉(zhuǎn)錄增加或者RNA降解減慢都可能造成細胞內(nèi)RNA含量增加,即GFP RNA含量增加可能發(fā)生在轉(zhuǎn)錄水平,也可能發(fā)生在RNA降解水平。為了研究這個問題,我們利用放線菌素D抑制RNA生成,再采用RT-PCR檢測GFP RNA含量。在相同實驗條件下,假設細胞中的RNA降解速率相同,實驗發(fā)現(xiàn)質(zhì)粒中插入AA序列的GFP RNA含量要高于質(zhì)粒中插入7pie A序列的GFP RNA含量,這些結(jié)果表明,AA序列誘導更多GFP報告基因蛋白表達是GFP報告基因轉(zhuǎn)錄增加的結(jié)果,即AA序列增強GFP報告基因表達發(fā)生在轉(zhuǎn)錄水平。4利用PAGE觀察DNA寡核苷酸構(gòu)象在室溫條件的PAGE中,利用20%變性膠PAGE我們發(fā)現(xiàn)AA等7個22 nt寡核苷酸序列的電泳遷移率不同,從快到慢依次為7pie AAA22R4T4TMITT7pie T。7pie A,AA,22R,4T,4TMI,TT,7pie T序列中A堿基的數(shù)目分別為14,12,8,7,6,2,0。通過相關性分析我們發(fā)現(xiàn)A堿基的數(shù)目多少與電泳遷移率快慢成正比關系。由此表明含A堿基較多的序列比含T堿基較多的序列的電泳遷移率要快。然而,在1×TBE和低溫條件的PAGE中,4T序列的電泳遷移率最快,其遷移速度快于15 nt marker的遷移速度;在1×TB-10 m M Mg Cl2和室溫條件的PAGE中,22R,4T,AA,7pie A和4TMI的電泳遷移率介于22 nt markers和19 nt markers之間;在1×TB-10 m M Mg Cl2和低溫條件的PAGE中,22R,4T,AA,7pie A和4TMI的電泳遷移率介于19 nt markers和15 nt markers之間。5表達載體中正義Alu和反義Alu組合活化GFP報告基因?qū)⒈磉_載體C1-4TMI-Alu×14-CMV-Alu×2(4TMI-Alu-sense-sense),C1-4TMI-Alu×14-CMV-Alu×2as(4TMI-Alu-sense-antisense)穩(wěn)定轉(zhuǎn)染He La細胞后,經(jīng)流式細胞儀檢測發(fā)現(xiàn)轉(zhuǎn)染4TMI-Alu-sense-antisense質(zhì)粒的GFP標記量是轉(zhuǎn)染4TMI-Alu-sense-sense質(zhì)粒GFP標記量的4倍,其中轉(zhuǎn)染4TMI-Alu-sense-antisense質(zhì)粒所產(chǎn)生的GFP標記量最高,這表明正義Alu和反義Alu組合可以活化GFP報告基因,促進GFP報告基因表達。6正義Alu和反義Alu組合活化GFP報告基因具有細胞種屬來源依賴性將表達載體C1-4TMI-Alu×14-CMV-Alu×2(4TMI-Alu-sense-sense),C1-4TMI-Alu×14-CMV-Alu×2as(4TMI-Alu-sense-antisense)穩(wěn)定轉(zhuǎn)染He La細胞后,經(jīng)流式檢測可見4TMI-Alu-sense-antisense明顯活化GFP報告基因,而以上質(zhì)粒轉(zhuǎn)染BHK21細胞,卻沒有見到明顯的基因活化作用。7正義Alu和反義Alu活化GFP報告基因具有增強子依賴性無增強子、1個增強子、2個增強子表達載體轉(zhuǎn)染He La細胞誘導的GFP標記量之間的比率為1:3.3:12.7,此結(jié)果表明表達載體誘導GFP標記量隨著增強子數(shù)目增加而上升。8正義Alu與反義Alu適當搭配活化GFP報告基因需要足夠多的Alu拷貝數(shù)當5’端Alu上游與3’端Alu上游均存在增強子時,Alu-sense-antisense表達載體隨著3’端Alu拷貝數(shù)的增加,表達載體誘導的GFP標記量上升。由此可以看出正義Alu與反義Alu適當組合活化GFP報告基因需要足夠多的Alu拷貝數(shù)。9正義和反義Alu組合在穩(wěn)定轉(zhuǎn)染條件下才能夠活化GFP報告基因Alu-sense-sense和Alu-sense-antisense表達載體在瞬時轉(zhuǎn)染He La細胞48小時時GFP標記量達到最高峰,兩組表達載體所誘導的GFP標記量之間沒有明顯的差異。然而Alu-sense-antisense表達載體穩(wěn)定轉(zhuǎn)染He La細胞24天后開始表現(xiàn)出明顯的活化GFP報告基因能力,說明正義和反義Alu適當組合活化GFP報告基因必須在穩(wěn)定轉(zhuǎn)染條件下才能夠?qū)崿F(xiàn)。10不同物種α珠蛋白基因簇重復序列分布經(jīng)生物信息學發(fā)現(xiàn)人類及其他四種動物α珠蛋白基因簇中SINE含量豐富,SINE在α珠蛋白基因簇中分布明顯高于其在β珠蛋白基因簇中分布,α珠蛋白基因簇HBZ基因上下游100kb范圍內(nèi)的SINE基礎頻率明顯高于其在全基因組分布的平均值。這表明SINE在五個物種的α珠蛋白基因簇中可能發(fā)揮同樣作用,這與α珠蛋白基因表達可能有關。11基因大片段缺失導致的人類血紅蛋白病經(jīng)對人類α珠蛋白基因簇基因缺失數(shù)據(jù)的生物信息學分析發(fā)現(xiàn),很多類型的基因缺失突變可以導致人類血紅蛋白病,然而在眾多基因缺失病例中,我們發(fā)現(xiàn)唯獨沒有保留HBA1基因同時HBA1下游基因大面積缺失的病例。通過國際千人基因組基因數(shù)據(jù)庫(http://browser.1000genomes.org/)查詢了正常人HBA1下游基因變異數(shù)據(jù),同樣沒有發(fā)現(xiàn)保留HBA1基因但HBA1基因下游基因大面積缺失的數(shù)據(jù)。12根據(jù)實驗研究和生物信息學分析結(jié)果,本文中提出了重復序列活化基因模型:重復序列連同其他非編碼序列使基因處于轉(zhuǎn)錄和非轉(zhuǎn)錄的臨界狀態(tài),重復序列所起的作用主要是抑制基因表達,是沉默子,基因一旦轉(zhuǎn)錄,轉(zhuǎn)錄產(chǎn)物中的重復序列RNA形成網(wǎng)格(RNA networks)活化基因,形成轉(zhuǎn)錄的正反饋,即轉(zhuǎn)錄產(chǎn)物作為輸入激活輸出。結(jié)論1 AA序列具有增強子活性,能夠活化基因,促進基因轉(zhuǎn)錄。2 AA序列可能通過非典型互補形成不穩(wěn)定莖環(huán)結(jié)構(gòu),發(fā)揮增強子活性。3 Alu元件正反組合活化基因必須同時滿足五個條件,否則引起基因沉默。這五個條件是:(1)存在正義和反義Alu組合;(2)細胞種屬來源依賴性:在He La中Alu能夠活化基因,在BHK21細胞中Alu不能活化基因;(3)Alu元件上游必須存在增強子;(4)足夠多的Alu拷貝數(shù);(5)穩(wěn)定轉(zhuǎn)染。提示Alu元件使基因沉默,然而其一旦轉(zhuǎn)錄正反適當組合則有活化基因作用。4提出重復序列活化基因模型:基因組中的基因處于轉(zhuǎn)錄和非轉(zhuǎn)錄的臨界狀態(tài),基因一旦轉(zhuǎn)錄,轉(zhuǎn)錄產(chǎn)物中的重復序列有活化基因作用。
[Abstract]:......
【學位授予單位】:河北醫(yī)科大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:R392
【參考文獻】
相關期刊論文 前1條
1 ;Impact of copy number of distinct SV40PolyA segments on expression of a GFP reporter gene[J];Science China(Life Sciences);2010年05期
,本文編號:2045372
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/2045372.html
最近更新
教材專著