成熟mRNA與其內(nèi)含子序列的相互作用機(jī)制
本文關(guān)鍵詞:成熟mRNA與其內(nèi)含子序列的相互作用機(jī)制
更多相關(guān)文章: 成熟mRNA 內(nèi)含子序列 局域比對 最佳匹配片段 功能位點(diǎn) 外顯子連接復(fù)合體
【摘要】:隨著許多模式生物全基因組測序工作的完成,目前已獲得了大量的序列信息,通過分析這些序列發(fā)現(xiàn)在整個序列中編碼序列只占很小的部分,絕大部分是非編碼序列,而這些非編碼序列所蘊(yùn)含的生物學(xué)信息和具有的生物學(xué)功能還很少為人知曉。一些研究結(jié)果顯示這些非編碼序列在生命活動中可能起著十分重要的作用。探究其具有的生物學(xué)意義已成為生物信息學(xué)研究的熱點(diǎn)課題。內(nèi)含子作為一類非編碼RNA與編碼序列一起轉(zhuǎn)錄。證據(jù)表明,內(nèi)含子序列與相應(yīng)的mRNA序列存在相互作用,對基因表達(dá)有重要作用。基于這一理論,我們采用Smith-Waterman局域比對方法給出內(nèi)含子序列與對應(yīng)mRNA序列的最佳匹配片段,分別分析了它們在mRNA序列上和內(nèi)含子序列上的F值分布和最佳匹配片段的特征,并對相互作用機(jī)制進(jìn)行了探討。1.剪接后的內(nèi)含子與相應(yīng)mRNA序列之間存在序列匹配關(guān)系,它們參與基因的表達(dá)和調(diào)控過程。為了揭示兩者之間的序列匹配特征,基于線蟲全基因組基因序列和其核糖核蛋白基因序列,采用Smith-Waterman局域比對方法得到外顯子連接序列與相應(yīng)內(nèi)含子序列的最佳匹配片段,分析了外顯子連接序列上的F值分布。發(fā)現(xiàn):1)連接點(diǎn)兩側(cè)匹配頻率分布有明顯的差異,顯示出了外顯子的邊界。最佳匹配片段的平均長度和配對率分布與siRNA和miRNA的結(jié)合特征相同。2)第一內(nèi)含子和長內(nèi)含子在外顯子連接序列上的分布偏好與其他內(nèi)含子有明顯區(qū)別。3)對第一內(nèi)含子和長內(nèi)含子而言,高GC含量、富含CG和高λCG值的最佳匹配片段在外顯子連接序列上表現(xiàn)出明顯的偏置,在外顯子上游EJC結(jié)合區(qū)域的匹配頻率出現(xiàn)極小值分布。結(jié)果表明:EJC和內(nèi)含子在與外顯子序列結(jié)合的過程中存在相互競爭和相互協(xié)作的關(guān)系,內(nèi)含子序列與編碼序列是協(xié)同進(jìn)化的,通過相互作用完成應(yīng)有的功能。2.將27個物種的核糖核蛋白RNA序列與相應(yīng)內(nèi)含子序列進(jìn)行局域比對,獲得mRNA序列上各個位點(diǎn)的配對頻率。然后對mRNA序列長度進(jìn)行標(biāo)準(zhǔn)化(歸一),給出mRNA序列上相對位點(diǎn)匹配強(qiáng)度隨其長度的分布。分析各類編碼序列(成熟mRNA序列、蛋白編碼序列、外顯子連接序列、5'連接序列和3'連接序列)上最佳匹配區(qū)域分布的規(guī)律。我們發(fā)現(xiàn),在mRNA序列上,UTR區(qū)與內(nèi)含子存在較強(qiáng)的相互作用。在編碼序列上存在多個最佳匹配區(qū)域和低配區(qū)域,推測這些低配區(qū)域可能是蛋白質(zhì)復(fù)合體的結(jié)合區(qū)域。在mRNA功能位點(diǎn)附近,如翻譯起始、翻譯終止位點(diǎn)、外顯子連接位點(diǎn)及EJC區(qū)域,最佳匹配頻率分布有明顯的不同。研究表明,基因的表達(dá)調(diào)控是由mRNA、內(nèi)含子和結(jié)合蛋白因子三者之間形成的網(wǎng)絡(luò)調(diào)控關(guān)系決定的。通過內(nèi)含子和結(jié)合蛋白的調(diào)控決定mRNA的高級結(jié)構(gòu)、協(xié)助mRNA出核、調(diào)節(jié)mRNA翻譯等過程。各種分析結(jié)論均支持內(nèi)含子與mRNA之間存在相互作用的論點(diǎn)。3.與上述方法相似,同樣基于27個物種的核糖核蛋白基因?yàn)檠芯繉ο?我們對內(nèi)含子序列不做統(tǒng)一的標(biāo)準(zhǔn)化,首先,將內(nèi)含子按照長度進(jìn)行分組,然后與相應(yīng)的mRNA序列進(jìn)行局域比對,獲得最佳匹配片段在內(nèi)含子序列上各個位點(diǎn)匹配強(qiáng)度分布。結(jié)果表明,隨著內(nèi)含子序列長度的增加,內(nèi)含子序列上的分布逐漸由一個峰過度到兩個峰甚至多個峰分布。內(nèi)含子的5'區(qū)域或第一個結(jié)構(gòu)單元是成熟序列,而3'區(qū)域是未成熟區(qū)或是正在演化的區(qū)域,內(nèi)含子的長度進(jìn)化進(jìn)程是從5'端開始的向著3'端進(jìn)行的,新生單元是從內(nèi)含子3'端一段一段加上去的,給出了內(nèi)含子長度演化的一種可能的機(jī)制。內(nèi)含子上的結(jié)構(gòu)單元長度為60bp,而兩個結(jié)構(gòu)單元間的連接序列的長度確實(shí)變化的。結(jié)論表明,不同長度的內(nèi)含子在調(diào)控mRNA序列結(jié)構(gòu)方面是不同的。同時也揭示了內(nèi)含子的結(jié)構(gòu)和長度的進(jìn)化特征。4.我們以13個物種的第1號染色體基因組為研究對象,采用Smith-Waterman算法進(jìn)行局域比對,獲得mRNA序列和相應(yīng)內(nèi)含子序列之間的最佳匹配片段。分析mRNA序列上最佳匹配片段序列特征及匹配頻率的分布規(guī)律,并分析這種相互作用分布的普適性。發(fā)現(xiàn),最佳匹配片段的平均長度和配對率分布與siRNA和miRNA的結(jié)合特征相同;在mRNA序列上,UTR區(qū)與內(nèi)含子存在較強(qiáng)的相互作用,低GC片段傾向與3'UTR區(qū)作用,而高GC片段傾向結(jié)合到5'UTR區(qū);翻譯起始位點(diǎn)和翻譯終止位點(diǎn)可以被識別通過它們的最佳匹配頻率分布。結(jié)論表明,最佳匹配片段的序列特征符合RNA-RNA相互作用的一般規(guī)律,內(nèi)含子應(yīng)該是一類調(diào)控基因表達(dá)的功能片段。在完成運(yùn)轉(zhuǎn)和翻譯過程中,mRNA序列與內(nèi)含子序列的相互作用充分考慮了結(jié)合蛋白的位置。內(nèi)含子與結(jié)合蛋白在與mRNA結(jié)合存在競爭和協(xié)作機(jī)制。內(nèi)含子序列與成熟mRNA序列相互作用方式可以調(diào)節(jié)mRNA的結(jié)構(gòu)、指導(dǎo)mRNA出核。總之,本文主要提出了一個基本理論:成熟mRNA序列與相應(yīng)的內(nèi)含子序列存在相互作用。分析了這兩類序列相互作用的最佳匹配頻率分布規(guī)律和最佳匹配片段的序列特征,得到了一些很有創(chuàng)新意義的結(jié)果。該研究對于辨析內(nèi)含子的功能具有重要的生物學(xué)意義。
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:Q75
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 張強(qiáng);李宏;趙小慶;許士華;;基因外顯子連接序列與相應(yīng)內(nèi)含子序列的相互作用[J];生物信息學(xué);2013年03期
2 趙小慶;李宏;包通拉嘎;;線蟲核糖核蛋白基因內(nèi)含子與相應(yīng)編碼序列的相互作用[J];生物化學(xué)與生物物理進(jìn)展;2010年09期
3 沈娟;吳文武;解小莉;郭滿才;袁志發(fā);;基于DNA序列K-tuple分布的一種非序列比對分析[J];遺傳;2010年06期
4 張昆林,張靜,羅靜初;酵母基因上游與內(nèi)含子可能存在的轉(zhuǎn)錄協(xié)同作用[J];生物化學(xué)與生物物理進(jìn)展;2005年01期
5 張靜,石秀凡;酵母基因中轉(zhuǎn)錄正調(diào)控內(nèi)含子序列特征的統(tǒng)計(jì)分析[J];生物化學(xué)與生物物理進(jìn)展;2003年02期
6 吳加金,劉濤,賀福初,吳曉霞;動物肌動蛋白基因中內(nèi)含子的來源及存在意義的探討[J];遺傳學(xué)報;1998年05期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 張強(qiáng);外顯子連接序列與連接處內(nèi)含子序列的相互作用[D];內(nèi)蒙古大學(xué);2013年
,本文編號:1286986
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/1286986.html