基于滑窗的lncRNA二級結(jié)構(gòu)預(yù)測
發(fā)布時間:2019-09-25 07:25
【摘要】:在生物學(xué)研究中,一直以來主要的課題都是圍繞著蛋白質(zhì)和相關(guān)蛋白質(zhì)編碼基因進行的。然而,隨著RNA測序技術(shù)和用于組裝轉(zhuǎn)錄組的計算方法的發(fā)展,除了編碼哺乳動物基因組的大部分蛋白質(zhì)編碼基因外,許多非編碼RNA(nc RNA)轉(zhuǎn)錄物在各種生物過程中正起著越來越重要的作用。理解nc RNA的功能已成為現(xiàn)代生物學(xué)研究中最重要的目標之一。nc RNA表示的是一種不被翻譯成蛋白質(zhì)的功能性RNA分子,其是一種缺少特異完整的開放閱讀框的RNA。按照功能分類,可以分為兩種類型,一種是看家非編碼RNA(Housekeeping non-coding RNA),一種是調(diào)控非編碼RNA(Regulatory non-coding RNA)。按照長度分類,可以分為短鏈非編碼RNA和長鏈非編碼RNA(lncRNA)。lncRNA通常指的是長度大于200核苷酸單位的非編碼RNA。近期的研究表明,lncRNA可以作為各種生物過程中重要的順式或反式調(diào)節(jié)劑,也可以使用各種機制來影響基因的表達,lncRNA中的突變與各種各樣的疾病,特別是癌癥和神經(jīng)變性疾病有關(guān)。即使如此,大多數(shù)lncRNA的功能和分子機制是未知的。盡管已經(jīng)開發(fā)了多種計算方法來預(yù)測lncRNA的功能,但預(yù)測其功能仍然是一項具有挑戰(zhàn)性的任務(wù),部分原因就是lncRNAs序列和二級結(jié)構(gòu)缺乏保守性。由此可知,lncRNA在生物功能與機制上有著非常巨大的作用,但是由于其長度較長,功能表述不清楚,給研究人員研究其生物功能造成了巨大的困難。經(jīng)過調(diào)查研究發(fā)現(xiàn),目前主流的RNA二級結(jié)構(gòu)預(yù)測算法主要集中在短鏈上,對lncRNA二級結(jié)構(gòu)的研究基本還處于探索階段,所以本文基于局部預(yù)測算法和平衡能能量模型,提出了基于滑窗的lncRNA二級結(jié)構(gòu)預(yù)測的算法。首先,利用局部預(yù)測算法對lncRNA的局部結(jié)構(gòu)進行預(yù)測,之后利用平衡能量模型選取多個預(yù)測結(jié)構(gòu)中的最優(yōu)結(jié)構(gòu)。為了驗證算法的有效性,我們選取了廣泛使用的silva數(shù)據(jù)庫和RNA STRAND數(shù)據(jù)的數(shù)據(jù)對算法進行了驗證,并將預(yù)測結(jié)果和主流的預(yù)測算法進行了比較。通過和中國人民解放軍第四軍醫(yī)大學(xué)的合作并作進一步的深入研究,我們的lncRNA二級結(jié)構(gòu)預(yù)測算法的效率和準確性都會得到提升。我們深知該算法還有很多不足之處,但是我們還在不斷努力,使其功能更加的齊全,性能更加的強勁的愿望,是使我們不斷進步的動力,也是我們努力的方向。
【圖文】:
基決定了螺旋的堆疊,因此它們形成了三維結(jié)構(gòu)。經(jīng)常會發(fā)現(xiàn)四個螺旋通過一多分支環(huán)連結(jié)在一起,例如在 tRNA 中,但也有或多或少的螺旋連結(jié)在一起。正規(guī)的定義中,一個 K-多分支環(huán)既是內(nèi)部堿基對(i1,j1)…(ik,jk) ∈ R,閉合基對(i,j)∈ R 的環(huán)。6. 假結(jié)是 RNA 的一種三級結(jié)構(gòu)單位。一個發(fā)夾環(huán)中的核苷酸和莖區(qū)外部的苷酸形成了堿基對。因此堿基對在它們序列的位置上出現(xiàn)了互相的重疊。在正的定義中我們可以說假結(jié)是違背了被所有非假結(jié)結(jié)構(gòu)所遵守的嵌套原則的一結(jié)構(gòu),正如上面所描述的一樣。嵌套原則表明對于任何兩個堿基對(i,j)∈R,(k,l) R,并且 i<j,k<l,i<k,總會有 i<k<l<j 或者 i<j<k<l。因此在假結(jié)結(jié)構(gòu)中存在至少兩堿基對(i,j)∈ R,(k,l) ∈ R, 并且 i<j,k<l,i<k 且 i<k<j<l。假結(jié)的預(yù)測是非常的,事實表明對于假結(jié)結(jié)構(gòu)的預(yù)測是帶有最小自由能的,這意味著找到最穩(wěn)定結(jié)構(gòu)是一個 NP-完全問題。已經(jīng)證明假結(jié)預(yù)測問題可以減小到已知的 NP-完全SAT 問題,因此它也是 NP-完全問題。其中假結(jié)結(jié)構(gòu)如下[19]:
藍線只表示假結(jié)的氫鍵。通過對每個堿基簡單的計算角度,圓圈繪圖法已經(jīng)被現(xiàn)了。例如如果序列包含 36 個堿基,然后 360°就被 36 所平分,因此很顯然彎轉(zhuǎn) 10°就放一個新堿基。每個堿基的正確坐標通過 sin 和 cos 函數(shù)來計算。第三種表示法和所謂的潦草繪圖法很類似,這是最好的類似于真實二級結(jié)的符號,但是不能表示假結(jié)[23]。和圓圈繪圖法一樣,,堿基由黑點和它們的字符示,共價鍵由灰色的線表示,氫鍵由紅色的線表示,假結(jié)的氫鍵由藍色的線表示實際上,這種方法是可以表示假結(jié)的,但在生物學(xué)上是毫無意義的。莖區(qū)或者螺旋以一種類似軌道的結(jié)構(gòu)表示,而且環(huán)的閉合堿基對有著和莖堿基對一樣的距離。環(huán)通過等角多邊形來表示。這樣就可以觀察到一個非常緊的圖形,并且不同結(jié)構(gòu)元素之間重疊的可能性是非常小的。但是環(huán)可能變得非小,以至于環(huán)不能進行比較,而且隨著序列的增長,環(huán)變得太小以至于很難注到它們,表示方法為[24]:
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:Q752
本文編號:2541310
【圖文】:
基決定了螺旋的堆疊,因此它們形成了三維結(jié)構(gòu)。經(jīng)常會發(fā)現(xiàn)四個螺旋通過一多分支環(huán)連結(jié)在一起,例如在 tRNA 中,但也有或多或少的螺旋連結(jié)在一起。正規(guī)的定義中,一個 K-多分支環(huán)既是內(nèi)部堿基對(i1,j1)…(ik,jk) ∈ R,閉合基對(i,j)∈ R 的環(huán)。6. 假結(jié)是 RNA 的一種三級結(jié)構(gòu)單位。一個發(fā)夾環(huán)中的核苷酸和莖區(qū)外部的苷酸形成了堿基對。因此堿基對在它們序列的位置上出現(xiàn)了互相的重疊。在正的定義中我們可以說假結(jié)是違背了被所有非假結(jié)結(jié)構(gòu)所遵守的嵌套原則的一結(jié)構(gòu),正如上面所描述的一樣。嵌套原則表明對于任何兩個堿基對(i,j)∈R,(k,l) R,并且 i<j,k<l,i<k,總會有 i<k<l<j 或者 i<j<k<l。因此在假結(jié)結(jié)構(gòu)中存在至少兩堿基對(i,j)∈ R,(k,l) ∈ R, 并且 i<j,k<l,i<k 且 i<k<j<l。假結(jié)的預(yù)測是非常的,事實表明對于假結(jié)結(jié)構(gòu)的預(yù)測是帶有最小自由能的,這意味著找到最穩(wěn)定結(jié)構(gòu)是一個 NP-完全問題。已經(jīng)證明假結(jié)預(yù)測問題可以減小到已知的 NP-完全SAT 問題,因此它也是 NP-完全問題。其中假結(jié)結(jié)構(gòu)如下[19]:
藍線只表示假結(jié)的氫鍵。通過對每個堿基簡單的計算角度,圓圈繪圖法已經(jīng)被現(xiàn)了。例如如果序列包含 36 個堿基,然后 360°就被 36 所平分,因此很顯然彎轉(zhuǎn) 10°就放一個新堿基。每個堿基的正確坐標通過 sin 和 cos 函數(shù)來計算。第三種表示法和所謂的潦草繪圖法很類似,這是最好的類似于真實二級結(jié)的符號,但是不能表示假結(jié)[23]。和圓圈繪圖法一樣,,堿基由黑點和它們的字符示,共價鍵由灰色的線表示,氫鍵由紅色的線表示,假結(jié)的氫鍵由藍色的線表示實際上,這種方法是可以表示假結(jié)的,但在生物學(xué)上是毫無意義的。莖區(qū)或者螺旋以一種類似軌道的結(jié)構(gòu)表示,而且環(huán)的閉合堿基對有著和莖堿基對一樣的距離。環(huán)通過等角多邊形來表示。這樣就可以觀察到一個非常緊的圖形,并且不同結(jié)構(gòu)元素之間重疊的可能性是非常小的。但是環(huán)可能變得非小,以至于環(huán)不能進行比較,而且隨著序列的增長,環(huán)變得太小以至于很難注到它們,表示方法為[24]:
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:Q752
【參考文獻】
相關(guān)期刊論文 前6條
1 孫磊;張林;劉輝;;基于RNA-Seq的長非編碼RNA預(yù)測[J];生物化學(xué)與生物物理進展;2012年12期
2 董浩;劉元寧;張浩;王剛;;基于隱Markov模型的RNA二級結(jié)構(gòu)預(yù)測新方法[J];計算機研究與發(fā)展;2012年04期
3 ;Simulating the Folding Pathway of RNA Secondary Structure Using the Modified Ant Colony Algorithm[J];Journal of Bionic Engineering;2010年04期
4 鄒權(quán);郭茂祖;張濤濤;;RNA二級結(jié)構(gòu)預(yù)測方法綜述[J];電子學(xué)報;2008年02期
5 朱杰;;生物信息學(xué)的研究現(xiàn)狀及其發(fā)展問題的探討[J];生物信息學(xué);2005年04期
6 張春霆;生物信息學(xué)的現(xiàn)狀與展望[J];世界科技研究與發(fā)展;2000年06期
相關(guān)碩士學(xué)位論文 前1條
1 李函蔚;IncRNA UCA1在胃癌中的作用及胃癌血漿RNA腫瘤標志物的篩選研究[D];吉林大學(xué);2015年
本文編號:2541310
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2541310.html
最近更新
教材專著