天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于序列的RNA甲基化修飾位點預測研究

發(fā)布時間:2018-07-27 15:35
【摘要】:RNA的轉錄后修飾在生命體中普遍存在,并且在許多生物過程中扮演了重要的角色,而RNA的甲基化修飾則是RNA轉錄后修飾中一個重要的分支。RNA甲基化是指在RNA的某些核苷酸分子上發(fā)生甲基化修飾的現象,常見的包括N6-甲基腺苷、N1-甲基腺苷等。近年來的研究表明,RNA甲基化修飾可以影響RNA的轉錄、代謝、剪接和穩(wěn)定性;能與相關的蛋白質結合,從而調控基因的表達。并且,RNA甲基化修飾與腫瘤、肥胖癥等疾病也有所關聯。因此,從RNA序列中精確地識別出RNA甲基化修飾位點是一項重要的任務。傳統(tǒng)的基于物理化學實驗來識別RNA甲基化位點的方法成本高、耗時長且規(guī)模較小。近年來出現的高通量測序方法能進行高效的、大規(guī)模的RNA甲基化位點識別,但其本質仍然是基于生物化學實驗的方法。因此,設計一種基于機器學習理論的RNA甲基化修飾位點預測方法,是十分必要的。本文對基于序列的RNA甲基化修飾位點預測問題進行了深入研究,主要工作如下:(1)研究了 RNA的基本性質,并提出了一種新的RNA序列的特征提取方法。位置特異性偏好思想在蛋白質修飾位點預測問題中得到了成功的應用。受此啟發(fā),本文將位置特異性偏好思想應用于RNA序列,提出了位置特異性核苷酸/二核苷酸偏好特征,用于RNA序列的特征提取。該思想利用統(tǒng)計方法,分別計算每種核苷酸在正負樣本集合的序列中每個位置的出現頻率,并且利用正負樣本集合之間的差異進行特征編碼。實驗結果表明,該特征提取方法能進一步地提升N6-甲基腺苷位點預測的精度。(2)對基于序列的N6-甲基腺苷位點預測問題進行了研究,并提出了名為TargetM6A的預測方法。TargetM6A方法利用所提出的位置特異性核苷酸/二核苷酸偏好特征,并結合傳統(tǒng)的核苷酸組成成分特征,來對RNA序列進行特征提取;對提取出的特征使用增量特征選擇方法進行特征篩選,選出更有判別力的特征成分子集;最終使用支持向量機算法訓練預測模型。實驗結果表明,相對于現有的基于序列的N6-甲基腺苷位點預測方法,本文提出的TargetM6A方法在基準數據集上取得了更好的預測結果。(3)對基于序列的N1-甲基腺苷位點預測問題進行了研究,并提出了名為TargetM1A的預測方法。針對最近新發(fā)布的N1-甲基腺苷實驗數據,進行了數據的處理和采樣,構建了 3個基于物種和6個基于組織細胞的N1-甲基腺苷位點的數據集。TargetM1A方法提取了數種基于RNA序列的特征,并使用極限隨機樹算法作為分類器。TargetM1A方法在基于物種和基于組織細胞的預測模型的交叉驗證實驗中都取得了不錯的性能;它對于現有的基于實驗來研究N1-甲基腺苷位點的方法來說,是一個有益的補充工具。(4)對于所提出的TargetM6A和TargetM1A方法都提供了在線的預測服務,供其他研究人員免費地使用。
[Abstract]:Posttranscriptional modification of RNA is widespread in organisms and plays an important role in many biological processes. RNA methylation is an important branch of RNA posttranscriptional modification. RNA methylation refers to the methylation of RNA on some nucleotide molecules, including N6-methyladenosine N1-methyladenosine. Recent studies have shown that RNA methylation can affect the transcription, metabolism, splicing and stability of RNA, and can bind to related proteins to regulate gene expression. And RNA methylation is also associated with diseases such as cancer, obesity, and so on. Therefore, accurate identification of RNA methylation sites from RNA sequences is an important task. Traditional methods based on physicochemical experiments to identify RNA methylation sites are costly, time-consuming and small. In recent years, high-throughput sequencing methods can be used to identify RNA methylation sites on a large scale, but their essence is still based on biochemical experiments. Therefore, it is necessary to design a RNA methylation modification site prediction method based on machine learning theory. In this paper, the prediction of RNA methylation modification sites based on sequences is studied. The main work is as follows: (1) the basic properties of RNA are studied, and a new feature extraction method for RNA sequences is proposed. The idea of position specific preference has been successfully applied to the prediction of protein modified sites. Inspired by this, the idea of location-specific preference is applied to RNA sequences, and a location-specific nucleotide / dinucleotide preference feature is proposed for feature extraction of RNA sequences. Using statistical method, this idea calculates the occurrence frequency of each nucleotide in each position in the sequence of positive and negative sample sets, and encodes the features by using the difference between positive and negative samples. The experimental results show that this feature extraction method can further improve the accuracy of N6-methyladenosine site prediction. (2) Sequence-based prediction of N6-methyladenosine sites is studied. A prediction method called TargetM6A. TargetM6A is proposed to extract the RNA sequence by using the location-specific nucleotide / dinucleotide preference feature and combining with the traditional nucleotide component characteristics. Incremental feature selection method is used to screen the extracted features to select the more discriminant subset of feature components. Finally support vector machine algorithm is used to train the prediction model. The experimental results show that compared with the existing sequence-based prediction methods for N6-methyladenosine sites, The TargetM6A method proposed in this paper obtains better prediction results on the datum data set. (3) the prediction problem of N1-methyladenosine sites based on sequence is studied, and a prediction method called TargetM1A is proposed. According to the newly released experimental data of N1-methyladenosine, the data were processed and sampled. Three data sets based on N1-methyladenosine locus and six histiocyte-based data sets were constructed. TargetM1A method was used to extract several RNA sequence-based features. Using the LRT algorithm as the classifier. TargetM1A method has achieved good performance in the cross-validation experiments based on the prediction model based on species and tissue cells. It is a useful supplementary tool for the existing experiment-based methods to study N1-methyladenosine sites. (4) both the proposed TargetM6A and TargetM1A methods provide online predictive services for free use by other researchers.
【學位授予單位】:南京理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:Q811.4

【相似文獻】

相關期刊論文 前10條

1 劉靜;A Novel Vector for Abundant Expression of Antisense RNA, Triplex forming RNA and Ribozyme in vivo[J];High Technology Letters;2000年04期

2 魯慧英;Detection of hepatitis C virus RNA sequences in cholangiocarcinomas in Chinese and American patients[J];Chinese Medical Journal;2000年12期

3 梁小兵 ,萬國江 ,黃榮貴;Distribution and Variation of Ribonucleic Acid (RNA) and Protein and Its Hydrolysis Products in Lake Sediments[J];Chinese Journal of Geochemistry;2002年02期

4 Verheyden B ,徐其武;口服脊髓灰質炎疫苗核殼和RNA的穩(wěn)定性[J];國外醫(yī)學.預防.診斷.治療用生物制品分冊;2002年01期

5 CMBE譯文組;探索小RNA的功能[J];現代臨床醫(yī)學生物工程學雜志;2004年03期

6 沈維干;RNA interference and its current application in mammals[J];Chinese Medical Journal;2004年07期

7 孫娣;汪洋;張麗娟;閆玉清;;一種簡捷提取植物總RNA的方法[J];黑龍江醫(yī)藥;2005年06期

8 南海波;;小麥總RNA的提取[J];渤海大學學報(自然科學版);2006年01期

9 王冬來;;RNA干擾的成功與困惑[J];中國生物化學與分子生物學報;2008年06期

10 楊靜;;試驗性的小RNA藥物可能引發(fā)失明[J];中國生物化學與分子生物學報;2009年05期

相關會議論文 前10條

1 金由辛;;面向21世紀的RNA研究[A];面向21世紀的科技進步與社會經濟發(fā)展(下冊)[C];1999年

2 ;第四屆RNA全國研討會大會報告日程安排[A];第四屆全國RNA進展研討會論文集[C];2005年

3 ;Function of Transfer RNA Modifications in Plant Development[A];植物分子生物學與現代農業(yè)——全國植物生物學研討會論文摘要集[C];2010年

4 王峰;張秋平;陳金湘;;棉花總RNA的快速提取方法[A];中國棉花學會2011年年會論文匯編[C];2011年

5 關力;陳本iY;iJ云虹;郭培芝;魏重琴;邱蘇吾;苗健;;關于動物}D~T中RNAn,定方法的研究[A];中國生理科學會學術會議論文摘要匯編(生物化學)[C];1964年

6 夏海濱;;小RNA在免疫學領域中的應用研究進展[A];中國免疫學會第五屆全國代表大會暨學術會議論文摘要[C];2006年

7 ;The stability of hepatitis C virus RNA in various handling and storage conditions[A];中國輸血協會第四屆輸血大會論文集[C];2006年

8 郭德銀;;RNA干擾在病毒研究和控制中的應用[A];2006中國微生物學會第九次全國會員代表大會暨學術年會論文摘要集[C];2006年

9 甘儀梅;楊業(yè)華;王學奎;曹燕;楊特武;;棉花總RNA快速提取[A];中國棉花學會2007年年會論文匯編[C];2007年

10 ;Identification and characterization of novel interactive partner proteins for PCBP1 that is a RNA-binding protein[A];中國優(yōu)生優(yōu)育協會第四屆全國學術論文報告會暨基因科學高峰論壇論文專輯[C];2008年

相關重要報紙文章 前10條

1 記者 馮衛(wèi)東;研究人員發(fā)現可破壞腫瘤抑制基因的小RNA[N];科技日報;2009年

2 記者 儲笑抒 通訊員 盛偉;人體微小RNA有望提前發(fā)出癌癥預警[N];南京日報;2011年

3 瀘州醫(yī)學院副教授、科普作家 周志遠;“大頭兒子”與環(huán)狀RNA[N];第一財經日報;2014年

4 麥迪信;小分子RNA可能有大作用[N];醫(yī)藥經濟報;2003年

5 董映璧;美發(fā)現基因調控可回應“RNA世界”[N];科技日報;2006年

6 張忠霞;特制RNA輕推一下,就能“喚醒”基因[N];新華每日電訊;2007年

7 聶翠蓉;RNA:縱是配角也精彩[N];科技日報;2009年

8 馮衛(wèi)東;RNA干擾機制首次在人體中獲得證實[N];科技日報;2010年

9 馮衛(wèi)東 王小龍;英在地球早期環(huán)境模擬條件下合成類RNA[N];科技日報;2009年

10 記者 常麗君;新技術讓研究進入單細胞內RNA的世界[N];科技日報;2011年

相關博士學位論文 前10條

1 王趙瑋;昆蟲RNA病毒復制及昆蟲抗病毒天然免疫機制研究[D];武漢大學;2014年

2 包純;一類新非編碼RNA的發(fā)現以及產生和功能的初探[D];華中師范大學;2015年

3 李語麗;基于MeRIP-seq的水稻RNA m6A甲基化修飾的研究[D];中國科學院北京基因組研究所;2015年

4 熊瑜琳;miR-122靶位基因STAT3調控長鏈非編碼 RNA Lethe促進HCV復制的機制研究[D];第三軍醫(yī)大學;2015年

5 范春節(jié);高通量測序鑒定毛竹小RNA及其功能分析[D];中國林業(yè)科學研究院;2012年

6 王加強;小鼠著床前胚胎特異ERV相關長非編碼RNA的定向篩選及功能研究[D];東北農業(yè)大學;2015年

7 王業(yè)偉;非編碼RNA SPIU的結構和功能研究和p19INK4D在APL發(fā)病中的作用[D];上海交通大學;2013年

8 鄒艷芬;子癇前期中非編碼RNA對滋養(yǎng)細胞功能的調控及機制探索[D];南京醫(yī)科大學;2015年

9 朱喬;miR-10b在人肝細胞肝癌發(fā)生中的作用及其機制的初步探索[D];第四軍醫(yī)大學;2015年

10 蔣俊鋒;長鏈非編碼RNA BACE1-AS促進Aβ聚集及其調節(jié)BACE1和SERF1a的ceRNA機制研究[D];第二軍醫(yī)大學;2015年

相關碩士學位論文 前10條

1 陸聰兒;條紋斑竹鯊再生肝臟中差異RNA的研究[D];浙江理工大學;2015年

2 張曉輝;小鼠幾種長鏈非編碼RNA基因功能的初步研究[D];昆明理工大學;2015年

3 全弘揚;長鏈非編碼RNA在細胞內質網應激反應中的相關作用及機制研究[D];北京協和醫(yī)學院;2015年

4 胡亮;DDX19A識別PRRSV基因組RNA并激活NLRP3炎癥小體[D];中國農業(yè)科學院;2015年

5 張帥兵;應用RNA干擾技術對旋毛蟲Nudix水解酶基因功能的研究[D];鄭州大學;2015年

6 鄭芳芳;肺癌RNA-Seq數據中RNA編輯事件的識別算法和系統(tǒng)分析[D];蘇州大學;2015年

7 陳瑞東;長鏈非編碼RNA MEG3在胰腺癌發(fā)生發(fā)展中作用的實驗研究[D];蘇州大學;2015年

8 劉駿武;線蟲和水稻中環(huán)狀RNA的預測及分析[D];華中農業(yè)大學;2015年

9 李猷;利用RNA干擾技術提高番茄抗TMV侵染能力的研究[D];牡丹江師范學院;2015年

10 吳術盛;SVCV感染EPC細胞microRNA表達譜的初步研究[D];華中農業(yè)大學;2015年



本文編號:2148287

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2148287.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶c8a14***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com