基于序列的RNA甲基化修飾位點預測研究
[Abstract]:Posttranscriptional modification of RNA is widespread in organisms and plays an important role in many biological processes. RNA methylation is an important branch of RNA posttranscriptional modification. RNA methylation refers to the methylation of RNA on some nucleotide molecules, including N6-methyladenosine N1-methyladenosine. Recent studies have shown that RNA methylation can affect the transcription, metabolism, splicing and stability of RNA, and can bind to related proteins to regulate gene expression. And RNA methylation is also associated with diseases such as cancer, obesity, and so on. Therefore, accurate identification of RNA methylation sites from RNA sequences is an important task. Traditional methods based on physicochemical experiments to identify RNA methylation sites are costly, time-consuming and small. In recent years, high-throughput sequencing methods can be used to identify RNA methylation sites on a large scale, but their essence is still based on biochemical experiments. Therefore, it is necessary to design a RNA methylation modification site prediction method based on machine learning theory. In this paper, the prediction of RNA methylation modification sites based on sequences is studied. The main work is as follows: (1) the basic properties of RNA are studied, and a new feature extraction method for RNA sequences is proposed. The idea of position specific preference has been successfully applied to the prediction of protein modified sites. Inspired by this, the idea of location-specific preference is applied to RNA sequences, and a location-specific nucleotide / dinucleotide preference feature is proposed for feature extraction of RNA sequences. Using statistical method, this idea calculates the occurrence frequency of each nucleotide in each position in the sequence of positive and negative sample sets, and encodes the features by using the difference between positive and negative samples. The experimental results show that this feature extraction method can further improve the accuracy of N6-methyladenosine site prediction. (2) Sequence-based prediction of N6-methyladenosine sites is studied. A prediction method called TargetM6A. TargetM6A is proposed to extract the RNA sequence by using the location-specific nucleotide / dinucleotide preference feature and combining with the traditional nucleotide component characteristics. Incremental feature selection method is used to screen the extracted features to select the more discriminant subset of feature components. Finally support vector machine algorithm is used to train the prediction model. The experimental results show that compared with the existing sequence-based prediction methods for N6-methyladenosine sites, The TargetM6A method proposed in this paper obtains better prediction results on the datum data set. (3) the prediction problem of N1-methyladenosine sites based on sequence is studied, and a prediction method called TargetM1A is proposed. According to the newly released experimental data of N1-methyladenosine, the data were processed and sampled. Three data sets based on N1-methyladenosine locus and six histiocyte-based data sets were constructed. TargetM1A method was used to extract several RNA sequence-based features. Using the LRT algorithm as the classifier. TargetM1A method has achieved good performance in the cross-validation experiments based on the prediction model based on species and tissue cells. It is a useful supplementary tool for the existing experiment-based methods to study N1-methyladenosine sites. (4) both the proposed TargetM6A and TargetM1A methods provide online predictive services for free use by other researchers.
【學位授予單位】:南京理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:Q811.4
【相似文獻】
相關期刊論文 前10條
1 劉靜;A Novel Vector for Abundant Expression of Antisense RNA, Triplex forming RNA and Ribozyme in vivo[J];High Technology Letters;2000年04期
2 魯慧英;Detection of hepatitis C virus RNA sequences in cholangiocarcinomas in Chinese and American patients[J];Chinese Medical Journal;2000年12期
3 梁小兵 ,萬國江 ,黃榮貴;Distribution and Variation of Ribonucleic Acid (RNA) and Protein and Its Hydrolysis Products in Lake Sediments[J];Chinese Journal of Geochemistry;2002年02期
4 Verheyden B ,徐其武;口服脊髓灰質炎疫苗核殼和RNA的穩(wěn)定性[J];國外醫(yī)學.預防.診斷.治療用生物制品分冊;2002年01期
5 CMBE譯文組;探索小RNA的功能[J];現代臨床醫(yī)學生物工程學雜志;2004年03期
6 沈維干;RNA interference and its current application in mammals[J];Chinese Medical Journal;2004年07期
7 孫娣;汪洋;張麗娟;閆玉清;;一種簡捷提取植物總RNA的方法[J];黑龍江醫(yī)藥;2005年06期
8 南海波;;小麥總RNA的提取[J];渤海大學學報(自然科學版);2006年01期
9 王冬來;;RNA干擾的成功與困惑[J];中國生物化學與分子生物學報;2008年06期
10 楊靜;;試驗性的小RNA藥物可能引發(fā)失明[J];中國生物化學與分子生物學報;2009年05期
相關會議論文 前10條
1 金由辛;;面向21世紀的RNA研究[A];面向21世紀的科技進步與社會經濟發(fā)展(下冊)[C];1999年
2 ;第四屆RNA全國研討會大會報告日程安排[A];第四屆全國RNA進展研討會論文集[C];2005年
3 ;Function of Transfer RNA Modifications in Plant Development[A];植物分子生物學與現代農業(yè)——全國植物生物學研討會論文摘要集[C];2010年
4 王峰;張秋平;陳金湘;;棉花總RNA的快速提取方法[A];中國棉花學會2011年年會論文匯編[C];2011年
5 關力;陳本iY;iJ云虹;郭培芝;魏重琴;邱蘇吾;苗健;;關于動物}D~T中RNAn,定方法的研究[A];中國生理科學會學術會議論文摘要匯編(生物化學)[C];1964年
6 夏海濱;;小RNA在免疫學領域中的應用研究進展[A];中國免疫學會第五屆全國代表大會暨學術會議論文摘要[C];2006年
7 ;The stability of hepatitis C virus RNA in various handling and storage conditions[A];中國輸血協會第四屆輸血大會論文集[C];2006年
8 郭德銀;;RNA干擾在病毒研究和控制中的應用[A];2006中國微生物學會第九次全國會員代表大會暨學術年會論文摘要集[C];2006年
9 甘儀梅;楊業(yè)華;王學奎;曹燕;楊特武;;棉花總RNA快速提取[A];中國棉花學會2007年年會論文匯編[C];2007年
10 ;Identification and characterization of novel interactive partner proteins for PCBP1 that is a RNA-binding protein[A];中國優(yōu)生優(yōu)育協會第四屆全國學術論文報告會暨基因科學高峰論壇論文專輯[C];2008年
相關重要報紙文章 前10條
1 記者 馮衛(wèi)東;研究人員發(fā)現可破壞腫瘤抑制基因的小RNA[N];科技日報;2009年
2 記者 儲笑抒 通訊員 盛偉;人體微小RNA有望提前發(fā)出癌癥預警[N];南京日報;2011年
3 瀘州醫(yī)學院副教授、科普作家 周志遠;“大頭兒子”與環(huán)狀RNA[N];第一財經日報;2014年
4 麥迪信;小分子RNA可能有大作用[N];醫(yī)藥經濟報;2003年
5 董映璧;美發(fā)現基因調控可回應“RNA世界”[N];科技日報;2006年
6 張忠霞;特制RNA輕推一下,就能“喚醒”基因[N];新華每日電訊;2007年
7 聶翠蓉;RNA:縱是配角也精彩[N];科技日報;2009年
8 馮衛(wèi)東;RNA干擾機制首次在人體中獲得證實[N];科技日報;2010年
9 馮衛(wèi)東 王小龍;英在地球早期環(huán)境模擬條件下合成類RNA[N];科技日報;2009年
10 記者 常麗君;新技術讓研究進入單細胞內RNA的世界[N];科技日報;2011年
相關博士學位論文 前10條
1 王趙瑋;昆蟲RNA病毒復制及昆蟲抗病毒天然免疫機制研究[D];武漢大學;2014年
2 包純;一類新非編碼RNA的發(fā)現以及產生和功能的初探[D];華中師范大學;2015年
3 李語麗;基于MeRIP-seq的水稻RNA m6A甲基化修飾的研究[D];中國科學院北京基因組研究所;2015年
4 熊瑜琳;miR-122靶位基因STAT3調控長鏈非編碼 RNA Lethe促進HCV復制的機制研究[D];第三軍醫(yī)大學;2015年
5 范春節(jié);高通量測序鑒定毛竹小RNA及其功能分析[D];中國林業(yè)科學研究院;2012年
6 王加強;小鼠著床前胚胎特異ERV相關長非編碼RNA的定向篩選及功能研究[D];東北農業(yè)大學;2015年
7 王業(yè)偉;非編碼RNA SPIU的結構和功能研究和p19INK4D在APL發(fā)病中的作用[D];上海交通大學;2013年
8 鄒艷芬;子癇前期中非編碼RNA對滋養(yǎng)細胞功能的調控及機制探索[D];南京醫(yī)科大學;2015年
9 朱喬;miR-10b在人肝細胞肝癌發(fā)生中的作用及其機制的初步探索[D];第四軍醫(yī)大學;2015年
10 蔣俊鋒;長鏈非編碼RNA BACE1-AS促進Aβ聚集及其調節(jié)BACE1和SERF1a的ceRNA機制研究[D];第二軍醫(yī)大學;2015年
相關碩士學位論文 前10條
1 陸聰兒;條紋斑竹鯊再生肝臟中差異RNA的研究[D];浙江理工大學;2015年
2 張曉輝;小鼠幾種長鏈非編碼RNA基因功能的初步研究[D];昆明理工大學;2015年
3 全弘揚;長鏈非編碼RNA在細胞內質網應激反應中的相關作用及機制研究[D];北京協和醫(yī)學院;2015年
4 胡亮;DDX19A識別PRRSV基因組RNA并激活NLRP3炎癥小體[D];中國農業(yè)科學院;2015年
5 張帥兵;應用RNA干擾技術對旋毛蟲Nudix水解酶基因功能的研究[D];鄭州大學;2015年
6 鄭芳芳;肺癌RNA-Seq數據中RNA編輯事件的識別算法和系統(tǒng)分析[D];蘇州大學;2015年
7 陳瑞東;長鏈非編碼RNA MEG3在胰腺癌發(fā)生發(fā)展中作用的實驗研究[D];蘇州大學;2015年
8 劉駿武;線蟲和水稻中環(huán)狀RNA的預測及分析[D];華中農業(yè)大學;2015年
9 李猷;利用RNA干擾技術提高番茄抗TMV侵染能力的研究[D];牡丹江師范學院;2015年
10 吳術盛;SVCV感染EPC細胞microRNA表達譜的初步研究[D];華中農業(yè)大學;2015年
,本文編號:2148287
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2148287.html