通過序列信息預測RNA的柔性
發(fā)布時間:2022-01-08 17:31
在很多生物進程中結(jié)構(gòu)柔性發(fā)揮了非常重要的作用,它對于蛋白質(zhì)的催化和變構(gòu),RNA催化劑的二級結(jié)構(gòu)形成和折疊以及蛋白質(zhì)-RNA識別都是必不可少的。B因子可以衡量蛋白質(zhì)結(jié)構(gòu)或者RNA結(jié)構(gòu)的柔性,預測B因子可以幫助人們理解生物分子的結(jié)構(gòu)和功能。B因子被普遍應用于蛋白質(zhì)無序區(qū)域,蛋白質(zhì)折疊率,蛋白質(zhì)活性位點以及蛋白質(zhì)熱穩(wěn)定性的分析。測定B因子的實驗方法需要消耗高昂的時間成本,因此設計預測B因子的算法是一個具有挑戰(zhàn)性并且有重要意義的課題。目前已經(jīng)有很多算法被設計出來預測蛋白質(zhì)的B因子,但是只有很少的關(guān)于RNA的B因子的研究,在本文的方法之前只有兩個研究工作。本文基于隨機森林算法提出一個新的預測RNA的B因子的方法RNAbval,該方法從給出的RNA序列出發(fā),充分提取RNA的特征集,包括序列的one hot向量表示,序列進化保守性,預測的RNA溶劑可及面積以及預測的RNA二級結(jié)構(gòu)。RNAbval在五折交叉檢驗上達到皮爾森相關(guān)系數(shù)0.5904,在第一個獨立測試集上皮爾森相關(guān)系數(shù)為0.6061。與現(xiàn)有的方法RNAflex比較,RNAbval在兩個獨立測試集上取得了 9.2%~20.5%的突破,說明了本文...
【文章來源】:南開大學天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:49 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
第一節(jié) RNA基礎知識
第二節(jié) B因子簡介
第三節(jié) 課題研究背景和意義
第二章 材料與方法
第一節(jié) 數(shù)據(jù)集
第二節(jié) B因子的標準化
第三節(jié) 特征集合
2.3.1 one hot向量
2.3.2 序列進化保守性
2.3.3 RNA溶劑可及面積
2.3.4 RNA二級結(jié)構(gòu)
2.3.5 特征歸一化和滑窗
第四節(jié) 隨機森林算法
2.4.1 決策樹的基本概念
2.4.2 分類決策樹
2.4.3 回歸決策樹
2.4.4 隨機森林算法原理
2.4.5 隨機森林算法實現(xiàn)
第五節(jié) 本文用的其他方法
2.5.1 支持向量機
2.5.2 嶺回歸
2.5.3 全連接神經(jīng)網(wǎng)絡
第六節(jié) 模型評估
2.6.1 評價指標
2.6.2 五折交叉檢驗
第三章 結(jié)果與討論
第一節(jié) 參數(shù)優(yōu)化
3.1.1 隨機森林參數(shù)優(yōu)化
3.1.2 其他幾種算法的參數(shù)優(yōu)化
3.1.3 隨機森林與其他方法的比較
第二節(jié) 特征貢獻
3.2.1 特征貢獻
3.2.2 Henikoff權(quán)重的貢獻
3.2.3 RNAsol與RNAsnap的比較
3.2.4 RNAbval與RNAflex的比較
3.2.5 Protein-bound RNA與Protein-free RNA的比較
3.2.6 案例分析
3.2.7 網(wǎng)頁服務器
第四章 結(jié)論
參考文獻
致謝
個人簡歷
本文編號:3576979
【文章來源】:南開大學天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:49 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
第一節(jié) RNA基礎知識
第二節(jié) B因子簡介
第三節(jié) 課題研究背景和意義
第二章 材料與方法
第一節(jié) 數(shù)據(jù)集
第二節(jié) B因子的標準化
第三節(jié) 特征集合
2.3.1 one hot向量
2.3.2 序列進化保守性
2.3.3 RNA溶劑可及面積
2.3.4 RNA二級結(jié)構(gòu)
2.3.5 特征歸一化和滑窗
第四節(jié) 隨機森林算法
2.4.1 決策樹的基本概念
2.4.2 分類決策樹
2.4.3 回歸決策樹
2.4.4 隨機森林算法原理
2.4.5 隨機森林算法實現(xiàn)
第五節(jié) 本文用的其他方法
2.5.1 支持向量機
2.5.2 嶺回歸
2.5.3 全連接神經(jīng)網(wǎng)絡
第六節(jié) 模型評估
2.6.1 評價指標
2.6.2 五折交叉檢驗
第三章 結(jié)果與討論
第一節(jié) 參數(shù)優(yōu)化
3.1.1 隨機森林參數(shù)優(yōu)化
3.1.2 其他幾種算法的參數(shù)優(yōu)化
3.1.3 隨機森林與其他方法的比較
第二節(jié) 特征貢獻
3.2.1 特征貢獻
3.2.2 Henikoff權(quán)重的貢獻
3.2.3 RNAsol與RNAsnap的比較
3.2.4 RNAbval與RNAflex的比較
3.2.5 Protein-bound RNA與Protein-free RNA的比較
3.2.6 案例分析
3.2.7 網(wǎng)頁服務器
第四章 結(jié)論
參考文獻
致謝
個人簡歷
本文編號:3576979
本文鏈接:http://sikaile.net/projectlw/swxlw/3576979.html
最近更新
教材專著