通過(guò)序列信息預(yù)測(cè)RNA的柔性
發(fā)布時(shí)間:2022-01-08 17:31
在很多生物進(jìn)程中結(jié)構(gòu)柔性發(fā)揮了非常重要的作用,它對(duì)于蛋白質(zhì)的催化和變構(gòu),RNA催化劑的二級(jí)結(jié)構(gòu)形成和折疊以及蛋白質(zhì)-RNA識(shí)別都是必不可少的。B因子可以衡量蛋白質(zhì)結(jié)構(gòu)或者RNA結(jié)構(gòu)的柔性,預(yù)測(cè)B因子可以幫助人們理解生物分子的結(jié)構(gòu)和功能。B因子被普遍應(yīng)用于蛋白質(zhì)無(wú)序區(qū)域,蛋白質(zhì)折疊率,蛋白質(zhì)活性位點(diǎn)以及蛋白質(zhì)熱穩(wěn)定性的分析。測(cè)定B因子的實(shí)驗(yàn)方法需要消耗高昂的時(shí)間成本,因此設(shè)計(jì)預(yù)測(cè)B因子的算法是一個(gè)具有挑戰(zhàn)性并且有重要意義的課題。目前已經(jīng)有很多算法被設(shè)計(jì)出來(lái)預(yù)測(cè)蛋白質(zhì)的B因子,但是只有很少的關(guān)于RNA的B因子的研究,在本文的方法之前只有兩個(gè)研究工作。本文基于隨機(jī)森林算法提出一個(gè)新的預(yù)測(cè)RNA的B因子的方法RNAbval,該方法從給出的RNA序列出發(fā),充分提取RNA的特征集,包括序列的one hot向量表示,序列進(jìn)化保守性,預(yù)測(cè)的RNA溶劑可及面積以及預(yù)測(cè)的RNA二級(jí)結(jié)構(gòu)。RNAbval在五折交叉檢驗(yàn)上達(dá)到皮爾森相關(guān)系數(shù)0.5904,在第一個(gè)獨(dú)立測(cè)試集上皮爾森相關(guān)系數(shù)為0.6061。與現(xiàn)有的方法RNAflex比較,RNAbval在兩個(gè)獨(dú)立測(cè)試集上取得了 9.2%~20.5%的突破,說(shuō)明了本文...
【文章來(lái)源】:南開(kāi)大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:49 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
第一節(jié) RNA基礎(chǔ)知識(shí)
第二節(jié) B因子簡(jiǎn)介
第三節(jié) 課題研究背景和意義
第二章 材料與方法
第一節(jié) 數(shù)據(jù)集
第二節(jié) B因子的標(biāo)準(zhǔn)化
第三節(jié) 特征集合
2.3.1 one hot向量
2.3.2 序列進(jìn)化保守性
2.3.3 RNA溶劑可及面積
2.3.4 RNA二級(jí)結(jié)構(gòu)
2.3.5 特征歸一化和滑窗
第四節(jié) 隨機(jī)森林算法
2.4.1 決策樹(shù)的基本概念
2.4.2 分類決策樹(shù)
2.4.3 回歸決策樹(shù)
2.4.4 隨機(jī)森林算法原理
2.4.5 隨機(jī)森林算法實(shí)現(xiàn)
第五節(jié) 本文用的其他方法
2.5.1 支持向量機(jī)
2.5.2 嶺回歸
2.5.3 全連接神經(jīng)網(wǎng)絡(luò)
第六節(jié) 模型評(píng)估
2.6.1 評(píng)價(jià)指標(biāo)
2.6.2 五折交叉檢驗(yàn)
第三章 結(jié)果與討論
第一節(jié) 參數(shù)優(yōu)化
3.1.1 隨機(jī)森林參數(shù)優(yōu)化
3.1.2 其他幾種算法的參數(shù)優(yōu)化
3.1.3 隨機(jī)森林與其他方法的比較
第二節(jié) 特征貢獻(xiàn)
3.2.1 特征貢獻(xiàn)
3.2.2 Henikoff權(quán)重的貢獻(xiàn)
3.2.3 RNAsol與RNAsnap的比較
3.2.4 RNAbval與RNAflex的比較
3.2.5 Protein-bound RNA與Protein-free RNA的比較
3.2.6 案例分析
3.2.7 網(wǎng)頁(yè)服務(wù)器
第四章 結(jié)論
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷
本文編號(hào):3576979
【文章來(lái)源】:南開(kāi)大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:49 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
第一節(jié) RNA基礎(chǔ)知識(shí)
第二節(jié) B因子簡(jiǎn)介
第三節(jié) 課題研究背景和意義
第二章 材料與方法
第一節(jié) 數(shù)據(jù)集
第二節(jié) B因子的標(biāo)準(zhǔn)化
第三節(jié) 特征集合
2.3.1 one hot向量
2.3.2 序列進(jìn)化保守性
2.3.3 RNA溶劑可及面積
2.3.4 RNA二級(jí)結(jié)構(gòu)
2.3.5 特征歸一化和滑窗
第四節(jié) 隨機(jī)森林算法
2.4.1 決策樹(shù)的基本概念
2.4.2 分類決策樹(shù)
2.4.3 回歸決策樹(shù)
2.4.4 隨機(jī)森林算法原理
2.4.5 隨機(jī)森林算法實(shí)現(xiàn)
第五節(jié) 本文用的其他方法
2.5.1 支持向量機(jī)
2.5.2 嶺回歸
2.5.3 全連接神經(jīng)網(wǎng)絡(luò)
第六節(jié) 模型評(píng)估
2.6.1 評(píng)價(jià)指標(biāo)
2.6.2 五折交叉檢驗(yàn)
第三章 結(jié)果與討論
第一節(jié) 參數(shù)優(yōu)化
3.1.1 隨機(jī)森林參數(shù)優(yōu)化
3.1.2 其他幾種算法的參數(shù)優(yōu)化
3.1.3 隨機(jī)森林與其他方法的比較
第二節(jié) 特征貢獻(xiàn)
3.2.1 特征貢獻(xiàn)
3.2.2 Henikoff權(quán)重的貢獻(xiàn)
3.2.3 RNAsol與RNAsnap的比較
3.2.4 RNAbval與RNAflex的比較
3.2.5 Protein-bound RNA與Protein-free RNA的比較
3.2.6 案例分析
3.2.7 網(wǎng)頁(yè)服務(wù)器
第四章 結(jié)論
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷
本文編號(hào):3576979
本文鏈接:http://sikaile.net/projectlw/swxlw/3576979.html
最近更新
教材專著