基于機器學習方法預測環(huán)形RNA編碼蛋白的潛能
發(fā)布時間:2023-08-08 18:39
環(huán)形RNA是一類廣泛存在于真核細胞中的內(nèi)源性RNA分子,沒有5’末端帽子和3’末端polyA尾巴,以共價鍵連接形成封閉環(huán)狀結(jié)構(gòu).一直以來,環(huán)形RNA被認為是一類不能翻譯的非編碼RNA.然而近年來有研究報道,環(huán)形RNA能夠編碼蛋白質(zhì)從而調(diào)控重要的生命活動,引起了研究者們的注意.運用機器學習的方法,基于環(huán)形RNA的序列與結(jié)構(gòu)特征,使用XGBoost、隨機森林和支持向量機組合而成的綜合分類模型,預測環(huán)形RNA編碼蛋白的潛能,平均預測準確率達到86.66%,為實驗研究人員提供可靠的參考,有助于發(fā)現(xiàn)更多可編碼蛋白的環(huán)形RNA.
【文章頁數(shù)】:9 頁
【文章目錄】:
1 環(huán)形RNA序列與結(jié)構(gòu)特征的計算
1.1 ORF的計算
1.2 IRES的預測
1.3 序列保守性的計算
1.4 m6A修飾的預測
1.5 其他特征的計算
2 預測模型的構(gòu)建
2.1 數(shù)據(jù)來源
2.2 特征篩選
3 模型性能的評估
3.1 邏輯回歸模型的性能評估
3.2 支持向量機模型的性能評估
3.3 隨機森林模型的性能評估
3.4 XGBoost模型的性能評估
3.5 小結(jié)與討論
4 結(jié)語
本文編號:3840276
【文章頁數(shù)】:9 頁
【文章目錄】:
1 環(huán)形RNA序列與結(jié)構(gòu)特征的計算
1.1 ORF的計算
1.2 IRES的預測
1.3 序列保守性的計算
1.4 m6A修飾的預測
1.5 其他特征的計算
2 預測模型的構(gòu)建
2.1 數(shù)據(jù)來源
2.2 特征篩選
3 模型性能的評估
3.1 邏輯回歸模型的性能評估
3.2 支持向量機模型的性能評估
3.3 隨機森林模型的性能評估
3.4 XGBoost模型的性能評估
3.5 小結(jié)與討論
4 結(jié)語
本文編號:3840276
本文鏈接:http://sikaile.net/projectlw/swxlw/3840276.html
最近更新
教材專著