利用多信息融合方法預(yù)測蛋白質(zhì)亞核定位
發(fā)布時間:2024-01-22 08:13
細胞核是真核細胞內(nèi)最重要的細胞器,它是基因復(fù)制、RNA轉(zhuǎn)錄的中心,是細胞活動的控制中心。蛋白質(zhì)的功能與蛋白質(zhì)在細胞內(nèi)的位置密切相關(guān),因此,如何從大量蛋白質(zhì)中精確地識別出核定位蛋白,并且進一步預(yù)測亞核定位非常重要。本文基于最新更新的UniProtKB/Swiss-Prot數(shù)據(jù)庫,構(gòu)建了相似性小于等于25%的核定位蛋白和非核定位蛋白數(shù)據(jù)集,選取氨基酸序列N端單肽組分信息、蛋白質(zhì)骨架二肽組分信息、氨基酸指數(shù)信息、蛋白質(zhì)相互作用信息及基因本體注釋信息為特征信息,利用支持向量機算法對構(gòu)建的數(shù)據(jù)集進行預(yù)測。單特征信息中,基因本體注釋信息與蛋白質(zhì)相互作用信息兩種特征信息的總預(yù)測成功率較好,且總預(yù)測成功率都達到了 80%以上,對特征信息進行篩選融合,在5折交叉檢驗下總預(yù)測成功率達到89.11%。本文進一步構(gòu)建了相似性小于等于25%蛋白質(zhì)亞核定位數(shù)據(jù)集N1127和N1044。并選取4種特征信息:氨基酸組分信息、蛋白質(zhì)骨架二肽組分信息、基因本體注釋信息和蛋白質(zhì)相互作用信息,利用支持向量機算法對構(gòu)建的數(shù)據(jù)集進行預(yù)測。單特征信息中,基因本體注釋信息與蛋白質(zhì)相互作用信息兩種特征信息的總預(yù)測成功率較好,將特征信息...
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
本文編號:3882510
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
本文編號:3882510
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3882510.html
最近更新
教材專著