基于多特征信息及Ma-Ada多分類器融合的蛋白質(zhì)結(jié)構(gòu)類預(yù)測
發(fā)布時(shí)間:2017-09-13 19:00
本文關(guān)鍵詞:基于多特征信息及Ma-Ada多分類器融合的蛋白質(zhì)結(jié)構(gòu)類預(yù)測
更多相關(guān)文章: 蛋白質(zhì)結(jié)構(gòu)類預(yù)測 特征信息集 Ma-Ada多分類器融合
【摘要】:蛋白質(zhì)序列特征表示和機(jī)器學(xué)習(xí)算法是影響蛋白質(zhì)結(jié)構(gòu)類預(yù)測效果好壞的兩個(gè)重要方面。本研究基于k-字統(tǒng)計(jì)頻率和k-片段位置分布兩種特征提取方法,將分別提取到的氨基酸序列信息和物理化學(xué)性質(zhì)信息同蛋白質(zhì)二級結(jié)構(gòu)信息進(jìn)行融合,建立17維和57維的特征信息集,并嘗試在Adaboost.M1算法中引入Multi-Agent多智能體融合的思想,提出了一種Ma-Ada多分類器融合算法。該算法作為蛋白質(zhì)結(jié)構(gòu)類的預(yù)測工具,充分挖掘了單分類器度量層信息以及各個(gè)單分類器之間的交互融合信息。實(shí)驗(yàn)結(jié)果表明,Ma-Ada算法在Z277、Z498、1189和D640四個(gè)蛋白質(zhì)數(shù)據(jù)集的57維特征信息集上的分類率分別達(dá)到了91.3%、96.8%、85.3%和87.2%,在17維特征信息集上的分類率也分別達(dá)到了90.6%、95.8%、84.8%和88.3%。與其它蛋白質(zhì)結(jié)構(gòu)類預(yù)測方法的結(jié)果相比,本方法能夠獲得較好的分類率。
【作者單位】: 杭州電子科技大學(xué)生命信息與儀器工程學(xué)院;
【關(guān)鍵詞】: 蛋白質(zhì)結(jié)構(gòu)類預(yù)測 特征信息集 Ma-Ada多分類器融合
【基金】:國家自然科學(xué)基金(61271063) 國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)(2013CB329502) 國家杰出青年科學(xué)基金(60788101)
【分類號】:R341
【正文快照】: 引言人類基因組計(jì)劃的順利實(shí)施帶來了蛋白質(zhì)數(shù)據(jù)庫中海量的序列信息,面對浩瀚的蛋白質(zhì)序列數(shù)據(jù),傳統(tǒng)通過實(shí)驗(yàn)方法測定蛋白質(zhì)結(jié)構(gòu)已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足人類的需求。因此,探討通過理論計(jì)算方法來預(yù)測蛋白質(zhì)結(jié)構(gòu)類別顯得尤為重要。蛋白質(zhì)功能的確定有助于闡明生命體在生理或病理?xiàng)l件
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 彭芳青;厲力華;徐偉棟;劉偉;張娟;邵國良;;基于Multi-Agent的乳腺鉬靶圖像腫塊分類方法[J];傳感技術(shù)學(xué)報(bào);2010年02期
2 武勃,黃暢,艾海舟,勞世z,
本文編號:845319
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/845319.html
最近更新
教材專著