基于粒度計(jì)算的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測算法研究
發(fā)布時(shí)間:2021-02-23 02:57
蛋白質(zhì)磷酸化是一種廣泛存在于真核生物中的翻譯后修飾過程。它在能量代謝、信號傳導(dǎo)途徑、神經(jīng)活動(dòng)、細(xì)胞周期和凋亡等多種生物過程中起著重要作用。質(zhì)譜分析法等傳統(tǒng)生物實(shí)驗(yàn)的成本較高,因此基于計(jì)算方法的磷酸化位點(diǎn)預(yù)測成為有效的替代手段。其中無需激酶信息,僅需殘基序列作為輸入進(jìn)行預(yù)測的非激酶特異性計(jì)算方法的需求最廣。然而這種計(jì)算方法往往對訓(xùn)練數(shù)據(jù)做了不同的數(shù)據(jù)壓縮策略(如隨機(jī)采樣),降低大數(shù)據(jù)量所帶來的復(fù)雜度,以提高訓(xùn)練效率。這些數(shù)據(jù)壓縮做法會導(dǎo)致部分樣本原始分布特征損失。此外,對磷酸化位點(diǎn)數(shù)據(jù)庫中未標(biāo)記的殘基位點(diǎn)直接當(dāng)負(fù)樣本參與算法的訓(xùn)練也是不科學(xué)的。因此,如何解決以上問題,設(shè)計(jì)有效的算法預(yù)測未知的磷酸化位點(diǎn)是有意義的研究領(lǐng)域;谏鲜鲅芯繂栴},本文提出兩種非激酶特異性磷酸化位點(diǎn)預(yù)測算法。(1)基于核模糊C均值聚類支持向量機(jī)的磷酸化位點(diǎn)預(yù)測算法。在粒度計(jì)算的基礎(chǔ)上,該算法結(jié)合核模糊C均值聚類,在高維特征空間中劃分粒子,獲得代表整個(gè)樣本空間的平衡信息粒。然后在平衡信息粒的基礎(chǔ)上,建立了粒度支持向量機(jī)預(yù)測模型KFCC-GSVM。該模型提高了磷酸化位點(diǎn)數(shù)據(jù)壓縮的合理性和可靠性,使得在應(yīng)用傳統(tǒng)的支持向量...
【文章來源】:廣西大學(xué)廣西壯族自治區(qū) 211工程院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
蛋白質(zhì)磷酸化和去磷酸化示意圖
圖2-1粒度支持向量機(jī)GSVM和SVM通用性能比較
廣西大學(xué)碩士學(xué)位論文基于粒度計(jì)算的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測算法研究22圖2-2基于兩步走策略的LPU方法Fig.2-2LPUmethodbasedontwo-stepstrategy2.6本章小結(jié)本章首先介紹了兩種磷酸化位點(diǎn)數(shù)據(jù)庫P.ELM和PhosPhAt,其中P.ELM為真核動(dòng)物磷酸化位點(diǎn)數(shù)據(jù)庫,PhosPhAt為植物磷酸化位點(diǎn)數(shù)據(jù)庫。然后介紹了粒度計(jì)算的基本知識、數(shù)學(xué)模型與粒度支持向量機(jī),接著介紹了模糊聚類的基本知識與本文第三章所用的核模糊C均值聚類算法。最后對正-未標(biāo)記樣本學(xué)習(xí)算法做了簡要說明,為第四章的算法設(shè)計(jì)與實(shí)驗(yàn)過程做了良好鋪墊。
本文編號:3046909
【文章來源】:廣西大學(xué)廣西壯族自治區(qū) 211工程院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
蛋白質(zhì)磷酸化和去磷酸化示意圖
圖2-1粒度支持向量機(jī)GSVM和SVM通用性能比較
廣西大學(xué)碩士學(xué)位論文基于粒度計(jì)算的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測算法研究22圖2-2基于兩步走策略的LPU方法Fig.2-2LPUmethodbasedontwo-stepstrategy2.6本章小結(jié)本章首先介紹了兩種磷酸化位點(diǎn)數(shù)據(jù)庫P.ELM和PhosPhAt,其中P.ELM為真核動(dòng)物磷酸化位點(diǎn)數(shù)據(jù)庫,PhosPhAt為植物磷酸化位點(diǎn)數(shù)據(jù)庫。然后介紹了粒度計(jì)算的基本知識、數(shù)學(xué)模型與粒度支持向量機(jī),接著介紹了模糊聚類的基本知識與本文第三章所用的核模糊C均值聚類算法。最后對正-未標(biāo)記樣本學(xué)習(xí)算法做了簡要說明,為第四章的算法設(shè)計(jì)與實(shí)驗(yàn)過程做了良好鋪墊。
本文編號:3046909
本文鏈接:http://sikaile.net/projectlw/swxlw/3046909.html
最近更新
教材專著