基于異構(gòu)網(wǎng)絡(luò)的激酶—底物關(guān)系預(yù)測算法研究
發(fā)布時(shí)間:2020-05-15 07:08
【摘要】:蛋白質(zhì)磷酸化是一種重要的蛋白質(zhì)翻譯后修飾,是生物體內(nèi)一種最基本、最普遍也是最重要的調(diào)節(jié)方式。其在細(xì)胞新陳代謝,基因表達(dá),細(xì)胞信號轉(zhuǎn)導(dǎo)等生物過程中起著非常重要的作用。傳統(tǒng)的實(shí)驗(yàn)方法鑒定磷酸化位點(diǎn)需要花費(fèi)較大的時(shí)間和人力,成本十分高昂。隨著高通量技術(shù)的快速發(fā)展,積累了大量的磷酸化數(shù)據(jù)。發(fā)展高效的計(jì)算方法分析和挖掘數(shù)據(jù)潛在的規(guī)律,對磷酸化修飾進(jìn)行預(yù)測,為生物實(shí)驗(yàn)提供輔助信息,有利于推動(dòng)磷酸化蛋白質(zhì)組學(xué)的發(fā)展,F(xiàn)有的計(jì)算方法大多根據(jù)蛋白質(zhì)底物氨基酸序列的局部信息進(jìn)行預(yù)測,而蛋白質(zhì)磷酸化作用是一個(gè)復(fù)雜的生物學(xué)過程,不僅僅與單一的底物局部序列有關(guān),往往也與其他關(guān)聯(lián)信息相關(guān)。本文通過構(gòu)建激酶-底物關(guān)系網(wǎng)絡(luò),并結(jié)合蛋白質(zhì)互作網(wǎng)絡(luò)(PPI)及其他相似性網(wǎng)絡(luò),充分考慮網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)信息,對未知激酶-底物的磷酸化關(guān)系進(jìn)行有效預(yù)測。本文主要的研究內(nèi)容如下:第一,基于雙向隨機(jī)游走的激酶-底物關(guān)系預(yù)測算法。首先通過PPI網(wǎng)絡(luò)信息,計(jì)算激酶相似性和底物相似性。然后利用ClusterONE聚類算法分別對激酶相似性網(wǎng)絡(luò)和底物相似性網(wǎng)絡(luò)進(jìn)行聚類,根據(jù)聚類結(jié)果對相似性進(jìn)行調(diào)整。隨后將已知的關(guān)聯(lián)數(shù)據(jù)進(jìn)行整合,構(gòu)建激酶-底物異構(gòu)網(wǎng)絡(luò),并采用雙向隨機(jī)游走算法(Bi-random Walk)對激酶-底物關(guān)系進(jìn)行預(yù)測。通過十折交叉驗(yàn)證與其他預(yù)測算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明該算法表現(xiàn)出了較高的預(yù)測性能。此外,相關(guān)數(shù)據(jù)庫和科學(xué)文獻(xiàn)驗(yàn)證了本算法對激酶-底物關(guān)系預(yù)測的有效性。第二,基于矩陣補(bǔ)全的激酶-底物關(guān)系預(yù)測算法。由于實(shí)驗(yàn)技術(shù)的限制,在現(xiàn)有的磷酸化數(shù)據(jù)中僅有一小部分激酶和底物關(guān)系是已知的,而存在大量的缺失關(guān)聯(lián)信息。為了解決這些激酶-底物關(guān)聯(lián)信息的缺失問題,我們提出了基于矩陣補(bǔ)全的激酶-底物關(guān)系預(yù)測算法。首先通過氨基酸序列的局部比對計(jì)算出激酶和底物的相似性矩陣,然后根據(jù)相似性對原始的關(guān)系網(wǎng)絡(luò)進(jìn)行調(diào)整,并構(gòu)建激酶-底物異構(gòu)網(wǎng)絡(luò)鄰接矩陣,最后采用矩陣補(bǔ)全(Matrix Completion)對異構(gòu)網(wǎng)絡(luò)鄰接矩陣中的缺失信息進(jìn)行填充,對潛在的激酶-底物關(guān)系進(jìn)行預(yù)測。采用十折交叉驗(yàn)證并得到ROC曲線來評價(jià)算法的性能。實(shí)驗(yàn)表明:與其他預(yù)測算法相比,該算法對激酶-底物關(guān)系的預(yù)測更為準(zhǔn)確有效。此外,在案例分析實(shí)驗(yàn)中,驗(yàn)證了該算法對潛在的激酶-底物關(guān)系預(yù)測的有效性。
【圖文】:
該數(shù)據(jù)庫一共收集了邋20279個(gè)蛋白質(zhì),415466個(gè)非冗余的翻譯后修飾位點(diǎn)數(shù)據(jù),這些數(shù)逡逑據(jù)主要來源于己被生物實(shí)驗(yàn)驗(yàn)證得到的數(shù)據(jù),數(shù)據(jù)覆蓋了人類、老鼠等多個(gè)物種。在該逡逑數(shù)據(jù)庫網(wǎng)站上提供了在線檢索功能,,如圖2-1所示,研宄人員可以根據(jù)蛋白質(zhì)名、蛋白逡逑質(zhì)類型、位點(diǎn)信息、蛋白質(zhì)結(jié)構(gòu)域、生物學(xué)功能等多種來檢索和過濾相關(guān)信息
%煎義希常埃櫻遙卞義賢跡玻村澹校校賞緲墑踴義希疲椋紓澹玻村澹校校懾澹睿澹簦鰨錚潁脲澹觶椋螅酰幔歟椋幔簦椋錚鑠義洗送,为了藩(jiǎng)閌莘治鲇肟蒲а芯,InWeb]桑吞峁┝隋澹裕幔夥指粑謀荊校校墑菁義銜募。在InWeb]桑褪菘庵,脩┗庚_鞍字首饔枚災(zāi)潿加幸桓鮒瞇哦確種擔(dān)ǎ茫錚睿媯椋洌澹睿悖邋義希櫻悖錚潁澹,这庚b種凳歉薟煌靄嫖錛淶腦儐中岳創(chuàng)蚍值,贩N翟礁擼硎菊飭礁齙鞍族義現(xiàn)手淶淖饔霉叵翟澆裘。辶x希保沖義
本文編號:2664659
【圖文】:
該數(shù)據(jù)庫一共收集了邋20279個(gè)蛋白質(zhì),415466個(gè)非冗余的翻譯后修飾位點(diǎn)數(shù)據(jù),這些數(shù)逡逑據(jù)主要來源于己被生物實(shí)驗(yàn)驗(yàn)證得到的數(shù)據(jù),數(shù)據(jù)覆蓋了人類、老鼠等多個(gè)物種。在該逡逑數(shù)據(jù)庫網(wǎng)站上提供了在線檢索功能,,如圖2-1所示,研宄人員可以根據(jù)蛋白質(zhì)名、蛋白逡逑質(zhì)類型、位點(diǎn)信息、蛋白質(zhì)結(jié)構(gòu)域、生物學(xué)功能等多種來檢索和過濾相關(guān)信息
%煎義希常埃櫻遙卞義賢跡玻村澹校校賞緲墑踴義希疲椋紓澹玻村澹校校懾澹睿澹簦鰨錚潁脲澹觶椋螅酰幔歟椋幔簦椋錚鑠義洗送,为了藩(jiǎng)閌莘治鲇肟蒲а芯,InWeb]桑吞峁┝隋澹裕幔夥指粑謀荊校校墑菁義銜募。在InWeb]桑褪菘庵,脩┗庚_鞍字首饔枚災(zāi)潿加幸桓鮒瞇哦確種擔(dān)ǎ茫錚睿媯椋洌澹睿悖邋義希櫻悖錚潁澹,这庚b種凳歉薟煌靄嫖錛淶腦儐中岳創(chuàng)蚍值,贩N翟礁擼硎菊飭礁齙鞍族義現(xiàn)手淶淖饔霉叵翟澆裘。辶x希保沖義
本文編號:2664659
本文鏈接:http://sikaile.net/kejilunwen/yysx/2664659.html
最近更新
教材專著