天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

蛋白質(zhì)—蛋白質(zhì)相互作用的簡(jiǎn)易預(yù)測(cè)工具開發(fā)與實(shí)例研究

發(fā)布時(shí)間:2020-08-21 16:08
【摘要】:理解蛋白質(zhì)-蛋白質(zhì)相互作用(蛋白互作)是當(dāng)代生物學(xué)的重要挑戰(zhàn)任務(wù),蛋白互作的計(jì)算預(yù)測(cè)與分析也已成為近期生物信息學(xué)領(lǐng)域的熱門研究課題之一。在本研究中,作者首先建立了一個(gè)一般性的蛋白互作預(yù)測(cè)器,這一預(yù)測(cè)器利用了互作蛋白對(duì)間非隨機(jī)的密碼子對(duì)使用信息。此后,作者進(jìn)一步針對(duì)兩個(gè)重要實(shí)例——泛素化位點(diǎn)與微管結(jié)合蛋白開展了更為具體的研究。泛素化位點(diǎn)是底物被泛素化修飾的位點(diǎn),它與泛素化酶直接互作。由于泛素化系統(tǒng)的復(fù)雜性,目前仍不清楚泛素化位點(diǎn)的哪些特征使其能特異地與泛素化酶結(jié)合并被修飾。因此,在第一項(xiàng)實(shí)例研究中,作者試圖通過統(tǒng)計(jì)分析,挖掘人類泛素化位點(diǎn)的結(jié)構(gòu)特征。微管結(jié)合蛋白,顧名思義,是微管的互作伙伴。微管作為一種高度動(dòng)態(tài)的蛋白復(fù)合體,它與伙伴的互作關(guān)系往往不能被一般的二元蛋白互作組所完全覆蓋。在第二項(xiàng)實(shí)例研究中,作者通過人工文獻(xiàn)搜集得到了一個(gè)高可信度的微管結(jié)合蛋白的數(shù)據(jù)集,并據(jù)此提取特征,構(gòu)建了全新的微管結(jié)合蛋白在線分析工具。 最近,借由機(jī)器學(xué)習(xí)技術(shù),不依賴同源性的簡(jiǎn)單序列編碼被越來(lái)越多地應(yīng)用于蛋白互作的預(yù)測(cè)問題上。初步分析顯示,酵母中互作蛋白對(duì)間的密碼子對(duì)使用與隨機(jī)蛋白對(duì)顯著不同。受這一現(xiàn)象啟發(fā),作者開發(fā)了一種基于密碼子對(duì)頻率差異編碼與支持向量機(jī)分類模型的蛋白互作預(yù)測(cè)器CCPPI.在正負(fù)樣本平衡的酵母數(shù)據(jù)集上進(jìn)行的十折交叉檢驗(yàn)結(jié)果表明,提出的編碼優(yōu)于其它簡(jiǎn)單序列編碼。而在更嚴(yán)格的、非平衡的大規(guī)模獨(dú)立測(cè)試集上,CCPPI展示出與同類方法可比或更優(yōu)的精度,其整體預(yù)測(cè)性能也排名前列。通過對(duì)CCPPI真陽(yáng)性預(yù)測(cè)結(jié)果的統(tǒng)計(jì)分析,作者發(fā)現(xiàn)它傾向于反映互作蛋白對(duì)間蛋白質(zhì)組水平共表達(dá)、功能相似的關(guān)系,這一特點(diǎn)或許有利于其對(duì)蛋白互作的預(yù)測(cè)。另一方面,和同類蛋白互作預(yù)測(cè)器一樣,CCPPI也被發(fā)現(xiàn)存在假陽(yáng)性率高的問題。盡管如此,進(jìn)一步與依賴同源性的蛋白互作預(yù)測(cè)方法的比較表明,CCPPI與基于保守性或系統(tǒng)發(fā)育譜相關(guān)性的預(yù)測(cè)方法能相互補(bǔ)充。因此,當(dāng)這些依賴同源性的方法失效時(shí),CCPPI將是一個(gè)良好的備選蛋白互作預(yù)測(cè)器。作者構(gòu)建了CCPPI在線預(yù)測(cè)服務(wù)器,免費(fèi)對(duì)學(xué)術(shù)界開放使用,具體網(wǎng)址是http://protein.cau. edu.cn/ccppi。 對(duì)于絕大多數(shù)人類蛋白質(zhì)來(lái)說(shuō),其存續(xù)與功能是受泛素化過程調(diào)控的。時(shí)至今日,通過高通量蛋白質(zhì)組學(xué)實(shí)驗(yàn),數(shù)以萬(wàn)計(jì)的人類泛素化位點(diǎn)被鑒定出來(lái)。然而,泛素化位點(diǎn)的選擇機(jī)制仍不明確,這要?dú)w因于泛素化位點(diǎn)側(cè)翼復(fù)雜的序列模式。作者對(duì)一個(gè)包含有505個(gè)人類蛋白質(zhì)結(jié)構(gòu)的數(shù)據(jù)集開展了系統(tǒng)的分析。這一結(jié)構(gòu)數(shù)據(jù)集覆蓋了1330個(gè)高置信度的泛素化位點(diǎn)。定量分析結(jié)果顯示,泛素化位點(diǎn)具有更高的可及性。而一個(gè)意外發(fā)現(xiàn)是,泛素化位點(diǎn)具有更高的中心性。進(jìn)一步分析表明,泛素化位點(diǎn)更高的中心性與其能夠影響(包括蛋白互作界面在內(nèi)的)多種蛋白質(zhì)功能位點(diǎn)的特性有關(guān)。作者的分析還表明,在一維序列上,泛素化位點(diǎn)的側(cè)翼呈現(xiàn)出非隨機(jī)的局部構(gòu)象模式;而在三維空間上,泛素化位點(diǎn)則被一組非隨機(jī)的氨基酸殘基所圍繞。最后,定量分析結(jié)果清楚地顯示泛素化位點(diǎn)的結(jié)構(gòu)特征與序列模式是能夠相互補(bǔ)充的,這實(shí)質(zhì)上暗示了結(jié)構(gòu)水平上的泛素化位點(diǎn)選擇機(jī)制存在的可能性。 微管是真核生物細(xì)胞骨架的主要成分之一。它能調(diào)控細(xì)胞形態(tài)、細(xì)胞分裂、胞內(nèi)運(yùn)輸、細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)等諸多生物過程,而微管的這些生物學(xué)功能正是通過一系列微管結(jié)合蛋白行使與控制的。領(lǐng)域內(nèi)專家已經(jīng)注意到已知的微管結(jié)合蛋白具有明顯的多樣性,而新種類的微管結(jié)合蛋白也不斷地被鑒定出來(lái)。與此產(chǎn)生鮮明對(duì)比的是,目前尚沒有專門收錄已知微管結(jié)合蛋白的數(shù)據(jù)庫(kù),也沒有專門的預(yù)測(cè)器以幫助發(fā)現(xiàn)新的微管結(jié)合蛋白。作者建立了一個(gè)以微管結(jié)合蛋白為中心的在線分析工具M(jìn)APanalyzer,它包括了兩個(gè)部分:微管結(jié)合蛋白數(shù)據(jù)庫(kù)與微管結(jié)合蛋白預(yù)測(cè)器。微管結(jié)合蛋白數(shù)據(jù)庫(kù)的核心數(shù)據(jù)集是完全由作者人工文獻(xiàn)搜集得到的。這些信息與其它通過自動(dòng)化流程得到的蛋白注釋共同組成了微管結(jié)合蛋白數(shù)據(jù)庫(kù)。人工搜集的核心數(shù)據(jù)集也使得進(jìn)一步提取微管結(jié)合蛋白的代表性模體成為可能。利用這些代表性模體,設(shè)計(jì)了一個(gè)半監(jiān)督的支持向量機(jī)分類器,并將其與同源序列搜索方法BLAST整合,以構(gòu)成新的微管結(jié)合蛋白預(yù)測(cè)器。在基于高質(zhì)量獨(dú)立測(cè)試集和擬南芥全基因組數(shù)據(jù)集的預(yù)測(cè)性能評(píng)測(cè)中,整合的預(yù)測(cè)器的表現(xiàn)不僅優(yōu)于其構(gòu)成組分(即支持向量機(jī)分類器與BLAST),還優(yōu)于該領(lǐng)域內(nèi)另一個(gè)常用的同源蛋白搜索工具PSI-BLAST.和CCPPI一樣,MAPanalyzer (http://systbio.cau.edu.cn/mappred/)同樣可供學(xué)術(shù)界免費(fèi)使用。
【學(xué)位授予單位】:中國(guó)農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q51
【圖文】:

蛋白質(zhì)序列,數(shù)據(jù)庫(kù)記錄,增長(zhǎng)情況,蛋白


UniProtKB/Swiss-Prot數(shù)據(jù)庫(kù)中。一個(gè)事實(shí)是,盡管同出一門(UniProt Consortium, 2015),兩者的蛋白條目數(shù)長(zhǎng)期存在著數(shù)量級(jí)的差異,而且這個(gè)差異正在逐步加大。如圖1-1所示,根據(jù)UniProt定期更新的數(shù)據(jù)庫(kù)統(tǒng)計(jì)信息(http://www.uniprot.org/statistics/), 2014年1月,TrEMBL蛋白記錄數(shù)約為5000萬(wàn),而Swiss-Prot蛋白記錄數(shù)約為54萬(wàn)。而僅僅一年過后,TrEMBL蛋白記錄數(shù)己迅速躍進(jìn)至接近9000萬(wàn)的水平,而Swiss-Prot增長(zhǎng)平緩,僅達(dá)到接近55萬(wàn)(547085)的水平。值得注意的是,考慮到序列同源性,蛋白質(zhì)序列信息總量與功能信息總量的差異并沒有如此巨大。然而

預(yù)測(cè)方法,互作,蛋白質(zhì)相互作用,蛋白


的計(jì)算預(yù)測(cè)方法成為了對(duì)實(shí)驗(yàn)鑒定方法的重要補(bǔ)充。如圖1-2所示,蛋白互作的計(jì)算預(yù)測(cè)方法大體可以歸為依賴同源性的方法與不依賴同源性的方法。依賴同源性的方法可以進(jìn)一步分為直接映射方法和共進(jìn)化方法,不依賴同源性的方法又可以分為關(guān)聯(lián)法與基于序列的機(jī)器學(xué)習(xí)方法。下面首先對(duì)一些代表性方法進(jìn)行簡(jiǎn)介,然后對(duì)本論文所涉及的機(jī)器學(xué)習(xí)法的一般流程加以詳細(xì)介紹。1.1.2.1 依賴同源性的計(jì)算預(yù)測(cè)方法直系同源蛋白互作對(duì)映射法(interologmapping):直系同源蛋白互作對(duì)(interolog)這一概念最早由Vidal課題組提出,指的是不同物種間一對(duì)直系同源蛋白間保守的互作關(guān)系(Matthews et al.,2001)o他們發(fā)現(xiàn),這種保守的互作關(guān)系并不罕見,在抽選的直系同源蛋白對(duì)中,16%-31%的互作關(guān)系在物種間是保守的。這一發(fā)現(xiàn)大大鼓舞了相關(guān)方法學(xué)的發(fā)展,即將模式生物測(cè)定的蛋白互作信息轉(zhuǎn)移給其它物種的直系同源蛋白對(duì)。這一方法的優(yōu)點(diǎn)是不需要任何異源數(shù)據(jù)(如轉(zhuǎn)錄組)信息

蛋白質(zhì)—蛋白質(zhì)相互作用的簡(jiǎn)易預(yù)測(cè)工具開發(fā)與實(shí)例研究


圖.妞州仁.0r門}wco甲佃娜頤訓(xùn)0口taeIs"護(hù)峨下陽(yáng)O腸州.f口d.月,娜喊的亡C加r腳襯抽倪協(xié)的翻e矛,p目川

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 莊振華;王年;李學(xué)俊;梁棟;王繼;;癌癥基因表達(dá)數(shù)據(jù)的熵度量分類方法[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期

2 陳樂;王年;蘇亮亮;王蕊平;;基于鄰接譜主分量分析的腫瘤分類方法[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期

3 葉愛霞;王年;蘇亮亮;;基于非負(fù)矩陣分解和Normal_Matrix的腫瘤基因分類[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期

4 楊緒兵,韓自存;ε不敏感的核Adaline算法及其在圖像去噪中的應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年04期

5 陶秀鳳,唐詩(shī)忠,周鳴爭(zhēng);基于支持向量機(jī)的軟測(cè)量模型及應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年02期

6 許高程;張文君;王衛(wèi)紅;;支持向量機(jī)技術(shù)在遙感影像滑坡體提取中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2009年06期

7 郭立萍;唐家奎;米素娟;張成雯;趙理君;;基于支持向量機(jī)遙感圖像融合分類方法研究進(jìn)展[J];安徽農(nóng)業(yè)科學(xué);2010年17期

8 馮學(xué)軍;;最小二乘支持向量機(jī)的研究與應(yīng)用[J];安慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年01期

9 鄒心遙;姚若河;;基于LSSVM的威布爾分布形狀參數(shù)估計(jì)(英文)[J];半導(dǎo)體技術(shù);2008年06期

10 鄒心遙;姚若河;;基于LSSVM的小子樣元器件壽命預(yù)測(cè)[J];半導(dǎo)體技術(shù);2011年09期

相關(guān)會(huì)議論文 前10條

1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中國(guó)科學(xué)院地質(zhì)與地球物理研究所第11屆(2011年度)學(xué)術(shù)年會(huì)論文集(下)[C];2012年

2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年

3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年

4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年

5 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九屆中國(guó)控制會(huì)議論文集[C];2010年

6 ?×;魏巍;梁君燕;;基于支持向量機(jī)的SURF改進(jìn)算法[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)C卷[C];2011年

7 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)D卷[C];2011年

8 劉友強(qiáng);李斌;奚寧;陳家駿;;基于雙語(yǔ)平行語(yǔ)料的中文縮略語(yǔ)提取方法[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

9 陳龍;吳志勇;袁春;蒙美玲;蔡蓮紅;;面向數(shù)字版權(quán)管理的聲紋輔助認(rèn)證系統(tǒng)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

10 顏七笙;;基于PCA-SVM的動(dòng)態(tài)聯(lián)盟候選伙伴績(jī)效評(píng)價(jià)方法[A];第十三屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2011年

相關(guān)博士學(xué)位論文 前10條

1 于化龍;基于DNA微陣列數(shù)據(jù)的癌癥分類技術(shù)研究[D];哈爾濱工程大學(xué);2010年

2 殷志偉;基于統(tǒng)計(jì)學(xué)習(xí)理論的分類方法研究[D];哈爾濱工程大學(xué);2009年

3 孔凡芝;引線鍵合視覺檢測(cè)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2009年

4 鄭大騰;柔性坐標(biāo)測(cè)量機(jī)空間誤差模型及最佳測(cè)量區(qū)研究[D];合肥工業(yè)大學(xué);2010年

5 柏堅(jiān);非線性數(shù)學(xué)地質(zhì)模型研究及在滇東南金礦成礦預(yù)測(cè)中的應(yīng)用[D];中國(guó)地質(zhì)大學(xué)(北京);2010年

6 章鵬;多尺度特征檢測(cè):方法和應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

7 張昌明;新疆漢族、維吾爾族及哈薩克族食管癌血清蛋白質(zhì)指紋圖譜研究[D];新疆醫(yī)科大學(xué);2010年

8 王曉明;基于統(tǒng)計(jì)學(xué)習(xí)的模式識(shí)別幾個(gè)問題及其應(yīng)用研究[D];江南大學(xué);2010年

9 呂寧;基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷模型及算法研究[D];哈爾濱理工大學(xué);2009年

10 劉衛(wèi)紅;垃圾郵件檢測(cè)與過濾關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 李金華;基于SVM的多類文本分類研究[D];山東科技大學(xué);2010年

2 朱耿峰;支持向量機(jī)在沖擊地壓預(yù)測(cè)模型中的應(yīng)用研究[D];山東科技大學(xué);2010年

3 李朋勇;基于全矢高階譜的故障診斷方法及其應(yīng)用研究[D];鄭州大學(xué);2010年

4 劉磊;多泥沙河流水庫(kù)優(yōu)化調(diào)度研究[D];鄭州大學(xué);2010年

5 辛保兵;既有預(yù)應(yīng)力混凝土梁橋剩余承載力評(píng)估方法研究[D];鄭州大學(xué);2010年

6 王巧立;微生物發(fā)酵過程的建模與優(yōu)化控制研究[D];鄭州大學(xué);2010年

7 林天威;基于視頻流的人臉識(shí)別系統(tǒng)研究[D];哈爾濱工程大學(xué);2010年

8 韓艷;基于支持向量機(jī)的發(fā)酵過程建模研究[D];大連理工大學(xué);2010年

9 馬穩(wěn);基于支持向量機(jī)的模擬電路故障診斷研究[D];大連理工大學(xué);2010年

10 梁懷志;基于嵌入式的車型分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2010年



本文編號(hào):2799587

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/2799587.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9ba8c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com