天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 理工論文 > 生物學(xué)論文 >

基于SCOP拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)遠(yuǎn)同源性檢測(cè)與折疊識(shí)別

發(fā)布時(shí)間:2021-09-08 07:59
  蛋白質(zhì)折疊識(shí)別和遠(yuǎn)同源性檢測(cè)是生物信息學(xué)領(lǐng)域中的兩個(gè)基礎(chǔ)問(wèn)題。通過(guò)蛋白質(zhì)的序列信息來(lái)準(zhǔn)確的預(yù)測(cè)蛋白質(zhì)的遠(yuǎn)同源物和折疊類別,對(duì)蛋白質(zhì)的功能結(jié)構(gòu)研究以及新型藥物的精準(zhǔn)設(shè)計(jì)有著重要作用。本研究中,蛋白質(zhì)的序列檢測(cè)問(wèn)題被視為檢索任務(wù),旨在找到與未知查詢蛋白高度相關(guān)的已知功能結(jié)構(gòu)的蛋白質(zhì)序列,進(jìn)而推斷未知蛋白質(zhì)的功能結(jié)構(gòu)。傳統(tǒng)基于序列比對(duì)的蛋白質(zhì)遠(yuǎn)同源檢測(cè)方法對(duì)于序列相似度較低的蛋白質(zhì)檢測(cè)性能一般,雖然目前出現(xiàn)了一些機(jī)器學(xué)習(xí)方法來(lái)解決這個(gè)問(wèn)題,但對(duì)特征的質(zhì)量依賴較強(qiáng)。而構(gòu)建蛋白質(zhì)相似性網(wǎng)絡(luò)可以進(jìn)一步提高檢測(cè)性能,但其十分依賴基排序方法的性能。針對(duì)以上問(wèn)題,本研究通過(guò)融合特征到學(xué)習(xí)排序方法中來(lái)提高基排序結(jié)果的性能,并構(gòu)建了基于SCOP拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)相似性網(wǎng)絡(luò)。最后,將兩者融合起來(lái)提出了Prot Dec-LTR4.0方法。在SCOP基準(zhǔn)數(shù)據(jù)集上的測(cè)試結(jié)果表明,該方法能夠有效地提高蛋白質(zhì)遠(yuǎn)同源性檢測(cè)性能。雖然排序融合策略在解決蛋白質(zhì)遠(yuǎn)同源性檢測(cè)方面取得了成功。但是折疊識(shí)別問(wèn)題因?yàn)樾蛄邢嗨贫容^低,導(dǎo)致基排序的正樣本覆蓋率性能一般,獲得的特征存在大量缺失現(xiàn)象。針對(duì)這個(gè)問(wèn)題,本研究提出了基于SCOP拓?fù)浣Y(jié)... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于SCOP拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)遠(yuǎn)同源性檢測(cè)與折疊識(shí)別


SCOP數(shù)據(jù)集拓?fù)浣Y(jié)構(gòu)形式與主要涉及問(wèn)題示意圖[12]

蛋白質(zhì),同源性,內(nèi)容,方法


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-7-研究;三是基于三元閉包網(wǎng)絡(luò)的蛋白質(zhì)折疊識(shí)別方法的研究。三個(gè)章節(jié)之間的數(shù)據(jù)之間的序列相似度也依次更低,問(wèn)題研究難度也依次遞增。因此本課題主要從三個(gè)方面來(lái)展開研究,主要研究?jī)?nèi)容見圖1-2。具體介紹如下:圖1-2本文研究?jī)?nèi)容(1)基于排序網(wǎng)絡(luò)的蛋白質(zhì)遠(yuǎn)同源性檢測(cè)方法的研究。在該方法研究中,提出了三種用于蛋白質(zhì)對(duì)之間的相似度度量方法,將單序列的特征映射成雙序列比對(duì)特征。然后基于SCOP拓?fù)浣Y(jié)構(gòu)構(gòu)建了蛋白質(zhì)的相似性網(wǎng)絡(luò)并進(jìn)行了優(yōu)化,實(shí)現(xiàn)了對(duì)排序結(jié)果進(jìn)行重排序,最后,將學(xué)習(xí)排序算法與網(wǎng)絡(luò)傳播算法融合一起提出了名叫Protdec-LTR4.0的蛋白質(zhì)遠(yuǎn)程同源檢測(cè)方法。通過(guò)在SCOP基準(zhǔn)數(shù)據(jù)集的進(jìn)行性能評(píng)估測(cè)試和結(jié)果顯著性分析,表明本章節(jié)提出的方法有效的提高了蛋白質(zhì)遠(yuǎn)同源性檢測(cè)的性能。(2)基于序列譜信息的蛋白質(zhì)折疊識(shí)識(shí)別方法的研究;谛蛄凶V的特征因其包含了蛋白質(zhì)的進(jìn)化信息,使得其在比對(duì)算法中比直接序列對(duì)的方法得了更好的效果。本章研究中,通過(guò)將多種不同基于序列譜的方法提取的特征融合一起,從而達(dá)到多種方法相互增益的目的。針對(duì)折疊識(shí)別問(wèn)題中蛋白質(zhì)之間序列相似度較低,導(dǎo)致部分蛋白質(zhì)對(duì)無(wú)法被命中,從而產(chǎn)生的特征缺失和部分特征維度缺失問(wèn)題,分別提出了特征擴(kuò)展和特征轉(zhuǎn)換策略來(lái)解決這個(gè)問(wèn)題。最終,結(jié)合支持向量機(jī)分類器提出了Fold-LTR-SVM的方法。在兩個(gè)基于SCOP拓?fù)浣Y(jié)構(gòu)劃分的折疊識(shí)別基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,F(xiàn)old-LTR-SVM方法可以有效提高預(yù)測(cè)性能。(3)基于三元閉包的蛋白質(zhì)折疊識(shí)別方法的研究;赟COP數(shù)據(jù)集構(gòu)建的LE基準(zhǔn)數(shù)據(jù)集在折疊識(shí)別問(wèn)題研究中有著廣泛的應(yīng)用。相同折疊的不同超家族蛋白質(zhì)序列之間的相似度一般都低于25%。數(shù)據(jù)之間的相似度較低,

示意圖,方法,示意圖,排序方法


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-11-算法[42]構(gòu)建蛋白質(zhì)相似網(wǎng)絡(luò)來(lái)提高查詢反饋結(jié)果的準(zhǔn)確性。在本研究中,將學(xué)習(xí)排序算法、PageRank和HITS結(jié)合一起,提出了ProtDec-LTR4.0方法,進(jìn)一步提高了排序結(jié)果的準(zhǔn)確性。ProtDec-LTR4.0方法的示意圖如圖2-1所示:圖2-1ProtDec-LTR4.0方法示意圖2.4.特征工程2.4.1多種序列特征提取策略介紹在本研究中,三種最先進(jìn)的蛋白質(zhì)檢測(cè)排序方法(PSI-BLAST[30]、Hmmer[36]和HHblits[37])被作為基排序方法。這三種基排序方法被用來(lái)提取基于序列比對(duì)打分的特征。這些方法是互補(bǔ)的,因?yàn)樗鼈兓诓煌募夹g(shù)和

【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)組學(xué)在醫(yī)學(xué)研究中的應(yīng)用與進(jìn)展[J]. 李玉香,戎浩,胡群英,李文華.  中國(guó)組織工程研究. 2016(33)
[2]基于同源基因的病原菌鑒定和分型靶位點(diǎn)的功能基因組學(xué)研究[J]. 杜鵬程,張?chǎng)?劉翟,陳晨.  中國(guó)科學(xué):生命科學(xué). 2011(08)
[3]生物信息學(xué)的現(xiàn)狀與展望[J]. 張春霆.  世界科技研究與發(fā)展. 2000(06)

碩士論文
[1]基于序列譜的蛋白質(zhì)折疊識(shí)別和遠(yuǎn)同源性檢測(cè)[D]. 郭明月.哈爾濱工業(yè)大學(xué) 2018



本文編號(hào):3390427

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/3390427.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4c141***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com