天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于序列分段近鄰編碼的蛋白質(zhì)熱點(diǎn)殘基預(yù)測方法研究

發(fā)布時(shí)間:2020-05-20 07:11
【摘要】:在蛋白質(zhì)與蛋白質(zhì)相互作用時(shí),其結(jié)合自由能僅由一小部分氨基酸殘基貢獻(xiàn),這部分關(guān)鍵殘基被稱為熱點(diǎn)殘基。蛋白質(zhì)功能的實(shí)現(xiàn)往往依賴熱點(diǎn)殘基,熱點(diǎn)殘基大部分聚集在蛋白質(zhì)相互作用界面的中心位置,對蛋白質(zhì)與蛋白質(zhì)的結(jié)合起著至關(guān)重要的作用。因此,加深對熱點(diǎn)殘基的理解對于生命科學(xué)的發(fā)展具有積極的貢獻(xiàn)。當(dāng)前,科研工作者們主要依靠丙氨酸突變掃描技術(shù)來判定熱點(diǎn)殘基,但是這種方法成本較高又耗時(shí)耗力,只能在小范圍應(yīng)用。所以急需要更準(zhǔn)確、更高效的方法來識別蛋白質(zhì)界面熱點(diǎn)殘基。本文提出了序列分段近鄰編碼方法,并基于隨機(jī)森林(Random Forest)分類算法來構(gòu)建預(yù)測模型,從而鑒別蛋白質(zhì)相互作用界面中的熱點(diǎn)殘基。首先從ASEdb數(shù)據(jù)庫中抽取訓(xùn)練集,然后提取了 10個(gè)氨基酸理化屬性、16個(gè)與突出指數(shù)(PI)和深度指數(shù)(DI)相關(guān)的特征以及25個(gè)與溶劑可及表面積(ASA)相關(guān)的特征。本文改進(jìn)了蛋白質(zhì)編碼方式,對蛋白質(zhì)熱點(diǎn)殘基的預(yù)測方式提供了新思路。不同于以往蛋白質(zhì)序列的自相關(guān)描述符編碼、三聯(lián)體組合信息編碼等方式,本文考慮到與熱點(diǎn)殘基臨近的氨基酸以及有一定間隔的氨基酸對熱點(diǎn)殘基的影響,調(diào)整熱點(diǎn)殘基所在區(qū)間的滑動窗口長度,并將蛋白質(zhì)序列平均分割成3、4、5段,由此建立預(yù)測模型,通過交叉驗(yàn)證最終選取了最佳的設(shè)置參數(shù)。為了驗(yàn)證預(yù)測模型的可靠性,本文從BID數(shù)據(jù)庫中提取出獨(dú)立測試集,來驗(yàn)證提出的模型。最后,將本文的預(yù)測模型與現(xiàn)有的熱點(diǎn)殘基預(yù)測方法進(jìn)行了對比,這些模型在熱點(diǎn)殘基預(yù)測研究方面具有重要意義,其中包括APIS、Robetta、FOLDEF、KFC以及MINERVA模型。在使用相同訓(xùn)練集構(gòu)建的模型之中,本文的模型在相同測試集上,明顯地提升了對蛋白質(zhì)界面熱點(diǎn)殘基的預(yù)測能力,表明了本文方法的可靠性。
【圖文】:

分段方法,示例,殘基,熱點(diǎn)


圖3.1蛋白質(zhì)序列分段方法示例逡逑Fig邋3.1邋Example邋of邋protein邋sequence邋segmentation邋method逡逑圖3.1中,假設(shè)這是一整條含有熱點(diǎn)殘基或非熱點(diǎn)殘基的蛋白質(zhì)序列,序列逡逑中的每個(gè)字母均表示相應(yīng)的氨基酸類別,序列總長度為L,其中第二個(gè)箭頭所指逡逑示的氨基酸K就是一個(gè)熱點(diǎn)或非熱點(diǎn)殘基的樣本點(diǎn),依據(jù)本文在3.4.2中所述的逡逑蛋白質(zhì)序列滑動窗口策略,在樣本點(diǎn)K左右各。磦(gè)氨基酸構(gòu)成一個(gè)組合,即逡逑樣本點(diǎn)K所在的滑動窗口長度為9。逡逑在以前的方法中,通常只取樣本點(diǎn)相鄰近的氨基酸殘基組成滑動窗口,來預(yù)逡逑測熱點(diǎn)殘基,并沒有考慮到在一級結(jié)構(gòu)下的蛋白質(zhì)序列雖然為線段形,而在蛋白逡逑質(zhì)的高級結(jié)構(gòu)中,序列需要經(jīng)過加工折疊,一個(gè)殘基是由于結(jié)構(gòu)上相互臨近的殘逡逑基與其相互作用才成為熱點(diǎn)殘基的,而這些對一個(gè)殘基成為熱點(diǎn)起到積極作用的逡逑殘基

滑窗,計(jì)算方法,殘基,熱點(diǎn)


hi邋>ynon-hot逡逑Section邋-邋L/4逡逑圖3.1蛋白質(zhì)序列分段方法示例逡逑Fig邋3.1邋Example邋of邋protein邋sequence邋segmentation邋method逡逑圖3.1中,假設(shè)這是一整條含有熱點(diǎn)殘基或非熱點(diǎn)殘基的蛋白質(zhì)序列,序列逡逑中的每個(gè)字母均表示相應(yīng)的氨基酸類別,序列總長度為L,其中第二個(gè)箭頭所指逡逑示的氨基酸K就是一個(gè)熱點(diǎn)或非熱點(diǎn)殘基的樣本點(diǎn),依據(jù)本文在3.4.2中所述的逡逑蛋白質(zhì)序列滑動窗口策略,在樣本點(diǎn)K左右各。磦(gè)氨基酸構(gòu)成一個(gè)組合,,即逡逑樣本點(diǎn)K所在的滑動窗口長度為9。逡逑在以前的方法中,通常只取樣本點(diǎn)相鄰近的氨基酸殘基組成滑動窗口,來預(yù)逡逑測熱點(diǎn)殘基,并沒有考慮到在一級結(jié)構(gòu)下的蛋白質(zhì)序列雖然為線段形,而在蛋白逡逑質(zhì)的高級結(jié)構(gòu)中,序列需要經(jīng)過加工折疊,一個(gè)殘基是由于結(jié)構(gòu)上相互臨近的殘逡逑基與其相互作用才成為熱點(diǎn)殘基的
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:Q51

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王建;;蛋白質(zhì)相互作用數(shù)據(jù)庫[J];中國生物化學(xué)與分子生物學(xué)報(bào);2017年08期

2 陳心浩;胡儉;;基于多特征融合預(yù)測蛋白質(zhì)相互作用界面[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年03期

3 譚從娥;黃祥云;;基于蛋白質(zhì)相互作用網(wǎng)絡(luò)分析右歸丸治療腎陽虛證的療效機(jī)制[J];中國中醫(yī)藥信息雜志;2016年02期

4 楊曉敏;李英倫;;基于蛋白質(zhì)相互作用“熱點(diǎn)”區(qū)域的小分子藥物設(shè)計(jì)研究進(jìn)展[J];生物物理學(xué)報(bào);2015年02期

5 馮舒s

本文編號:2672260


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2672260.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶750ca***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com