天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于未標(biāo)記樣本信息的蛋白質(zhì)相互作用位點(diǎn)半監(jiān)督預(yù)測(cè)

發(fā)布時(shí)間:2020-09-03 12:30
   蛋白質(zhì)相互作用位點(diǎn)的識(shí)別在藥物設(shè)計(jì)方面具有不可替代的意義。然而在實(shí)際情況下,由于目前只有小部分的蛋白質(zhì)相互作用能夠被實(shí)驗(yàn)方法鑒別出來,所以蛋白質(zhì)序列上的大多數(shù)位點(diǎn)不能被定義為界面位點(diǎn)或非界面位點(diǎn),這將導(dǎo)致蛋白質(zhì)相互作用位點(diǎn)的預(yù)測(cè)缺乏準(zhǔn)確性和泛化能力。本文主要通過未標(biāo)記出來的蛋白質(zhì)位點(diǎn)信息來對(duì)相互作用位點(diǎn)進(jìn)行預(yù)測(cè)。在數(shù)據(jù)處理部分,首先刪減冗余的蛋白質(zhì)鏈,通過預(yù)處理得到91條蛋白質(zhì)鏈用于實(shí)驗(yàn)。接著對(duì)殘基進(jìn)行定義,并基于氨基酸的進(jìn)化保守性,從HSSP數(shù)據(jù)庫與Consurf Server中提取了五種特征:殘基空間序列譜、殘基序列信息熵與相對(duì)熵、殘基序列保守權(quán)重以及殘基進(jìn)化速率。將這五種保守性特征加以融合并重新編碼,得到的數(shù)據(jù)集將用于之后的實(shí)驗(yàn)。在位點(diǎn)預(yù)測(cè)部分,本文充分利用了大量未標(biāo)記樣本,并提出了三種半監(jiān)督支持向量機(jī)模型對(duì)蛋白質(zhì)相互作用位點(diǎn)進(jìn)行預(yù)測(cè)。首先,結(jié)合標(biāo)簽均值和自訓(xùn)練思想,提出了基于多核學(xué)習(xí)的標(biāo)簽均值自訓(xùn)練半監(jiān)督支持向量機(jī)(Means3vm-mkl)和基于迭代優(yōu)化的標(biāo)簽均值自訓(xùn)練半監(jiān)督支持向量機(jī)(Means3vm-iter)。然后我們對(duì)上述模型進(jìn)行了優(yōu)化,使用一種安全的半監(jiān)督支持向量機(jī)(S4VM)來防止性能下降。從最終的預(yù)測(cè)結(jié)果可以得出,使用未標(biāo)記樣本極大提高了預(yù)測(cè)的準(zhǔn)確性,相比于只利用標(biāo)記樣本的分類模型在準(zhǔn)確率上提高了12%。三種半監(jiān)督SVM模型都能實(shí)現(xiàn)對(duì)相互作用位點(diǎn)的預(yù)測(cè),其中S4VM表現(xiàn)最佳,正確率達(dá)到70.7%,靈敏度以及特異度分別為62.67%,78.72%。相較于傳統(tǒng)的實(shí)驗(yàn)以及計(jì)算方法而言,分類效果得到較大提升。
【學(xué)位單位】:安徽工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:Q51;TP181
【部分圖文】:

蛋白質(zhì),殘基,接觸表面,表面


圖 3.1 用于實(shí)驗(yàn)的 91 條蛋白質(zhì)鏈3.2 實(shí)驗(yàn)數(shù)據(jù)集的相關(guān)定義得到 91 條蛋白質(zhì)鏈后,本文對(duì)表面殘基、界面殘基進(jìn)行定義。這是因?yàn)閷?duì)于一條蛋白質(zhì)鏈而言,它是由表面殘基和非表面殘基共同組成,而只有表面殘基才是本文所需要的數(shù)據(jù)。本文按照 Fariselli 等人實(shí)驗(yàn)中使用的方法來對(duì)數(shù)據(jù)加以定義[48],若存在某個(gè)殘基相對(duì)可接觸表面積達(dá)到其最大可接觸表面積的 16%,那么這樣的殘基即被定義成表面殘基,否則即為非表面殘基。表 3.2 展示的是不同氨基酸最大可接觸表面積值。從該表中也可以看出,不同氨基酸之間最大的可接觸的表面積的值同樣存在著差異性。表 3.1 二十種常用氨基酸及其最大可接觸表面積

序列,多序列比對(duì),殘基,空間序列


“.”的含義是對(duì)應(yīng)位置的殘基展現(xiàn)出較弱的保守性。圖 3.3 多序列比對(duì)圖3.3.1 殘基空間序列譜本文首先提取的特征為氨基酸殘基對(duì)應(yīng)空間序列譜,這個(gè)特征在很多研究和實(shí)驗(yàn)中經(jīng)常被使用[54]。它屬于蛋白質(zhì)進(jìn)化保守性特征,在實(shí)際應(yīng)用中能通過多序列比對(duì)等實(shí)驗(yàn)方法獲得[55]。它代表蛋白質(zhì)基礎(chǔ)空間結(jié)構(gòu)之中,在對(duì)應(yīng)殘基序列上各氨基酸出現(xiàn)的頻率。本文在這只考慮表 1.1 中展示的常見的 20 種氨基酸。圖 3.4 殘基空間序列譜

序列,空間序列,殘基,多序列比對(duì)


圖 3.3 多序列比對(duì)圖3.3.1 殘基空間序列譜本文首先提取的特征為氨基酸殘基對(duì)應(yīng)空間序列譜,這個(gè)特征在很多研究和實(shí)驗(yàn)中經(jīng)常被使用[54]。它屬于蛋白質(zhì)進(jìn)化保守性特征,在實(shí)際應(yīng)用中能通過多序列比對(duì)等實(shí)驗(yàn)方法獲得[55]。它代表蛋白質(zhì)基礎(chǔ)空間結(jié)構(gòu)之中,在對(duì)應(yīng)殘基序列上各氨基酸出現(xiàn)的頻率。本文在這只考慮表 1.1 中展示的常見的 20 種氨基酸。

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王建;;蛋白質(zhì)相互作用數(shù)據(jù)庫[J];中國生物化學(xué)與分子生物學(xué)報(bào);2017年08期

2 陳心浩;胡儉;;基于多特征融合預(yù)測(cè)蛋白質(zhì)相互作用界面[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年03期

3 譚從娥;黃祥云;;基于蛋白質(zhì)相互作用網(wǎng)絡(luò)分析右歸丸治療腎陽虛證的療效機(jī)制[J];中國中醫(yī)藥信息雜志;2016年02期

4 楊曉敏;李英倫;;基于蛋白質(zhì)相互作用“熱點(diǎn)”區(qū)域的小分子藥物設(shè)計(jì)研究進(jìn)展[J];生物物理學(xué)報(bào);2015年02期

5 馮舒s

本文編號(hào):2811432


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2811432.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0d900***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com