天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

效應蛋白數(shù)據(jù)庫的構建及預測方法研究

發(fā)布時間:2019-12-03 00:25
【摘要】:病原菌是一種能引起感染的微生物,在這個感染的過程中細菌會侵入到宿主細胞中產(chǎn)生和分泌效應蛋白,這些效應蛋白能夠參與或操控細胞進程的各種重要活動。目前,有九種分泌系統(tǒng)在革蘭氏陰性菌細胞中已被發(fā)現(xiàn)。但是并沒有針對效應蛋白開發(fā)的注釋信息數(shù)據(jù)庫以及對于效應蛋白特征提取和預測的研究并不全面,因此構建一個效應蛋白數(shù)據(jù)庫以及借助機器學習算法和數(shù)據(jù)挖掘的相關技術對效應蛋白序列進行分析,從而能夠完成效應蛋白的預測具有非常重要的意義。本研究主要針對目前細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應蛋白的數(shù)據(jù)庫以及效應蛋白預測方法存在的不足之處,開發(fā)出細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應蛋白的數(shù)據(jù)庫系統(tǒng)SecretEPDB和提出細菌Ⅳ型分泌系統(tǒng)中效應蛋白的預測方法Bastion4。論文主要內(nèi)容如下:(1)細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應蛋白數(shù)據(jù)庫系統(tǒng)SecretEPDB的構建。通過搜集細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)效應蛋白數(shù)據(jù),使用生物信息工具或在不同的公開數(shù)據(jù)庫中根據(jù)效應蛋白的序列提取其注釋信息。同時使用MySQL數(shù)據(jù)庫、Struts 2、Hibernate等計算機技術構建SecretEPDB數(shù)據(jù)庫系統(tǒng)。該數(shù)據(jù)庫系統(tǒng)能夠?qū)θN效應蛋白提供豐富的注釋信息,主要包括:蛋白質(zhì)基本信息、蛋白質(zhì)功能、蛋白質(zhì)二級結(jié)構、Pfam區(qū)域、KEGG通路信息等。與目前其他效應蛋白數(shù)據(jù)庫相比,SecretEPDB數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)都是經(jīng)過實驗驗證的確定性效應蛋白序列,并能提供每一條效應蛋白多方面的注釋信息和相應的統(tǒng)計分析工作。(2)細菌Ⅳ型分泌系統(tǒng)效應蛋白的預測方法Bastion4的研究。該方法的構建步驟為搜集細菌Ⅳ型分泌系統(tǒng)中效應蛋白的序列并進行數(shù)據(jù)預處理,計算并提取蛋白質(zhì)局部序列編碼特征、全局序列編碼特征、結(jié)構描述編碼特征等的不同類型特征,并使用GainRatio方法進行特征選擇,結(jié)合隨機森林算法構建預測模型,最后使用集成學習算法中多數(shù)投票機制對不同的模型進行集成,得到細菌Ⅳ型分泌系統(tǒng)效應蛋白的預測方法Bastion4。通過實驗和案例分析證明:使用不同但是互補的蛋白質(zhì)特征能夠更好的提高預測性能;在基于單一特征的分類器基礎上使用集成學習算法能夠更好的完成效應蛋白的預測。相比于現(xiàn)有的兩個方法T4EffPred和T4SEpre,Bastion4對細菌Ⅳ型分泌系統(tǒng)中效應蛋白的預測性能最優(yōu),F值高達94.2%。
【圖文】:

蛋白質(zhì)序列,格式,序列,學名


酸(Valine)和異亮氨酸(Isoleucine),疏水性相對弱殘基主要有和甲硫ethionine)、色氨酸(Tryptophan)、甘氨酸(Glycine)和丙氨酸(Alanine)。帶基主要有賴氨酸(Lysine)、精氨酸(Arginine);谷氨酸(Glutamate)、天冬spartate)則為帶負電的殘基。表 1-3 表示了組成蛋白質(zhì)一級結(jié)構中常見氨基酸及表示形式。氨基酸組成的蛋白質(zhì)序列常用 fasta 格式的文本形式表示,如圖 1-1(A)即是于 NCBI 數(shù)據(jù)庫蛋白質(zhì)的 fasta 格式,fasta 格式是以“>”開頭,接著是序列的gi|1069777805|gb|AOR81463.1|”,所有來源于 NCBI 的序列均有唯一的 gi 號,是序列的標識符以及序列說明,在該條序列中,“gb|AOR81463.1|”則是表明該于 GenBank 的參考數(shù)據(jù)庫,,接收號是“AOR81463.1”,緊隨其后是序列的描述序列的學名以及種類。此外,圖 1-1(B)是來自于 UniProt 數(shù)據(jù)庫的蛋白質(zhì)序以“>”開頭,序列標識符是“sp”(也可能是“tr”),序列標志還包括該蛋白Prot 數(shù)據(jù)庫的 ID 號、學名、種族信息(OS)、基因組(GN)等信息。換行后是氨基酸序列,每一個氨基酸的位點是使用代表某個氨基酸的字母來表示。A

序列,構建過程,數(shù)據(jù)庫系統(tǒng)


或宿主細胞內(nèi)的系統(tǒng),越來越多的生物實驗已經(jīng)證明效應蛋白對細菌以及宿主有著重要的作用。因此,構建效應蛋白數(shù)據(jù)庫系統(tǒng),從而幫助研究者更為方便地獲取效白的信息就顯得尤為重要。本章通過搜集整理經(jīng)過實驗驗證的細菌Ⅲ型、Ⅳ型、Ⅵ泌系統(tǒng)(T3SS、T4SS、T6SS)的效應蛋白數(shù)據(jù)(T3SE、T4SE、T6SE),使用生物工具或在不同的公開數(shù)據(jù)庫中根據(jù)效應蛋白的序列提取其注釋信息,同時使ySQL 數(shù)據(jù)庫、Struts 2、Hibernate 等計算機技術完成對細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中蛋白數(shù)據(jù)庫系統(tǒng) SecretEPDB(Bacterial Secreted Effector Protein DataBase)的構建。.1 方法概述與流程SecretEPDB 數(shù)據(jù)庫系統(tǒng)的構建流程可分為三個主要步驟:數(shù)據(jù)搜集、注釋信息、構建數(shù)據(jù)庫。第一步為數(shù)據(jù)搜集,本研究從 UniProt 數(shù)據(jù)庫、發(fā)表文獻的正樣本集、相關文獻中這三個方面搜集效應蛋白的數(shù)據(jù),并對這些數(shù)據(jù)進行去重操作,用建 SecretEPDB 的數(shù)據(jù)集。第二步是根據(jù)這些效應蛋白的序列在不同的公開數(shù)據(jù)庫取其注釋信息,或者是使用相應的生物信息工具來預測其相關的注釋信息。第三步用MySQL數(shù)據(jù)庫將效應蛋白的序列信息及其注釋信息存儲,并使用Struts 2、Hibern計算機技術完成 SecretEPDB 的網(wǎng)頁設計與構建。構建過程如圖 3-1 所示。生物信息工具公開數(shù)據(jù)庫
【學位授予單位】:西北農(nóng)林科技大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13;R378

【相似文獻】

相關會議論文 前5條

1 曹鵬;張紅梅;趙學琳;李梅;常文瑞;;幾種植物致病菌丁香假單胞桿菌效應蛋白的晶體學研究[A];第十一次中國生物物理學術大會暨第九屆全國會員代表大會摘要集[C];2009年

2 趙倩;薛曉波;劉之洋;蔡璐璐;馬文秀;鄒麗芳;鄒華松;陳功友;;水稻細菌性條斑病菌Ⅲ型分泌系統(tǒng)分泌的效應蛋白的鑒定[A];中國植物病理學會2011年學術年會論文集[C];2011年

3 吳同壘;吳清民;;布魯氏菌Ⅳ型分泌系統(tǒng)效應蛋白的研究進展[A];中國畜牧獸醫(yī)學會家畜傳染病學分會第八屆全國會員代表大會暨第十五次學術研討會論文集[C];2013年

4 單衛(wèi)星;;植物病原卵菌RXLR效應蛋白的跨膜轉(zhuǎn)運機理研究[A];中國植物病理學會2010年學術年會論文集[C];2010年

5 高月求;姚嫣;朱飛燕;;抑毒方對慢性乙型肝炎患者PBMC免疫效應蛋白表達的干預研究[A];第十次浙江省中西醫(yī)結(jié)合肝病學術會議論文匯編[C];2008年

相關博士學位論文 前6條

1 傅盼翰;志賀氏菌效應蛋白OspI催化泛素結(jié)合酶Ubc13脫酰胺化的分子機制[D];浙江大學;2016年

2 張杰;細菌效應蛋白致病機理和擬南芥抗性機制的研究[D];中國科學院研究生院(上海生命科學研究院);2007年

3 顧彪;植物病原卵菌和真菌效應蛋白轉(zhuǎn)運機制研究[D];西北農(nóng)林科技大學;2012年

4 馮鋒;黃單胞菌效應蛋白AvrAC調(diào)節(jié)植物先天免疫的分子機制[D];清華大學;2012年

5 崔福浩;丁香假單胞效應蛋白AvrRpt2抑制植物免疫分子機制的研究[D];中國農(nóng)業(yè)大學;2013年

6 李姍;病原細菌效應蛋白NIeB家族抑制死亡受體介導的細胞死亡機制的研究[D];中國農(nóng)業(yè)大學;2013年

相關碩士學位論文 前10條

1 黃娟;宿主抵御病原菌入侵的新機制:病原菌效應蛋白的谷胱甘肽化修飾[D];西南大學;2015年

2 徐文婷;嗜吞噬細胞無形體四型分泌系統(tǒng)效應蛋白系統(tǒng)性鑒定及其抗原性研究[D];蘇州大學;2016年

3 李楚楚;副溶血弧菌T3SS2新效應蛋白的鑒定及其功能的初步研究[D];浙江理工大學;2016年

4 溫晶;獼猴桃潰瘍病菌Ⅲ型效應蛋白的篩選及效應蛋白HopX3功能的初步研究[D];西北農(nóng)林科技大學;2016年

5 許強;小麥條銹菌吸器效應蛋白篩選及HASP268效應蛋白靶標鑒定[D];西北農(nóng)林科技大學;2016年

6 趙海斌;小麥條銹菌吸器關鍵效應蛋白三維結(jié)構的研究[D];西北農(nóng)林科技大學;2017年

7 伍海英;鸚鵡熱嗜衣原體Ⅲ型分泌系統(tǒng)效應蛋白的預測、鑒定及特性的研究[D];南華大學;2013年

8 陸敢;以釀酒酵母為替代宿主研究嗜肺軍團菌效應蛋白的功能[D];中山大學;2011年

9 黎知青;預測的鸚鵡熱嗜衣原體Ⅲ型分泌系統(tǒng)效應蛋白的定位及相關性質(zhì)的初步研究[D];南華大學;2013年

10 何燕華;稻瘟菌新型效應蛋白的篩選及功能初步分析[D];福建師范大學;2014年



本文編號:2568967

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2568967.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶5d734***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com