天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

效應(yīng)蛋白數(shù)據(jù)庫的構(gòu)建及預(yù)測方法研究

發(fā)布時間:2019-12-03 00:25
【摘要】:病原菌是一種能引起感染的微生物,在這個感染的過程中細菌會侵入到宿主細胞中產(chǎn)生和分泌效應(yīng)蛋白,這些效應(yīng)蛋白能夠參與或操控細胞進程的各種重要活動。目前,有九種分泌系統(tǒng)在革蘭氏陰性菌細胞中已被發(fā)現(xiàn)。但是并沒有針對效應(yīng)蛋白開發(fā)的注釋信息數(shù)據(jù)庫以及對于效應(yīng)蛋白特征提取和預(yù)測的研究并不全面,因此構(gòu)建一個效應(yīng)蛋白數(shù)據(jù)庫以及借助機器學(xué)習算法和數(shù)據(jù)挖掘的相關(guān)技術(shù)對效應(yīng)蛋白序列進行分析,從而能夠完成效應(yīng)蛋白的預(yù)測具有非常重要的意義。本研究主要針對目前細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應(yīng)蛋白的數(shù)據(jù)庫以及效應(yīng)蛋白預(yù)測方法存在的不足之處,開發(fā)出細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應(yīng)蛋白的數(shù)據(jù)庫系統(tǒng)SecretEPDB和提出細菌Ⅳ型分泌系統(tǒng)中效應(yīng)蛋白的預(yù)測方法Bastion4。論文主要內(nèi)容如下:(1)細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應(yīng)蛋白數(shù)據(jù)庫系統(tǒng)SecretEPDB的構(gòu)建。通過搜集細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)效應(yīng)蛋白數(shù)據(jù),使用生物信息工具或在不同的公開數(shù)據(jù)庫中根據(jù)效應(yīng)蛋白的序列提取其注釋信息。同時使用MySQL數(shù)據(jù)庫、Struts 2、Hibernate等計算機技術(shù)構(gòu)建SecretEPDB數(shù)據(jù)庫系統(tǒng)。該數(shù)據(jù)庫系統(tǒng)能夠?qū)θN效應(yīng)蛋白提供豐富的注釋信息,主要包括:蛋白質(zhì)基本信息、蛋白質(zhì)功能、蛋白質(zhì)二級結(jié)構(gòu)、Pfam區(qū)域、KEGG通路信息等。與目前其他效應(yīng)蛋白數(shù)據(jù)庫相比,SecretEPDB數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)都是經(jīng)過實驗驗證的確定性效應(yīng)蛋白序列,并能提供每一條效應(yīng)蛋白多方面的注釋信息和相應(yīng)的統(tǒng)計分析工作。(2)細菌Ⅳ型分泌系統(tǒng)效應(yīng)蛋白的預(yù)測方法Bastion4的研究。該方法的構(gòu)建步驟為搜集細菌Ⅳ型分泌系統(tǒng)中效應(yīng)蛋白的序列并進行數(shù)據(jù)預(yù)處理,計算并提取蛋白質(zhì)局部序列編碼特征、全局序列編碼特征、結(jié)構(gòu)描述編碼特征等的不同類型特征,并使用GainRatio方法進行特征選擇,結(jié)合隨機森林算法構(gòu)建預(yù)測模型,最后使用集成學(xué)習算法中多數(shù)投票機制對不同的模型進行集成,得到細菌Ⅳ型分泌系統(tǒng)效應(yīng)蛋白的預(yù)測方法Bastion4。通過實驗和案例分析證明:使用不同但是互補的蛋白質(zhì)特征能夠更好的提高預(yù)測性能;在基于單一特征的分類器基礎(chǔ)上使用集成學(xué)習算法能夠更好的完成效應(yīng)蛋白的預(yù)測。相比于現(xiàn)有的兩個方法T4EffPred和T4SEpre,Bastion4對細菌Ⅳ型分泌系統(tǒng)中效應(yīng)蛋白的預(yù)測性能最優(yōu),F值高達94.2%。
【圖文】:

蛋白質(zhì)序列,格式,序列,學(xué)名


酸(Valine)和異亮氨酸(Isoleucine),疏水性相對弱殘基主要有和甲硫ethionine)、色氨酸(Tryptophan)、甘氨酸(Glycine)和丙氨酸(Alanine)。帶基主要有賴氨酸(Lysine)、精氨酸(Arginine);谷氨酸(Glutamate)、天冬spartate)則為帶負電的殘基。表 1-3 表示了組成蛋白質(zhì)一級結(jié)構(gòu)中常見氨基酸及表示形式。氨基酸組成的蛋白質(zhì)序列常用 fasta 格式的文本形式表示,如圖 1-1(A)即是于 NCBI 數(shù)據(jù)庫蛋白質(zhì)的 fasta 格式,fasta 格式是以“>”開頭,接著是序列的gi|1069777805|gb|AOR81463.1|”,所有來源于 NCBI 的序列均有唯一的 gi 號,是序列的標識符以及序列說明,在該條序列中,“gb|AOR81463.1|”則是表明該于 GenBank 的參考數(shù)據(jù)庫,,接收號是“AOR81463.1”,緊隨其后是序列的描述序列的學(xué)名以及種類。此外,圖 1-1(B)是來自于 UniProt 數(shù)據(jù)庫的蛋白質(zhì)序以“>”開頭,序列標識符是“sp”(也可能是“tr”),序列標志還包括該蛋白Prot 數(shù)據(jù)庫的 ID 號、學(xué)名、種族信息(OS)、基因組(GN)等信息。換行后是氨基酸序列,每一個氨基酸的位點是使用代表某個氨基酸的字母來表示。A

序列,構(gòu)建過程,數(shù)據(jù)庫系統(tǒng)


或宿主細胞內(nèi)的系統(tǒng),越來越多的生物實驗已經(jīng)證明效應(yīng)蛋白對細菌以及宿主有著重要的作用。因此,構(gòu)建效應(yīng)蛋白數(shù)據(jù)庫系統(tǒng),從而幫助研究者更為方便地獲取效白的信息就顯得尤為重要。本章通過搜集整理經(jīng)過實驗驗證的細菌Ⅲ型、Ⅳ型、Ⅵ泌系統(tǒng)(T3SS、T4SS、T6SS)的效應(yīng)蛋白數(shù)據(jù)(T3SE、T4SE、T6SE),使用生物工具或在不同的公開數(shù)據(jù)庫中根據(jù)效應(yīng)蛋白的序列提取其注釋信息,同時使ySQL 數(shù)據(jù)庫、Struts 2、Hibernate 等計算機技術(shù)完成對細菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中蛋白數(shù)據(jù)庫系統(tǒng) SecretEPDB(Bacterial Secreted Effector Protein DataBase)的構(gòu)建。.1 方法概述與流程SecretEPDB 數(shù)據(jù)庫系統(tǒng)的構(gòu)建流程可分為三個主要步驟:數(shù)據(jù)搜集、注釋信息、構(gòu)建數(shù)據(jù)庫。第一步為數(shù)據(jù)搜集,本研究從 UniProt 數(shù)據(jù)庫、發(fā)表文獻的正樣本集、相關(guān)文獻中這三個方面搜集效應(yīng)蛋白的數(shù)據(jù),并對這些數(shù)據(jù)進行去重操作,用建 SecretEPDB 的數(shù)據(jù)集。第二步是根據(jù)這些效應(yīng)蛋白的序列在不同的公開數(shù)據(jù)庫取其注釋信息,或者是使用相應(yīng)的生物信息工具來預(yù)測其相關(guān)的注釋信息。第三步用MySQL數(shù)據(jù)庫將效應(yīng)蛋白的序列信息及其注釋信息存儲,并使用Struts 2、Hibern計算機技術(shù)完成 SecretEPDB 的網(wǎng)頁設(shè)計與構(gòu)建。構(gòu)建過程如圖 3-1 所示。生物信息工具公開數(shù)據(jù)庫
【學(xué)位授予單位】:西北農(nóng)林科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13;R378

【相似文獻】

相關(guān)會議論文 前5條

1 曹鵬;張紅梅;趙學(xué)琳;李梅;常文瑞;;幾種植物致病菌丁香假單胞桿菌效應(yīng)蛋白的晶體學(xué)研究[A];第十一次中國生物物理學(xué)術(shù)大會暨第九屆全國會員代表大會摘要集[C];2009年

2 趙倩;薛曉波;劉之洋;蔡璐璐;馬文秀;鄒麗芳;鄒華松;陳功友;;水稻細菌性條斑病菌Ⅲ型分泌系統(tǒng)分泌的效應(yīng)蛋白的鑒定[A];中國植物病理學(xué)會2011年學(xué)術(shù)年會論文集[C];2011年

3 吳同壘;吳清民;;布魯氏菌Ⅳ型分泌系統(tǒng)效應(yīng)蛋白的研究進展[A];中國畜牧獸醫(yī)學(xué)會家畜傳染病學(xué)分會第八屆全國會員代表大會暨第十五次學(xué)術(shù)研討會論文集[C];2013年

4 單衛(wèi)星;;植物病原卵菌RXLR效應(yīng)蛋白的跨膜轉(zhuǎn)運機理研究[A];中國植物病理學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年

5 高月求;姚嫣;朱飛燕;;抑毒方對慢性乙型肝炎患者PBMC免疫效應(yīng)蛋白表達的干預(yù)研究[A];第十次浙江省中西醫(yī)結(jié)合肝病學(xué)術(shù)會議論文匯編[C];2008年

相關(guān)博士學(xué)位論文 前6條

1 傅盼翰;志賀氏菌效應(yīng)蛋白OspI催化泛素結(jié)合酶Ubc13脫酰胺化的分子機制[D];浙江大學(xué);2016年

2 張杰;細菌效應(yīng)蛋白致病機理和擬南芥抗性機制的研究[D];中國科學(xué)院研究生院(上海生命科學(xué)研究院);2007年

3 顧彪;植物病原卵菌和真菌效應(yīng)蛋白轉(zhuǎn)運機制研究[D];西北農(nóng)林科技大學(xué);2012年

4 馮鋒;黃單胞菌效應(yīng)蛋白AvrAC調(diào)節(jié)植物先天免疫的分子機制[D];清華大學(xué);2012年

5 崔福浩;丁香假單胞效應(yīng)蛋白AvrRpt2抑制植物免疫分子機制的研究[D];中國農(nóng)業(yè)大學(xué);2013年

6 李姍;病原細菌效應(yīng)蛋白NIeB家族抑制死亡受體介導(dǎo)的細胞死亡機制的研究[D];中國農(nóng)業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 黃娟;宿主抵御病原菌入侵的新機制:病原菌效應(yīng)蛋白的谷胱甘肽化修飾[D];西南大學(xué);2015年

2 徐文婷;嗜吞噬細胞無形體四型分泌系統(tǒng)效應(yīng)蛋白系統(tǒng)性鑒定及其抗原性研究[D];蘇州大學(xué);2016年

3 李楚楚;副溶血弧菌T3SS2新效應(yīng)蛋白的鑒定及其功能的初步研究[D];浙江理工大學(xué);2016年

4 溫晶;獼猴桃潰瘍病菌Ⅲ型效應(yīng)蛋白的篩選及效應(yīng)蛋白HopX3功能的初步研究[D];西北農(nóng)林科技大學(xué);2016年

5 許強;小麥條銹菌吸器效應(yīng)蛋白篩選及HASP268效應(yīng)蛋白靶標鑒定[D];西北農(nóng)林科技大學(xué);2016年

6 趙海斌;小麥條銹菌吸器關(guān)鍵效應(yīng)蛋白三維結(jié)構(gòu)的研究[D];西北農(nóng)林科技大學(xué);2017年

7 伍海英;鸚鵡熱嗜衣原體Ⅲ型分泌系統(tǒng)效應(yīng)蛋白的預(yù)測、鑒定及特性的研究[D];南華大學(xué);2013年

8 陸敢;以釀酒酵母為替代宿主研究嗜肺軍團菌效應(yīng)蛋白的功能[D];中山大學(xué);2011年

9 黎知青;預(yù)測的鸚鵡熱嗜衣原體Ⅲ型分泌系統(tǒng)效應(yīng)蛋白的定位及相關(guān)性質(zhì)的初步研究[D];南華大學(xué);2013年

10 何燕華;稻瘟菌新型效應(yīng)蛋白的篩選及功能初步分析[D];福建師范大學(xué);2014年



本文編號:2568967

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2568967.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5d734***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com