天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

結(jié)核分枝桿菌基因組重注釋研究

發(fā)布時間:2018-08-20 14:32
【摘要】:結(jié)核病每年都對全世界人民的身體健康造成嚴(yán)重的危害,其中結(jié)核分枝桿菌(Mycobacterium tuberculosis)是結(jié)核病的病原菌。雖然關(guān)于結(jié)核分枝桿菌基因組學(xué)研究取得了很大的進(jìn)展,在基因組公共數(shù)據(jù)庫中已有結(jié)核分枝桿菌全基因組的注釋信息,但隨著時間的推移,越來越多新的基因功能信息被添加進(jìn)數(shù)據(jù)庫,這其中就可能包含當(dāng)初對結(jié)核分枝桿菌進(jìn)行注釋時未被使用的具有序列相似性的基因。在基因組分析時,這些新添加的基因功能信息可能為一些假想的基因提供功能轉(zhuǎn)移來源。同時一些原始注釋中未包含的基因也可能通過與新添加的基因功能信息進(jìn)行相似性比對而被發(fā)現(xiàn)。本文將針對以上問題,以最新的基因組公共數(shù)據(jù)庫為標(biāo)準(zhǔn),通過基因相似性比對以及基于從頭預(yù)測的方法發(fā)現(xiàn)新基因等方法,對結(jié)核分枝桿菌基因組信息進(jìn)行重新注釋研究。本研究的方法可為其他物種的基因組重注釋工作提供參考。本研究的主要內(nèi)容為:1.以Z曲線理論方法為基礎(chǔ),從原始基因注釋中篩選出從屬于功能已知的蛋白質(zhì)編碼基因(第一類基因)作為正樣本,并用第一類基因的隨機洗牌序列生成負(fù)樣本。以正負(fù)樣本為訓(xùn)練集,通過基于五重交叉驗證的Fisher模型確定假設(shè)基因(第二類基因)中非編碼的部分,即原注釋中錯誤注釋的基因。2.使用Prodigal和Zcurve兩款基因預(yù)測軟件對結(jié)核分枝桿菌基因組進(jìn)行基因預(yù)測,將基因預(yù)測結(jié)果與原始基因組注釋進(jìn)行對比,挑選出重疊率低的候選新基因進(jìn)行Blast序列比對,應(yīng)用設(shè)定的篩選參數(shù)挑選出滿足條件的新基因,并為新基因添加具體的功能注釋信息。3.在基因重注釋過程中,需要研究人員進(jìn)行手動篩選,當(dāng)有大量的基因組需要重注釋,尤其是從Blast結(jié)果中篩選出滿足條件的新基因時,將會是一個非常繁重的工作。因此本研究還使用PHP開發(fā)了一套能夠自動進(jìn)行基因組重注釋的Web工具,在實現(xiàn)重注釋工具化減少人工手動篩選工作量的同時,也能大大提高基因重注釋的效率。
[Abstract]:Tuberculosis causes serious harm to the health of people all over the world every year. Among them, Mycobacterium tuberculosis (Mycobacterium tuberculosis) is the pathogen of tuberculosis. Although much progress has been made in the study of the genomics of Mycobacterium tuberculosis, the annotated information on the entire genome of Mycobacterium tuberculosis is available in the genome public database, but over time, More and more new genetic functional information has been added to the database, which may contain sequence-like genes that were not used in the initial annotation of Mycobacterium tuberculosis. In genome analysis, these new gene function information may provide a functional transfer source for some hypothetical genes. At the same time, some genes not contained in the original annotation may be found by comparing with the newly added gene function information. In order to solve the above problems, we will reannotate the genome information of Mycobacterium tuberculosis by means of gene similarity comparison and new gene discovery based on ab initio prediction. The method of this study can be used as a reference for genome reannotation of other species. The main contents of this study are: 1: 1. Based on the Z curve theory, a protein encoding gene (the first type gene) with known function is selected from the original gene annotation as a positive sample, and a negative sample is generated by random shuffling sequence of the first type gene. Taking positive and negative samples as training set, the non-coding part of hypothetical gene (second type gene) is determined by Fisher model based on quintuple cross validation, that is, the wrong annotated gene. 2 in the original annotation. Prodigal and Zcurve were used to predict the genome of Mycobacterium tuberculosis. The results of gene prediction were compared with the original genome annotation, and the candidate genes with low overlap rate were selected for Blast sequence alignment. The new genes that meet the conditions were selected by using the selected screening parameters, and specific functional annotation information was added to the new genes. In the process of gene reannotation, it is necessary for researchers to carry out manual screening. When there are a large number of genomes that need to be re-annotated, especially when new genes are selected from Blast results to meet the requirements, it will be a very heavy task. Therefore, this study also developed a set of Web tools which can automatically reannotate genome by using PHP, which can reduce the manual screening workload and improve the efficiency of gene reannotation greatly.
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:R378.911

【相似文獻(xiàn)】

相關(guān)期刊論文 前4條

1 徐永忠;對推算全基因組易位率公式的探討[J];國外醫(yī)學(xué)(放射醫(yī)學(xué)核醫(yī)學(xué)分冊);1999年01期

2 王亞之;李秋實;陳士林;孫超;宋經(jīng)元;;基于流式細(xì)胞分析技術(shù)的茯苓基因組大小測定[J];世界科學(xué)技術(shù)(中醫(yī)藥現(xiàn)代化);2010年03期

3 張陣陣;郭美麗;張軍東;;紅花基因組擴(kuò)增片段長度多態(tài)性反應(yīng)體系的建立和優(yōu)化[J];第二軍醫(yī)大學(xué)學(xué)報;2006年03期

4 ;[J];;年期

相關(guān)會議論文 前3條

1 李秋實;徐江;朱英杰;孫超;宋經(jīng)元;陳士林;;基于流式細(xì)胞術(shù)的赤芝基因組大小估測[A];第十一屆全國青年藥學(xué)工作者最新科研成果交流會論文集[C];2012年

2 張琳琳;李莉;許飛;亓海剛;王曉通;張國范;;長牡蠣基因組fosmid文庫的構(gòu)建及分析[A];中國動物學(xué)會、中國海洋湖沼學(xué)會貝類學(xué)會分會第十四次學(xué)會研討會論文摘要匯編[C];2009年

3 陳曉丹;王永;盧軍;朱利泉;王小佳;;蕓薹屬A基因組DNA封阻下的C染色體組核型分析[A];第九屆西南三省一市生物化學(xué)與分子生物學(xué)學(xué)術(shù)交流會論文集[C];2008年

相關(guān)重要報紙文章 前10條

1 宗合;科學(xué)家破譯木豆基因組將加速育種發(fā)展[N];糧油市場報;2011年

2 記者 夏靜 通訊員 范敬群;我首個果樹基因組序列圖譜完成[N];光明日報;2012年

3 鐵錚 記者 趙鳳華;我科學(xué)家繪制出毛白楊基因組序列框架圖[N];科技日報;2011年

4 仲亞;靈芝全基因組精細(xì)圖譜發(fā)布[N];中國中醫(yī)藥報;2012年

5 記者 譚大躍 通訊員 王靜思 梁藝染;中美科學(xué)家合作解碼螞蟻基因組[N];深圳特區(qū)報;2010年

6 記者 張聰;我國首發(fā)丹參基因組框架圖[N];中國中醫(yī)藥報;2010年

7 記者 劉傳書;我科學(xué)家繪出大熊貓“晶晶”基因組精細(xì)圖[N];科技日報;2009年

8 記者 譚大躍 通訊員 逄莎莎;白菜全基因組研究成果發(fā)表[N];深圳特區(qū)報;2011年

9 記者 吳春燕;石斑魚全基因組序列圖譜繪制完成[N];光明日報;2011年

10 宋明輝;廣東破解石斑魚基因圖譜[N];中國漁業(yè)報;2011年

相關(guān)博士學(xué)位論文 前10條

1 張麗敏;高梁基因組內(nèi)大片段獲得與缺失變異挖掘及其與重要農(nóng)藝性狀的關(guān)聯(lián)分析[D];吉林大學(xué);2013年

2 周正奎;全基因組關(guān)聯(lián)分析和全基因組預(yù)測法解析犬髖關(guān)節(jié)疾病[D];西北農(nóng)林科技大學(xué);2011年

3 黃金龍;馬屬基因組和染色體快速進(jìn)化的研究[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2015年

4 曹月青;鑒定不同基因組之間差異序列的新方法研究[D];重慶大學(xué);2005年

5 凌娜;節(jié)旋藻/螺旋藻基因組特性初探及硝酸鹽轉(zhuǎn)運蛋白基因克隆與序列分析[D];中國海洋大學(xué);2006年

6 龔強;基因組變異的深度挖掘[D];中國科學(xué)院北京基因組研究所;2013年

7 歐z延,

本文編號:2193960


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/2193960.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e3ced***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com