【摘要】:病毒是世界上最豐富多樣的微生物群體,其廣泛存在于各種生物體及環(huán)境中,并且在環(huán)境和人類健康中扮演著重要的角色。病毒宏基因組學(xué)技術(shù)的出現(xiàn)打破了傳統(tǒng)分離鑒定方法的瓶頸,加快了人類對(duì)病毒研究的步伐。隨著測(cè)序技術(shù)的快速進(jìn)步及相關(guān)費(fèi)用的逐步降低,宏病毒組學(xué)技術(shù)已經(jīng)成為新病毒發(fā)現(xiàn)的最為重要的手段之一。在以動(dòng)物新發(fā)疫情監(jiān)測(cè)和預(yù)警為主要功能的實(shí)驗(yàn)室,數(shù)據(jù)分析的效率和準(zhǔn)確性對(duì)疫情早期防控至關(guān)重要,而目前以商業(yè)公司為依托的宏病毒測(cè)序及數(shù)據(jù)分析模式,無(wú)法滿足該需求,亟需建立本地的宏病毒數(shù)據(jù)分析平臺(tái),為新發(fā)疫情早期預(yù)警提供技術(shù)支撐。為建立本地化動(dòng)物宏病毒數(shù)據(jù)分析平臺(tái),本研究首先利用Perl語(yǔ)言程序及MySQL數(shù)據(jù)庫(kù)語(yǔ)言建立起標(biāo)準(zhǔn)化且兼容性良好的病毒基因組參考數(shù)據(jù)庫(kù),其包含89個(gè)病毒科或?qū)僭趦?nèi)的11萬(wàn)多條目前已知的病毒全基因序列。其次,根據(jù)宏基因組數(shù)據(jù)分析流程,建立和部署了測(cè)序原始數(shù)據(jù)質(zhì)控、數(shù)據(jù)清洗、序列拼接、序列注釋、功能預(yù)測(cè)以及遺傳演化分析等應(yīng)用程序,構(gòu)建起了本地宏病毒組數(shù)據(jù)分析平臺(tái)。另外,根據(jù)動(dòng)物新病毒發(fā)現(xiàn)中對(duì)敏感性和特異性的不同需求,建立了兩種基因序列注釋策略:基于讀長(zhǎng)序列分析(Assembly-free analysis)和基于重疊序列分析(Assembly-based analysis),前者能提高注釋的敏感性,有利于發(fā)現(xiàn)低拷貝的病毒基因組序列;后者可提高注釋的特異性,保障注釋結(jié)果的準(zhǔn)確性。為驗(yàn)證該平臺(tái)的應(yīng)用效果,首先利用數(shù)據(jù)質(zhì)控和清洗軟件對(duì)從安徽省采集的豬群鼻拭子樣品及血清樣品中獲得的宏基因組數(shù)據(jù)進(jìn)行了分析和處理,原始測(cè)序數(shù)據(jù)經(jīng)接頭序列及低質(zhì)量序列去除后分別得到31490033和41208780對(duì)讀長(zhǎng)序列。將得到的讀長(zhǎng)序列利用MEGAHIT軟件進(jìn)行基因組序列組裝,組裝后結(jié)果顯示鼻拭子樣品得到415117條重疊序列(contig),血清樣品得到81026條重疊序列。隨后利用基礎(chǔ)病毒基因組數(shù)據(jù)庫(kù)和注釋軟件對(duì)組裝后的重疊序列進(jìn)行基因注釋,結(jié)果顯示鼻拭子樣品中共計(jì)307 contigs被注釋到1942條病毒序列,其中48.9%為指環(huán)病毒科(Anelloviridae)病毒序列,20.2%為細(xì)小病毒科(Parvoviridae)序列,16.2%為圓環(huán)病毒科(Circoviridae)序列,11.1%為冠狀病毒科(Coronaviridae)序列;此外還包括多種其它病毒,如哺乳動(dòng)物星狀病毒、痘病毒、白血病病毒等;血清樣品中共計(jì)10012條重疊序列被注釋到1376條病毒序列,其中細(xì)小病毒科序列占66.5%,指環(huán)病毒科序列占29.5%,圓環(huán)病毒科序列占1.3%。以上結(jié)果說(shuō)明血清樣品和鼻拭子樣品中病毒多樣性存在差異。此外,實(shí)例宏病毒組數(shù)據(jù)分析發(fā)現(xiàn)不同研究策略分析效率略有不同,完成基于讀長(zhǎng)序列注釋分析耗時(shí)1.5 d,而基于重疊序列注釋分析則耗時(shí)3.5 d。以上研究結(jié)果表明,本研究成功建立了一個(gè)本地化的動(dòng)物病毒宏基因組數(shù)據(jù)分析平臺(tái),利用該平臺(tái)可高效、準(zhǔn)確地完成動(dòng)物病毒宏病毒組學(xué)數(shù)據(jù)分析,能滿足新發(fā)動(dòng)物病毒病監(jiān)測(cè)和預(yù)警的需求,對(duì)我國(guó)動(dòng)物疫病防控具有重要意義。
【圖文】:
共計(jì)完成 11 萬(wàn)多條病毒序列的匯總(圖2.2)。至此,我們完成了本地化病毒基因組數(shù)據(jù)庫(kù)的構(gòu)建。圖 2.2 病毒基因組數(shù)據(jù)庫(kù)病毒科組成Fig. 2.2 The component of the virus family of the viral genome database

圖 2.1 病毒基因組數(shù)據(jù)庫(kù)中數(shù)據(jù)表關(guān)系Fig. 2.1 The relationships of tables of the viral genome database我們對(duì)包括脊椎動(dòng)物病毒、無(wú)脊椎動(dòng)物病毒和植物病毒等在附錄 4)的病毒序列進(jìn)行下載整理,共計(jì)完成 11 萬(wàn)多條病完成了本地化病毒基因組數(shù)據(jù)庫(kù)的構(gòu)建。
【學(xué)位授予單位】:中國(guó)農(nóng)業(yè)科學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:S852.65
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐瑩;于耳;;構(gòu)建高校大數(shù)據(jù)分析平臺(tái)的探索——以上海公安高等?茖W(xué)校為例[J];中國(guó)教育信息化;2017年05期
2 夏楊;王芳;;基于一卡通數(shù)據(jù)的校園大數(shù)據(jù)分析平臺(tái)的構(gòu)建與應(yīng)用[J];華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年S1期
3 陳甜甜;;國(guó)外知名大數(shù)據(jù)分析平臺(tái)概覽(上)[J];中國(guó)安防;2017年06期
4 陳甜甜;;國(guó)外知名大數(shù)據(jù)分析平臺(tái)概覽(下)[J];中國(guó)安防;2017年07期
5 田磊;;大數(shù)據(jù)分析平臺(tái)建設(shè)與應(yīng)用探析[J];科技經(jīng)濟(jì)導(dǎo)刊;2017年25期
6 成靜靜;喻朝新;;基于云計(jì)算的大數(shù)據(jù)統(tǒng)一分析平臺(tái)研究與設(shè)計(jì)[J];廣東通信技術(shù);2013年01期
7 潘果;;論物流統(tǒng)計(jì)數(shù)據(jù)分析平臺(tái)的構(gòu)建[J];今日南國(guó)(理論創(chuàng)新版);2008年07期
8 陳青艷;陳開慧;;強(qiáng)負(fù)荷網(wǎng)絡(luò)環(huán)境下的大型負(fù)載分析平臺(tái)的設(shè)計(jì)與優(yōu)化[J];現(xiàn)代電子技術(shù);2017年02期
9 張昊;;企業(yè)級(jí)安全大數(shù)據(jù)分析平臺(tái)[J];電信技術(shù);2017年09期
10 徐艷艷;趙春;馬晨輝;沈富可;;學(xué)習(xí)分析平臺(tái)告訴你:學(xué)生如何參與網(wǎng)上課程[J];中國(guó)教育網(wǎng)絡(luò);2016年08期
相關(guān)會(huì)議論文 前10條
1 陳林;程登發(fā);田U,
本文編號(hào):2676892
本文鏈接:http://sikaile.net/yixuelunwen/dongwuyixue/2676892.html