耐藥菌全基因組測(cè)序數(shù)據(jù)的質(zhì)量控制可視化
發(fā)布時(shí)間:2021-10-22 21:40
耐藥菌的大量存在和傳播,日益威脅公眾健康和衛(wèi)生安全,給臨床、實(shí)驗(yàn)室檢測(cè)和監(jiān)測(cè)細(xì)菌耐藥性方面的工作帶來(lái)嚴(yán)峻挑戰(zhàn),亟需對(duì)病原菌進(jìn)行快速的藥物敏感性測(cè)試和細(xì)菌耐藥機(jī)理分析。單細(xì)胞全基因組測(cè)序在發(fā)現(xiàn)新的耐藥基因上有著快速免培養(yǎng)、可揭示異質(zhì)性等優(yōu)勢(shì),但是由于單細(xì)胞測(cè)序數(shù)據(jù)易污染、測(cè)序偏好性大,需要對(duì)單細(xì)胞測(cè)序數(shù)據(jù)進(jìn)行全面的質(zhì)量控制和深層次分析。目前,針對(duì)耐藥菌基因組數(shù)據(jù)分析的工具和集成化系統(tǒng)有待完善,其分析方法也需改進(jìn)。本文一方面進(jìn)行耐藥菌測(cè)序數(shù)據(jù)的全面質(zhì)量控制。首先,收集公開數(shù)據(jù)并進(jìn)行基本分析,發(fā)現(xiàn)公開系統(tǒng)中數(shù)據(jù)來(lái)源較單一,選取部分?jǐn)?shù)據(jù)作為基因注釋的對(duì)比參考。然后,對(duì)高通量處理結(jié)果進(jìn)行一系列的可視化分析設(shè)計(jì),對(duì)單核苷酸多態(tài)性、基因組污染進(jìn)行統(tǒng)計(jì)分析與可視化;使用t-SNE算法對(duì)序列所屬科系類別進(jìn)行可視化,發(fā)現(xiàn)B3樣本中含大量腸桿菌科、棒桿菌科細(xì)菌和棒狀桿菌等信息。最后,選取單個(gè)、多個(gè)樣本的基因組序列數(shù)據(jù)分別進(jìn)行了潛在類別分析和潛在類別回歸分析,分析耐藥菌的基因序列特點(diǎn),有助于耐藥菌性能的基因分析。另一方面構(gòu)建集成化、可視化的分析系統(tǒng)。使用R的shiny技術(shù)構(gòu)建了單細(xì)胞全基因組測(cè)序數(shù)據(jù)統(tǒng)計(jì)分析可...
【文章來(lái)源】:曲阜師范大學(xué)山東省
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高通量測(cè)序數(shù)據(jù)分析流程圖
第三章全基因組數(shù)據(jù)可視化分析15第三章全基因組數(shù)據(jù)可視化分析3.1數(shù)據(jù)背景目前,國(guó)內(nèi)外對(duì)大腸桿菌的左氧氟沙星耐受性研究少,由前面分析發(fā)現(xiàn)條件致病性大腸桿菌對(duì)養(yǎng)殖業(yè)和公共衛(wèi)生安全都造成極大威脅,本文對(duì)大腸桿菌的左氧氟沙星耐受性進(jìn)行研究,選取單細(xì)胞中心實(shí)驗(yàn)室的基因檢測(cè)數(shù)據(jù)和生物信息數(shù)據(jù)庫(kù)(NCBI、NIAID、PATRIC)中已公布的基因組數(shù)據(jù)庫(kù)。由國(guó)家過敏與感染疾病研究所和疾病預(yù)防控制中心等相關(guān)機(jī)構(gòu)提供資助共同構(gòu)建的病原體系統(tǒng)資源整合中心(PATRIC)是一個(gè)全球化的細(xì)菌生物信息學(xué)資源中心。PATRIC可以提供所有細(xì)菌的生物信息學(xué)分析,特別是病原體的分析,用戶可以訪問250000多個(gè)帶有注釋元數(shù)據(jù)的統(tǒng)一注釋和公開的基因組。PATRIC致力于開發(fā)基因組數(shù)據(jù)分析算法,整合生物信息大數(shù)據(jù)資源,發(fā)展基于基因組數(shù)據(jù)分析的生物信息分析流程,提升基因組數(shù)據(jù)生物信息分析效率和能力。截止到2020年初,PATRIC系統(tǒng)中已經(jīng)整合公開的不同類型大腸桿菌基因組數(shù)據(jù)共9556例,其中全基因組數(shù)據(jù)共8544例,如圖3.1,占總數(shù)的90%以上;其中宿主來(lái)源是人類的數(shù)據(jù)占總數(shù)據(jù)量的一半。圖3.1基因組狀態(tài)占比統(tǒng)計(jì)圖PATRIC中有關(guān)大腸桿菌的基因組樣本統(tǒng)計(jì)情況如下圖,基因組樣本來(lái)自世界眾多國(guó)家的實(shí)驗(yàn)數(shù)據(jù)。通過統(tǒng)計(jì)圖表(圖3.2)可見,數(shù)據(jù)庫(kù)中美國(guó)的數(shù)據(jù)占比為一半以上,其次是中國(guó)、法國(guó)等國(guó)家。從地區(qū)分布地圖(圖3.3)可以看出,數(shù)據(jù)庫(kù)中的數(shù)據(jù)來(lái)源分布全國(guó)各地,在亞歐大陸國(guó)家分布密集。
第三章全基因組數(shù)據(jù)可視化分析16圖3.2PATRIC樣本來(lái)源國(guó)家數(shù)量餅圖圖3.3PATRIC樣本來(lái)源國(guó)家分布地圖系統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)尚不完整和充足,由于不同國(guó)家地區(qū)的不同實(shí)驗(yàn)者的統(tǒng)計(jì)方法有差異,缺失值較多且時(shí)效性不強(qiáng)。除公開數(shù)據(jù)外,本文還采用一批測(cè)試數(shù)據(jù)(由中國(guó)科學(xué)院青島生物能源與過程研究所單細(xì)胞中心提供),是尿路感染病原菌的耐藥性鑒定和單細(xì)胞基因組測(cè)序數(shù)據(jù)的初步分析結(jié)果。3.2單核苷酸多態(tài)性統(tǒng)計(jì)與可視化單核苷酸多態(tài)性(SNP)是指在基因組水平上發(fā)生的單個(gè)核苷酸的變異引起的DNA序列多態(tài)。單核苷酸多態(tài)性統(tǒng)計(jì)與可視化有助于檢測(cè)樣品的單核苷酸變體并對(duì)其進(jìn)行基因分型。本次分析取4個(gè)樣本集,分別標(biāo)記為A9、A10、B3、B9。為解決等位基因缺失,假陽(yáng)性錯(cuò)誤和覆蓋范圍不均的問題,使用專門用于單細(xì)胞數(shù)據(jù)的Monovar技術(shù)[13]檢測(cè)樣品的單核苷酸變體并對(duì)其進(jìn)行基因分型,得到結(jié)果為VCF格式文
【參考文獻(xiàn)】:
期刊論文
[1]基于潛在類別的公路旅客群體細(xì)分模型[J]. 戢曉峰,李德林. 公路交通科技. 2019(10)
[2]醫(yī)學(xué)生睡眠問題的潛類別及其影響因素分析[J]. 周軍,金來(lái)潤(rùn),陶夢(mèng)君,丁書姝,袁慧. 赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版). 2019(07)
[3]全基因組測(cè)序與生物信息學(xué)分析在細(xì)菌耐藥性研究中的應(yīng)用[J]. 沈應(yīng)博,史曉敏,沈建忠,汪洋,王少林. 生物工程學(xué)報(bào). 2019(04)
[4]腸桿菌科細(xì)菌的分布與耐藥性的分析[J]. 蘇曉曼,張義,李慧玲. 黑龍江醫(yī)藥科學(xué). 2018(04)
[5]細(xì)菌耐藥性檢測(cè)技術(shù)方法及其應(yīng)用[J]. 車潔,陳霞,李娟,盧金星. 疾病監(jiān)測(cè). 2017(09)
[6]由H7N9引發(fā)的對(duì)人獸共患病的思考[J]. 張湘安,代茂,楊麗莎. 湖南畜牧獸醫(yī). 2013(04)
[7]病原微生物快速檢測(cè)方法及研究進(jìn)展[J]. 李維彬,郭辰虹,王玉炯. 生物技術(shù)通報(bào). 2006(02)
碩士論文
[1]一種單細(xì)胞測(cè)序數(shù)據(jù)流程化分析方法[D]. 張博洋.哈爾濱工業(yè)大學(xué) 2019
[2]基于單細(xì)胞測(cè)序數(shù)據(jù)的細(xì)胞分化軌跡算法探究[D]. 蘇曉曼.哈爾濱工業(yè)大學(xué) 2019
[3]基于高通量測(cè)序數(shù)據(jù)的人獸共患病病原檢測(cè)分析平臺(tái)的研究與構(gòu)建[D]. 李家寬.軍事科學(xué)院 2018
[4]Pannonibacter phragmitetus 31801的基因組測(cè)序和生物信息學(xué)分析[D]. 周亞軍.華僑大學(xué) 2017
[5]基于乳腺癌基因組數(shù)據(jù)的分析與可視化平臺(tái)實(shí)現(xiàn)[D]. 鄒杰民.湖南大學(xué) 2017
[6]幾種臨床常見致病菌的全基因組序列測(cè)定及分析[D]. 劉豐.北京協(xié)和醫(yī)學(xué)院 2016
[7]基于高通量測(cè)序的微生物基因組學(xué)研究[D]. 黃勇.中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院 2013
本文編號(hào):3451882
【文章來(lái)源】:曲阜師范大學(xué)山東省
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高通量測(cè)序數(shù)據(jù)分析流程圖
第三章全基因組數(shù)據(jù)可視化分析15第三章全基因組數(shù)據(jù)可視化分析3.1數(shù)據(jù)背景目前,國(guó)內(nèi)外對(duì)大腸桿菌的左氧氟沙星耐受性研究少,由前面分析發(fā)現(xiàn)條件致病性大腸桿菌對(duì)養(yǎng)殖業(yè)和公共衛(wèi)生安全都造成極大威脅,本文對(duì)大腸桿菌的左氧氟沙星耐受性進(jìn)行研究,選取單細(xì)胞中心實(shí)驗(yàn)室的基因檢測(cè)數(shù)據(jù)和生物信息數(shù)據(jù)庫(kù)(NCBI、NIAID、PATRIC)中已公布的基因組數(shù)據(jù)庫(kù)。由國(guó)家過敏與感染疾病研究所和疾病預(yù)防控制中心等相關(guān)機(jī)構(gòu)提供資助共同構(gòu)建的病原體系統(tǒng)資源整合中心(PATRIC)是一個(gè)全球化的細(xì)菌生物信息學(xué)資源中心。PATRIC可以提供所有細(xì)菌的生物信息學(xué)分析,特別是病原體的分析,用戶可以訪問250000多個(gè)帶有注釋元數(shù)據(jù)的統(tǒng)一注釋和公開的基因組。PATRIC致力于開發(fā)基因組數(shù)據(jù)分析算法,整合生物信息大數(shù)據(jù)資源,發(fā)展基于基因組數(shù)據(jù)分析的生物信息分析流程,提升基因組數(shù)據(jù)生物信息分析效率和能力。截止到2020年初,PATRIC系統(tǒng)中已經(jīng)整合公開的不同類型大腸桿菌基因組數(shù)據(jù)共9556例,其中全基因組數(shù)據(jù)共8544例,如圖3.1,占總數(shù)的90%以上;其中宿主來(lái)源是人類的數(shù)據(jù)占總數(shù)據(jù)量的一半。圖3.1基因組狀態(tài)占比統(tǒng)計(jì)圖PATRIC中有關(guān)大腸桿菌的基因組樣本統(tǒng)計(jì)情況如下圖,基因組樣本來(lái)自世界眾多國(guó)家的實(shí)驗(yàn)數(shù)據(jù)。通過統(tǒng)計(jì)圖表(圖3.2)可見,數(shù)據(jù)庫(kù)中美國(guó)的數(shù)據(jù)占比為一半以上,其次是中國(guó)、法國(guó)等國(guó)家。從地區(qū)分布地圖(圖3.3)可以看出,數(shù)據(jù)庫(kù)中的數(shù)據(jù)來(lái)源分布全國(guó)各地,在亞歐大陸國(guó)家分布密集。
第三章全基因組數(shù)據(jù)可視化分析16圖3.2PATRIC樣本來(lái)源國(guó)家數(shù)量餅圖圖3.3PATRIC樣本來(lái)源國(guó)家分布地圖系統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)尚不完整和充足,由于不同國(guó)家地區(qū)的不同實(shí)驗(yàn)者的統(tǒng)計(jì)方法有差異,缺失值較多且時(shí)效性不強(qiáng)。除公開數(shù)據(jù)外,本文還采用一批測(cè)試數(shù)據(jù)(由中國(guó)科學(xué)院青島生物能源與過程研究所單細(xì)胞中心提供),是尿路感染病原菌的耐藥性鑒定和單細(xì)胞基因組測(cè)序數(shù)據(jù)的初步分析結(jié)果。3.2單核苷酸多態(tài)性統(tǒng)計(jì)與可視化單核苷酸多態(tài)性(SNP)是指在基因組水平上發(fā)生的單個(gè)核苷酸的變異引起的DNA序列多態(tài)。單核苷酸多態(tài)性統(tǒng)計(jì)與可視化有助于檢測(cè)樣品的單核苷酸變體并對(duì)其進(jìn)行基因分型。本次分析取4個(gè)樣本集,分別標(biāo)記為A9、A10、B3、B9。為解決等位基因缺失,假陽(yáng)性錯(cuò)誤和覆蓋范圍不均的問題,使用專門用于單細(xì)胞數(shù)據(jù)的Monovar技術(shù)[13]檢測(cè)樣品的單核苷酸變體并對(duì)其進(jìn)行基因分型,得到結(jié)果為VCF格式文
【參考文獻(xiàn)】:
期刊論文
[1]基于潛在類別的公路旅客群體細(xì)分模型[J]. 戢曉峰,李德林. 公路交通科技. 2019(10)
[2]醫(yī)學(xué)生睡眠問題的潛類別及其影響因素分析[J]. 周軍,金來(lái)潤(rùn),陶夢(mèng)君,丁書姝,袁慧. 赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版). 2019(07)
[3]全基因組測(cè)序與生物信息學(xué)分析在細(xì)菌耐藥性研究中的應(yīng)用[J]. 沈應(yīng)博,史曉敏,沈建忠,汪洋,王少林. 生物工程學(xué)報(bào). 2019(04)
[4]腸桿菌科細(xì)菌的分布與耐藥性的分析[J]. 蘇曉曼,張義,李慧玲. 黑龍江醫(yī)藥科學(xué). 2018(04)
[5]細(xì)菌耐藥性檢測(cè)技術(shù)方法及其應(yīng)用[J]. 車潔,陳霞,李娟,盧金星. 疾病監(jiān)測(cè). 2017(09)
[6]由H7N9引發(fā)的對(duì)人獸共患病的思考[J]. 張湘安,代茂,楊麗莎. 湖南畜牧獸醫(yī). 2013(04)
[7]病原微生物快速檢測(cè)方法及研究進(jìn)展[J]. 李維彬,郭辰虹,王玉炯. 生物技術(shù)通報(bào). 2006(02)
碩士論文
[1]一種單細(xì)胞測(cè)序數(shù)據(jù)流程化分析方法[D]. 張博洋.哈爾濱工業(yè)大學(xué) 2019
[2]基于單細(xì)胞測(cè)序數(shù)據(jù)的細(xì)胞分化軌跡算法探究[D]. 蘇曉曼.哈爾濱工業(yè)大學(xué) 2019
[3]基于高通量測(cè)序數(shù)據(jù)的人獸共患病病原檢測(cè)分析平臺(tái)的研究與構(gòu)建[D]. 李家寬.軍事科學(xué)院 2018
[4]Pannonibacter phragmitetus 31801的基因組測(cè)序和生物信息學(xué)分析[D]. 周亞軍.華僑大學(xué) 2017
[5]基于乳腺癌基因組數(shù)據(jù)的分析與可視化平臺(tái)實(shí)現(xiàn)[D]. 鄒杰民.湖南大學(xué) 2017
[6]幾種臨床常見致病菌的全基因組序列測(cè)定及分析[D]. 劉豐.北京協(xié)和醫(yī)學(xué)院 2016
[7]基于高通量測(cè)序的微生物基因組學(xué)研究[D]. 黃勇.中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院 2013
本文編號(hào):3451882
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3451882.html
最近更新
教材專著