宏基因組分類分析方法的研究和應(yīng)用
本文關(guān)鍵詞:宏基因組分類分析方法的研究和應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著環(huán)境微生物研究的發(fā)展和高通量測(cè)序技術(shù)的出現(xiàn),微生物的研究迎來(lái)了宏基因組學(xué)的技術(shù)研究時(shí)代。突破傳統(tǒng)微生物學(xué)研究方法的瓶頸,宏基因組學(xué)直接研究環(huán)境微生物的基因組。近年來(lái)大量研究表明,人體的多種疾病與人體類各個(gè)器官的微生物群落是息息相關(guān)的,而宏基因組樣本分類方法成為研究微生物群落與宿主或環(huán)境關(guān)系的重要研究手段:通過(guò)提取宏基因組樣本的特征,結(jié)合分類算法鑒定樣本類別。目前宏基因組樣本分類方法大多使用微生物的全基因組序列,本文深入研究了基于16S rRNA基因序列微生物群落分析方法,建立了一套基于16S rRNA基因序列的樣本分類流程,并將分析與分類方法應(yīng)用到小鼠及人類腸道微生物群落的研究中。樣本分類的重要前提是對(duì)不同狀態(tài)的樣本提取一種具有顯著差異性的特征。本文深入研究不同樣本的16S rRNA基因序列,通過(guò)模擬數(shù)據(jù)分析驗(yàn)證群落結(jié)構(gòu)作為樣本特征的可行性。分析結(jié)果表明,物種豐度包含了樣本中微生物的物種數(shù)目、比例,是最基本的樣本特征;α多樣性提煉了樣本的物種豐度信息,降低了樣本特征維數(shù),是一種較為重要的樣本特征;β多樣性特征同時(shí)結(jié)合了群落獨(dú)立進(jìn)化信息(UniFrac)和物種豐度,是較為理想的樣本特征。結(jié)合隨機(jī)森林算法和三種有效的樣本特征,我們建立了一套基于16S rRNA基因序列的樣本分類流程。通過(guò)對(duì)不同參數(shù)的模擬數(shù)據(jù)集的分類實(shí)驗(yàn),我們比較了樣本類別數(shù)、特征的類間方差、類內(nèi)方差以及系統(tǒng)發(fā)育樹(shù)高度對(duì)分類流程準(zhǔn)確率的影響。最終的分類結(jié)果表明,在樣本特征類間差異不明顯,即類內(nèi)特征方差大、類間特征方差小的情況下本文所建立的分類流程分類準(zhǔn)確率比其他分類方法高;在樣本類別數(shù)增加、群落進(jìn)化關(guān)系復(fù)雜等情況下,本文所建立的流程較其他分類方法表現(xiàn)更好。實(shí)驗(yàn)結(jié)果表明我們?cè)O(shè)計(jì)的宏基因組樣本分類流程具有良好的分類性能,能夠準(zhǔn)確鑒別基于16S rRNA序列的宏基因組樣本。將所建立的基于16S rRNA基因序列的宏基因組樣本分類分析流程分別應(yīng)用于小鼠和人類腸道微生物樣本。實(shí)驗(yàn)結(jié)果表明我們發(fā)展的分類流程對(duì)與環(huán)境相關(guān)的小鼠腸道微生物樣本分類準(zhǔn)確率高于88%,能夠準(zhǔn)確地對(duì)小鼠腸道宏基因組樣本中微生物群落所生存的環(huán)境類別進(jìn)行區(qū)分。同時(shí)分類結(jié)果表明:特征向量的類間方差小的兩組樣本錯(cuò)分而導(dǎo)致的樣本分類錯(cuò)誤較多;不同環(huán)境下小鼠腸道微生物樣本的群落獨(dú)立進(jìn)化信息(UniFrac)對(duì)樣本差異性的體現(xiàn)不如物種進(jìn)化關(guān)系。對(duì)于與肥胖相關(guān)的人類腸道微生物樣本,我們發(fā)展的流程的分類準(zhǔn)確率達(dá)到75%以上,基本能夠鑒定人類腸道宏基因組樣本中微生物群落的宿主的體型類別。同時(shí)分類結(jié)果還表明:過(guò)重組和肥胖組兩類樣本組的特征向量的類間方差低而經(jīng)常導(dǎo)致樣本錯(cuò)分;肥胖相關(guān)人類腸道微生物樣本的群落獨(dú)立進(jìn)化信息作為樣本特征的分類性能要優(yōu)于微生物物種進(jìn)化信息,我們認(rèn)為群落獨(dú)立進(jìn)化信息更能體現(xiàn)有著不同身體質(zhì)量指數(shù)人群的腸道微生物差異。綜合兩組數(shù)據(jù)實(shí)驗(yàn)結(jié)論如下:首先,樣本特征的類間方差對(duì)分類準(zhǔn)確率影響較大,類間方差較小的兩組樣本容易錯(cuò)分而導(dǎo)致分類準(zhǔn)確率降低;其次,我們?cè)O(shè)計(jì)的流程不論基于哪一種樣本特征,分類性能都要比基于支持向量機(jī)的分類流程出色:最后,對(duì)于不同樣本16S rRNA測(cè)序數(shù)據(jù),MetaPhyl的分類性能不如我們發(fā)展的分類流程穩(wěn)定。
【關(guān)鍵詞】:宏基因組 樣本分類 16S rRNA 微生物群落分析 有監(jiān)督分類
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q811.4
【目錄】:
- 摘要4-6
- Abstract6-10
- 第一章 緒論10-20
- 1.1 環(huán)境微生物10-11
- 1.2 基因組學(xué)11-12
- 1.3 宏基因組學(xué)12-13
- 1.4 宏基因組樣本分類方法13-17
- 1.4.1 基于全基因組測(cè)序數(shù)據(jù)的宏基因組樣本分類13-16
- 1.4.2 基于16S rRNA基因序列的宏基因組樣本分類16-17
- 1.5 論文的研究意義和內(nèi)容與安排17-20
- 1.5.1 論文的研究意義17-18
- 1.5.2 論文的研究?jī)?nèi)容18
- 1.5.3 論文的章節(jié)安排18-20
- 第二章 基于16S rRNA測(cè)序數(shù)據(jù)的宏基因組樣本分析與分類方法20-30
- 2.1 引言20
- 2.2 基于16S rRNA的樣本分析方法20-25
- 2.2.1 操作分類單元20-21
- 2.2.2 微生物群落多樣性分析21-25
- 2.3 樣本分類方法25-29
- 2.3.1 樣本分類準(zhǔn)確率的影響因素25-26
- 2.3.2 機(jī)器學(xué)習(xí)算法26-29
- 2.3.2.1 隨機(jī)森林算法26-27
- 2.3.2.2 支持向量機(jī)算法27-28
- 2.3.2.3 MetaPhyl群落分類方法介紹28-29
- 2.4 本章小結(jié)29-30
- 第三章 基于16S rRNA測(cè)序數(shù)據(jù)的宏基因組樣本分類流程30-43
- 3.1 引言30
- 3.2 方法與數(shù)據(jù)30-38
- 3.2.1 宏基因組樣本分類流程30-31
- 3.2.2 宏基因組樣本特征31-35
- 3.2.3 分類模型35-36
- 3.2.4 模擬數(shù)據(jù)集36-37
- 3.2.5 樣本分類準(zhǔn)確率評(píng)估方法37-38
- 3.3 結(jié)果與討論38-42
- 3.3.1 基于隨機(jī)森林的分析流程分類準(zhǔn)確率更高38-39
- 3.3.2 不同樣本數(shù)據(jù)集參數(shù)對(duì)分析流程性能的影響39-42
- 3.4 本章小結(jié)42-43
- 第四章 小鼠及人類腸道宏基因組樣本分類研究43-55
- 4.1 引言43
- 4.2 方法及數(shù)據(jù)43-51
- 4.2.1 分類流程及樣本特征43-44
- 4.2.2 真實(shí)數(shù)據(jù)集44-51
- 4.3 分類實(shí)驗(yàn)結(jié)果與討論51-53
- 4.3.1 小鼠腸道宏基因組分類結(jié)果51-52
- 4.3.2 人類腸道宏基因組分類結(jié)果52-53
- 4.4 本章小結(jié)53-55
- 第五章 總結(jié)與展望55-58
- 5.1 論文工作總結(jié)55-56
- 5.2 展望56-58
- 致謝58-59
- 參考文獻(xiàn)59-66
- 作者簡(jiǎn)介66
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 趙蓉;胡永峰;金奇;;宏基因組學(xué)及其在醫(yī)學(xué)微生物學(xué)領(lǐng)域的應(yīng)用[J];病毒學(xué)報(bào);2009年03期
2 宋培勇;馬莉莉;王慶容;李黛;魏志琴;;宏基因組技術(shù)及其應(yīng)用研究進(jìn)展[J];貴州農(nóng)業(yè)科學(xué);2009年10期
3 孟飛;俞春娜;王秋巖;謝恬;;宏基因組與宏基因組學(xué)[J];中國(guó)生物化學(xué)與分子生物學(xué)報(bào);2010年02期
4 劉海燕;常玉梅;;宏基因組學(xué)及在人體微生物研究上的應(yīng)用[J];中國(guó)現(xiàn)代醫(yī)學(xué)雜志;2012年08期
5 閻冰,洪葵,許云,馬超;宏基因組克隆——微生物活性物質(zhì)篩選的新途徑[J];微生物學(xué)通報(bào);2005年01期
6 歐敏功;崔曉龍;李一青;李銘剛;彭謙;文孟良;;宏基因組學(xué)在未培養(yǎng)微生物研究中的應(yīng)用[J];微生物學(xué)雜志;2007年02期
7 艾芳芳;楊樺;曲媛媛;周集體;李昂;關(guān)曉燕;茍敏;;宏基因組研究及其應(yīng)用研究進(jìn)展[J];環(huán)境科學(xué)與技術(shù);2007年12期
8 楚雍烈;楊娥;;宏基因組學(xué)及其技術(shù)的研究進(jìn)展[J];西安交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2008年06期
9 馮美琴;;宏基因組學(xué)的研究進(jìn)展[J];安徽農(nóng)業(yè)科學(xué);2008年02期
10 李慧;何晶晶;張穎;徐慧;陳冠雄;;宏基因組技術(shù)在開(kāi)發(fā)未培養(yǎng)環(huán)境微生物基因資源中的應(yīng)用[J];生態(tài)學(xué)報(bào);2008年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 閻冰;許云;馬超;洪葵;;宏基因組克隆——微生物活性物質(zhì)篩選的新途徑[A];中國(guó)海洋生化學(xué)術(shù)會(huì)議論文薈萃集[C];2005年
2 張桂敏;王裔雄;胡勇;馬立新;;一種簡(jiǎn)便快速構(gòu)建宏基因組文庫(kù)的方法[A];2008年中國(guó)微生物學(xué)會(huì)學(xué)術(shù)年會(huì)論文摘要集[C];2008年
3 黃雅麗;陸勇軍;賴心田;張炯;林永成;周世寧;;南海微生物宏基因組文庫(kù)的構(gòu)建及功能基因初步篩選[A];微生物實(shí)用技術(shù)生態(tài)環(huán)境應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2008年
4 黃雅麗;李慧賢;張炯;杜紀(jì)坤;譚紅銘;陸勇軍;周世寧;;深海宏基因組文庫(kù)篩選及新的功能基因[A];2010年第四屆全國(guó)微生物遺傳學(xué)學(xué)術(shù)研討會(huì)論文摘要集[C];2010年
5 彭晴;張雪;關(guān)國(guó)華;李穎;;一個(gè)克隆自海洋底泥宏基因組文庫(kù)的脂酶新基因[A];2008年中國(guó)微生物學(xué)會(huì)學(xué)術(shù)年會(huì)論文摘要集[C];2008年
6 代俊;江帆;彭方;方呈祥;;深海沉積物宏基因組文庫(kù)中產(chǎn)甲殼素酶克隆的篩選[A];基因開(kāi)啟未來(lái):新時(shí)代的遺傳學(xué)與科技進(jìn)步——湖北省遺傳學(xué)會(huì)第八次代表大會(huì)暨學(xué)術(shù)討論會(huì)論文摘要匯編[C];2009年
7 沈月毛;;通過(guò)構(gòu)建宏基因組文庫(kù)探討植物美登木素生物合成起源[A];2008年中國(guó)微生物學(xué)會(huì)學(xué)術(shù)年會(huì)論文摘要集[C];2008年
8 謝福莉;陳大松;程國(guó)軍;魏力;李友國(guó);;通過(guò)宏基因組學(xué)途徑研究參與氮素循環(huán)主要過(guò)程的相關(guān)功能新基因[A];2006年度學(xué)術(shù)研討會(huì)論文摘要匯編[C];2006年
9 何彪;涂長(zhǎng)春;;病毒宏基因組學(xué)的研究現(xiàn)狀及應(yīng)用[A];中國(guó)畜牧獸醫(yī)學(xué)會(huì)獸醫(yī)公共衛(wèi)生學(xué)分會(huì)第三次學(xué)術(shù)研討會(huì)論文集[C];2012年
10 牛澤;曾艷;王敏;楊慧;馬榮才;高俊蓮;;北京地區(qū)重金屬污染土壤DNA提取及宏基因組文庫(kù)構(gòu)建[A];第十次全國(guó)環(huán)境微生物學(xué)術(shù)研討會(huì)論文摘要集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前6條
1 記者 譚大躍 第五燕燕 實(shí)習(xí)生 栗洋洋;200余國(guó)際頂尖科學(xué)家聚深探討宏基因組學(xué)[N];深圳特區(qū)報(bào);2010年
2 記者 劉傳書(shū);我國(guó)科學(xué)家完成腸道微生物與Ⅱ型糖尿病的宏基因組關(guān)聯(lián)分析[N];科技日?qǐng)?bào);2012年
3 王慶;宏基因組學(xué):慧眼巧識(shí)微生物[N];工人日?qǐng)?bào);2014年
4 記者 熊燕;國(guó)際首例共生菌宏基因組文庫(kù)在昆建成[N];云南日?qǐng)?bào);2009年
5 記者 楊婧如 通訊員 胡雯 劉佳;全球基因?qū)<覅R聚深圳話前沿[N];深圳特區(qū)報(bào);2013年
6 通訊員 梁淡麗 記者 劉傳書(shū);中外科學(xué)家全方位分析全球微生物群落[N];科技日?qǐng)?bào);2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 茍敏;基于宏基因組的芳烴加氧酶獲取及特性研究[D];大連理工大學(xué);2011年
2 賀蕊;式根島海綿宏基因組文庫(kù)活性物質(zhì)研究[D];重慶大學(xué);2013年
3 常秦;宏基因組數(shù)據(jù)分析中的統(tǒng)計(jì)方法研究[D];山東大學(xué);2012年
4 彭帥;應(yīng)用宏基因組方法檢測(cè)豬致病微生物及分析牛胃菌群組成[D];吉林大學(xué);2015年
5 江夏薇;基于嗜耐鹽菌基因組分析與深海宏基因組文庫(kù)的酯酶研究[D];浙江大學(xué);2013年
6 儲(chǔ)新民;南海海洋微生物宏基因組文庫(kù)中酯酶基因的篩選與鑒定[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年
7 趙晶;南極中山站沉積物中微生物多樣性分析及宏基因組文庫(kù)研究[D];廈門大學(xué);2007年
8 侯戰(zhàn)輝;中國(guó)南海海綿共生微生物的宏基因組研究[D];中國(guó)科學(xué)院研究生院(海洋研究所);2011年
9 單同領(lǐng);病毒宏基因組學(xué)分析兒童和豬腸道病毒群落及23株病毒的初步研究[D];上海交通大學(xué);2011年
10 謝偉;深海熱液口微生物群落環(huán)境適應(yīng)性及其基因資源研究[D];華中科技大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 覃千山;基于宏基因組的未培養(yǎng)互營(yíng)烴降解菌‘Candidatus Smithella cisternae’的生物信息學(xué)研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年
2 王偉;宏基因組學(xué)技術(shù)在病原體檢測(cè)中的應(yīng)用[D];安徽醫(yī)科大學(xué);2015年
3 周俊雄;天然木質(zhì)纖維素降解機(jī)制的宏基因組學(xué)和宏蛋白質(zhì)組學(xué)分析[D];福建師范大學(xué);2015年
4 王興興;西藏開(kāi)菲爾粒中優(yōu)勢(shì)菌的鑒定、分布與穩(wěn)定性研究[D];上海海洋大學(xué);2015年
5 鄧云金;厭氧降解纖維素菌群的鑒定與發(fā)酵條件分析及其宏基因組文庫(kù)構(gòu)建[D];福建農(nóng)林大學(xué);2012年
6 趙文靜;腸上皮特異性敲除自噬基因Atg5/Atg7小鼠腸道微生物宏基因組測(cè)序分析[D];上海交通大學(xué);2015年
7 許悅;宏基因組讀段組裝融合與基因標(biāo)注算法研究[D];湖南師范大學(xué);2015年
8 胡資鵬;基于De Bruijn圖的宏基因組序列組裝算法研究[D];廣西師范大學(xué);2015年
9 汪儉;北黃海浮游病毒群落的宏基因組學(xué)研究[D];中國(guó)海洋大學(xué);2015年
10 羅幸;宏基因組分類分析方法的研究和應(yīng)用[D];東南大學(xué);2015年
本文關(guān)鍵詞:宏基因組分類分析方法的研究和應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):374465
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/374465.html