基于概率話題模型的微生物菌群結(jié)構(gòu)研究
本文關(guān)鍵詞: LDA模型 Gibbs抽樣 蒙特卡洛算法 系統(tǒng)聚類 K-Means聚類 出處:《中國科學(xué):生命科學(xué)》2017年11期 論文類型:期刊論文
【摘要】:微生物菌群結(jié)構(gòu)的異質(zhì)性在影響宿主健康與疾病等方面有著十分重要的作用.對(duì)于菌群結(jié)構(gòu)的時(shí)間與空間尺度異質(zhì)性研究主要有非監(jiān)督學(xué)習(xí)算法以及監(jiān)督學(xué)習(xí)算法.由于菌群數(shù)據(jù)特性與文本數(shù)據(jù)特性之間的相似性,本文采用非監(jiān)督學(xué)習(xí)的LDA概率話題模型對(duì)菌群結(jié)構(gòu)的時(shí)間異質(zhì)性進(jìn)行研究,并與系統(tǒng)聚類和K-Means聚類這兩種方法進(jìn)行比較.采用LDA模型折疊Gibbs抽樣的蒙特卡洛算法對(duì)兩種數(shù)據(jù)源北平頂猴(Macaca leonina)陰道菌群(MVB)和輕微型肝性腦病(MHE)菌群的時(shí)間異質(zhì)性O(shè)TUs數(shù)據(jù)集進(jìn)行了分析.用LDA模型分別將MVB和MHE數(shù)據(jù)源中的27個(gè)樣本和77個(gè)樣本的OTUs數(shù)據(jù)集分為6個(gè)Topic和4個(gè)Topic.這與系統(tǒng)聚類和K-Means聚類劃分成的簇?cái)?shù)目(分別為5,3與4,3)有所不同.此外,實(shí)驗(yàn)表明結(jié)合MVB樣本間生理數(shù)據(jù)-pH和MHE中樣本α多樣性,pH和α值的分類相似性更能與LDA模型的樣本分類特性保持一致.因此,LDA在樣本的聚集程度上更能精確地對(duì)OTUs數(shù)據(jù)集進(jìn)行分類.更為重要的是,LDA模型還可以鑒定出每個(gè)Topic中具有代表性的OTUs.與系統(tǒng)聚類和K-Means聚類方法相比較,LDA模型不僅能更為有效地量化菌群結(jié)構(gòu)的異質(zhì)性,還能鑒定出相對(duì)應(yīng)影響異質(zhì)性的OTUs.
[Abstract]:The heterogeneity of microbial community structure plays an important role in affecting host health and disease. There are mainly unsupervised learning algorithms and supervised learning algorithms for the study of temporal and spatial scale heterogeneity of microbial structure. Because of the similarity between the characteristics of microflora data and text data, LDA probabilistic topic model based on unsupervised learning was used to study the temporal heterogeneity of microbial structure. And compared with the two methods of systematic clustering and K-Means clustering. Using the Monte Carlo algorithm of folding Gibbs sampling with LDA model, the time heterogeneity of the two data sources (Macaca leonina) vaginal flora (MVBB) and mild hepatic encephalopathy (MHEs) were studied in two kinds of data sources: Macaca leonina). The OTUs data sets of 27 samples and 77 samples from MVB and MHE data sources were divided into 6 Topic and 4 Topics by using LDA model. This was compared with the number of clusters divided into systematic clustering and K-Means clustering. In addition, The experimental results show that the similarity of 偽 -diversity pH and 偽 -values of samples in MVB can be more consistent with the classification characteristics of LDA model. The OTUs data sets are classified. More importantly, the representative OTUs in each Topic can be identified. Compared with the systematic clustering and K-Means clustering methods, the LDA model can not only quantify the heterogeneity of the flora structure more effectively. OTUs, which influence heterogeneity, can also be identified.
【作者單位】: 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院;昆明理工大學(xué)附屬醫(yī)院云南省第一人民醫(yī)院消化科;昆明市延安醫(yī)院昆明醫(yī)科大學(xué)附屬延安醫(yī)院急診科;
【基金】:國家自然科學(xué)基金(批準(zhǔn)號(hào):81260077,81560107,11265007)資助
【分類號(hào)】:R37;TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前7條
1 管正秀;人體正常微生物菌群及其作用[J];生物學(xué)教學(xué);1999年01期
2 孫笑非;潘寶海;孫冬巖;;動(dòng)物微生物菌群基因組的研究方法[J];飼料研究;2013年12期
3 李萬坤;郭福存;趙興緒;Williams B A;Kwakkel R P;Verstegen M W A;;多糖和寡糖的體外發(fā)酵特性及其對(duì)雞盲腸微生物菌群的影響[J];動(dòng)物營養(yǎng)學(xué)報(bào);2007年03期
4 范玉貞;;衡水湖微生物菌群分布的研究[J];衡水學(xué)院學(xué)報(bào);2009年04期
5 成玉梅;鄧衛(wèi)東;毛華明;;實(shí)時(shí)熒光定量PCR技術(shù)在研究反芻動(dòng)物消化道微生物菌群生態(tài)學(xué)上的運(yùn)用[J];飼料博覽;2006年11期
6 ;名詞解析——EM[J];水產(chǎn)學(xué)報(bào);2006年04期
7 于超;郭海勇;吳同磊;王建;錢愛東;;山羊胚胎胃腸道細(xì)菌的分離與鑒定[J];吉林農(nóng)業(yè)大學(xué)學(xué)報(bào);2013年01期
相關(guān)博士學(xué)位論文 前1條
1 郭嫣秋;瘤胃產(chǎn)甲烷菌定量檢測與微生物菌群調(diào)控研究[D];浙江大學(xué);2008年
相關(guān)碩士學(xué)位論文 前2條
1 劉杰;連作及輪作土壤微生物菌群對(duì)黃瓜生長的影響[D];東北農(nóng)業(yè)大學(xué);2015年
2 朱艷艷;光合生物制氫過程中微生物菌群特性研究[D];河南農(nóng)業(yè)大學(xué);2013年
,本文編號(hào):1499252
本文鏈接:http://sikaile.net/xiyixuelunwen/1499252.html