天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于機(jī)器學(xué)習(xí)的宏基因組疊連群分箱研究

發(fā)布時(shí)間:2024-03-02 12:36
  宏基因組學(xué)可以直接從環(huán)境樣本中提取微生物的DNA,已成為研究微生物的重要方法之一。疊連群是宏基因組學(xué)的基本研究對(duì)象之一,疊連群分箱可以提高潛在微生物基因組的完整度,為微生物研究奠定數(shù)據(jù)基礎(chǔ)。針對(duì)當(dāng)前的疊連群分箱方法中準(zhǔn)確率有待提高、運(yùn)行耗時(shí)過長等問題,論文提出了一種基于流形學(xué)習(xí)和K-Means聚類的疊連群分箱方法。主要研究?jī)?nèi)容如下:(1)基于梯度提升的疊連群特征工程針對(duì)疊連群序列數(shù)據(jù)常用特征對(duì)分箱準(zhǔn)確率影響程度不同的問題,論文使用梯度提升模型對(duì)常用的特征進(jìn)行了評(píng)估和選擇。首先,基于Py Feat方法提取了疊連群序列數(shù)據(jù)Z曲線、GC含量、ATGC比率、累積偏斜、k-mer等特征;其次,基于極度梯度提升樹模型計(jì)算所有特征分量的重要度;第三,擴(kuò)展了極度梯度提升樹模型的應(yīng)用范圍,得到面向多分量特征的極度梯度提升樹模型,計(jì)算出疊連群特征重要度;最后,按照重要度倒排序疊連群特征,篩選出重要度最大的疊連群分箱特征。在疊連群標(biāo)準(zhǔn)數(shù)據(jù)集Strain Mock上計(jì)算得到的對(duì)疊連群分箱重要度最大的特征是4-mer。(2)基于流形學(xué)習(xí)和K-Means的疊連群分箱方法針對(duì)疊連群數(shù)據(jù)維度較高,導(dǎo)致難以處理的問題,...

【文章頁數(shù)】:65 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖4-2疊連群數(shù)據(jù)使用流形嵌入U(xiǎn)MAP的降維結(jié)果

圖4-2疊連群數(shù)據(jù)使用流形嵌入U(xiǎn)MAP的降維結(jié)果

第四章基于流形學(xué)習(xí)和K-Means的疊連群分箱方法33說明了使用流形嵌入U(xiǎn)MAP對(duì)疊連群數(shù)據(jù)進(jìn)行降維,可以為分箱數(shù)的估計(jì)提供先驗(yàn),同時(shí)為分箱方法提供有效的分類特征,提高分箱方法計(jì)算性能。在特征提取和預(yù)處理部分得到疊連群的特征X后,在本節(jié)中對(duì)預(yù)處理后的結(jié)果進(jìn)行流形學(xué)習(xí)非線性降維。通....


圖5-1StrainMock數(shù)據(jù)集在PCA下的結(jié)

圖5-1StrainMock數(shù)據(jù)集在PCA下的結(jié)

空間下的結(jié)果。對(duì)于分箱方法的實(shí)驗(yàn),首先對(duì)StrainMock和SpeciesMock兩個(gè)數(shù)據(jù)集進(jìn)行了流形嵌入,同時(shí)對(duì)比同樣的數(shù)據(jù)在PCA和t-SNE降維下的結(jié)果,說明流形嵌入的有效性和本文選擇降維方法的優(yōu)勢(shì)。使用這兩個(gè)疊連群標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行測(cè)試,分別使用常見的分箱方法和本文提出的分....


圖5-2StrainMock數(shù)據(jù)集在t-SNE下的結(jié)

圖5-2StrainMock數(shù)據(jù)集在t-SNE下的結(jié)

第五章疊連群分箱實(shí)驗(yàn)與分析43上位置,最大的一簇菌株在上部撕裂成了兩個(gè)小的部分,左邊的小部分與另外一個(gè)菌株的疊連群交在一起,右邊的小部分被摻入了另一菌株的幾個(gè)疊連群樣本點(diǎn)。(a)t-SNE(2)(b)t-SNE(3)圖5-2StrainMock數(shù)據(jù)集在t-SNE下的結(jié)果(括號(hào)里代....


圖5-3StrainMock數(shù)據(jù)集在UMAP下的

圖5-3StrainMock數(shù)據(jù)集在UMAP下的

第五章疊連群分箱實(shí)驗(yàn)與分析43上位置,最大的一簇菌株在上部撕裂成了兩個(gè)小的部分,左邊的小部分與另外一個(gè)菌株的疊連群交在一起,右邊的小部分被摻入了另一菌株的幾個(gè)疊連群樣本點(diǎn)。(a)t-SNE(2)(b)t-SNE(3)圖5-2StrainMock數(shù)據(jù)集在t-SNE下的結(jié)果(括號(hào)里代....



本文編號(hào):3916867

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/3916867.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8b9e2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com