基于機器學(xué)習(xí)算法的基因表達(dá)數(shù)據(jù)處理與分析
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-2集成填補算法的基本框架
第2章基因表達(dá)數(shù)據(jù)缺失值填補131,2,,,其中()是已知列位置集合的第個采樣集。這里,采用自助采樣(BootStrap)來生成()。在這種采樣方式中,可以將隨機性引入構(gòu)建組件預(yù)測器的過程中,這有利于減少它們對于數(shù)據(jù)的依賴性。3)對于第個填補方法,使用樣本矩陣(,)中的數(shù)據(jù)為基因....
圖2-3.TCGA數(shù)據(jù)集上不同方法在不同缺失率下產(chǎn)生結(jié)果的均方根誤差
第2章基因表達(dá)數(shù)據(jù)缺失值填補19設(shè)置為5%,并執(zhí)行Bootstrap采樣T=30次。另外,用于對比的缺失值填補方法KNNimpute和SVDimpute的參數(shù)采用[23]中建議的最優(yōu)值。也就是說,KNNimpute采用的最近鄰數(shù)量P=15,并且SVDimpute所選擇的特征向量的....
圖2-4.TCGA數(shù)據(jù)集上不同方法在不同樣本數(shù)量下產(chǎn)生結(jié)果的均方根誤差接下來,我們針對不同的樣本數(shù)量評估各算法的填補性能
天津大學(xué)碩士學(xué)位論文
圖2-5.TCGA數(shù)據(jù)集上不同方法在不同方差的噪聲下產(chǎn)生結(jié)果的均方根誤差
第2章基因表達(dá)數(shù)據(jù)缺失值填補21過組合多個獨立的填補方法來提高對噪聲的魯棒性圖2-5.TCGA數(shù)據(jù)集上不同方法在不同方差的噪聲下產(chǎn)生結(jié)果的均方根誤差2.4.3在其他數(shù)據(jù)集上的測試結(jié)果我們還在來自癌癥基因組圖譜數(shù)據(jù)庫(TCGA;http://firebrowse.org/)的數(shù)據(jù)矩....
本文編號:3894038
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3894038.html