基于機(jī)器學(xué)習(xí)的Pan-cancer基因通路以及染色質(zhì)絕緣子調(diào)控元件研究
發(fā)布時(shí)間:2021-04-09 03:54
隨著DNA測序技術(shù)的發(fā)展,人們獲得DNA序列和基因表達(dá)數(shù)據(jù)的手段越來越多,影響生物信息技術(shù)發(fā)展的瓶頸,是開發(fā)優(yōu)質(zhì)的數(shù)據(jù)挖掘算法從大量的生物序列數(shù)據(jù)中挖掘出有價(jià)值的信息。傳統(tǒng)的序列數(shù)據(jù)分析通過對比,映射等,分析序列的突變以及在基因組中空間結(jié)構(gòu)信息,對于表達(dá)數(shù)據(jù),則是分析不同基因的差異表達(dá),試圖找出規(guī)律。然而,這些方法只能獲取數(shù)據(jù)本身的屬性,對隱藏的規(guī)律無法很好的挖掘和展現(xiàn)。近年來,機(jī)器學(xué)習(xí)在數(shù)據(jù)挖掘,個(gè)性化推薦,自然語言處理,圖像識別等領(lǐng)域得到了廣泛的運(yùn)用,通過不同種類的監(jiān)督方式,對特征加權(quán),提取出高泛化程度的特征。在此之前,機(jī)器學(xué)習(xí)分析生物信息學(xué)數(shù)據(jù)主要是以問題為導(dǎo)向,解決數(shù)據(jù)的分類問題。但是機(jī)器學(xué)習(xí)算法和生物學(xué)意義之間一直無法相互聯(lián)系,只能通過分類的評價(jià)指標(biāo)來判斷模型對生物數(shù)據(jù)的泛化性能,在本文中,設(shè)計(jì)了兩組實(shí)驗(yàn)(TCGA基因表達(dá)數(shù)據(jù)預(yù)測泛癌癥基因通路預(yù)測和絕緣子序列預(yù)測)對不同的生物數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,并通過生物學(xué)意義來驗(yàn)證算法對生物數(shù)據(jù)的泛化性能。癌癥基因圖譜(The Cancer Genome Atlas,TCGA)收集了 33種常見的癌癥11000多個(gè)癌癥患者的表達(dá)數(shù)據(jù),變異數(shù)...
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1序列數(shù)據(jù)自編碼網(wǎng)絡(luò)特征提取流程??深度自編碼網(wǎng)絡(luò)包含兩個(gè)部分,編碼階段函數(shù)&?=?/(4和解碼重構(gòu)輸入階段??
數(shù)據(jù)的完整特征。??2.5降噪自編碼器的原理??降噪自編碼的示意圖如圖(圖2-2)所示,Denoising?Autoencoder與人的感知??機(jī)理類似[16],當(dāng)人看物體時(shí),即使物體一小部分被修改了或者被遮擋,我們依??然能夠識別出具體的物體。以修改的數(shù)據(jù)的數(shù)據(jù)去計(jì)算2/,計(jì)算并將z與原始z??做誤差迭代,這樣,網(wǎng)絡(luò)就學(xué)習(xí)了這個(gè)破損(Corruputed)的數(shù)據(jù)。從而獲得的??特征不容易收到數(shù)據(jù)質(zhì)量的影響。?????OT1?C^D??(v?1)j??(Vf^JL^xxxf^?OX?XX?X?))??X?3C??圖2-2降噪自編嗎網(wǎng)絡(luò)原理??2.6卷積神經(jīng)網(wǎng)絡(luò)原理及序列特征(motif)提取??卷積核[28]是一個(gè)小的權(quán)值矩陣,通過在大的矩陣上滑動,將重合部分與卷??積核做矩陣乘法,從而達(dá)到探測與卷積核特征相似的特征,下面用一個(gè)圖來解釋??這個(gè)過程:??2?0?3?0???1????5?0??????2?0?3?0???30?0?45?????5?0=???2?0?3?0???30?〇?45??—????5?0??????2?0?3?0?????圖2-3卷積操作原理??如圖2-3所示,在原矩陣中,有列分布的特征,并且特征的大小有差別,如??果我們使用列特征的卷積核去對原矩陣進(jìn)行卷積操作,我們將得到分布相同的結(jié)??果
數(shù)據(jù)的完整特征。??2.5降噪自編碼器的原理??降噪自編碼的示意圖如圖(圖2-2)所示,Denoising?Autoencoder與人的感知??機(jī)理類似[16],當(dāng)人看物體時(shí),即使物體一小部分被修改了或者被遮擋,我們依??然能夠識別出具體的物體。以修改的數(shù)據(jù)的數(shù)據(jù)去計(jì)算2/,計(jì)算并將z與原始z??做誤差迭代,這樣,網(wǎng)絡(luò)就學(xué)習(xí)了這個(gè)破損(Corruputed)的數(shù)據(jù)。從而獲得的??特征不容易收到數(shù)據(jù)質(zhì)量的影響。?????OT1?C^D??(v?1)j??(Vf^JL^xxxf^?OX?XX?X?))??X?3C??圖2-2降噪自編嗎網(wǎng)絡(luò)原理??2.6卷積神經(jīng)網(wǎng)絡(luò)原理及序列特征(motif)提取??卷積核[28]是一個(gè)小的權(quán)值矩陣,通過在大的矩陣上滑動,將重合部分與卷??積核做矩陣乘法,從而達(dá)到探測與卷積核特征相似的特征,下面用一個(gè)圖來解釋??這個(gè)過程:??2?0?3?0???1????5?0??????2?0?3?0???30?0?45?????5?0=???2?0?3?0???30?〇?45??—????5?0??????2?0?3?0?????圖2-3卷積操作原理??如圖2-3所示,在原矩陣中,有列分布的特征,并且特征的大小有差別,如??果我們使用列特征的卷積核去對原矩陣進(jìn)行卷積操作,我們將得到分布相同的結(jié)??果
本文編號:3126863
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1序列數(shù)據(jù)自編碼網(wǎng)絡(luò)特征提取流程??深度自編碼網(wǎng)絡(luò)包含兩個(gè)部分,編碼階段函數(shù)&?=?/(4和解碼重構(gòu)輸入階段??
數(shù)據(jù)的完整特征。??2.5降噪自編碼器的原理??降噪自編碼的示意圖如圖(圖2-2)所示,Denoising?Autoencoder與人的感知??機(jī)理類似[16],當(dāng)人看物體時(shí),即使物體一小部分被修改了或者被遮擋,我們依??然能夠識別出具體的物體。以修改的數(shù)據(jù)的數(shù)據(jù)去計(jì)算2/,計(jì)算并將z與原始z??做誤差迭代,這樣,網(wǎng)絡(luò)就學(xué)習(xí)了這個(gè)破損(Corruputed)的數(shù)據(jù)。從而獲得的??特征不容易收到數(shù)據(jù)質(zhì)量的影響。?????OT1?C^D??(v?1)j??(Vf^JL^xxxf^?OX?XX?X?))??X?3C??圖2-2降噪自編嗎網(wǎng)絡(luò)原理??2.6卷積神經(jīng)網(wǎng)絡(luò)原理及序列特征(motif)提取??卷積核[28]是一個(gè)小的權(quán)值矩陣,通過在大的矩陣上滑動,將重合部分與卷??積核做矩陣乘法,從而達(dá)到探測與卷積核特征相似的特征,下面用一個(gè)圖來解釋??這個(gè)過程:??2?0?3?0???1????5?0??????2?0?3?0???30?0?45?????5?0=???2?0?3?0???30?〇?45??—????5?0??????2?0?3?0?????圖2-3卷積操作原理??如圖2-3所示,在原矩陣中,有列分布的特征,并且特征的大小有差別,如??果我們使用列特征的卷積核去對原矩陣進(jìn)行卷積操作,我們將得到分布相同的結(jié)??果
數(shù)據(jù)的完整特征。??2.5降噪自編碼器的原理??降噪自編碼的示意圖如圖(圖2-2)所示,Denoising?Autoencoder與人的感知??機(jī)理類似[16],當(dāng)人看物體時(shí),即使物體一小部分被修改了或者被遮擋,我們依??然能夠識別出具體的物體。以修改的數(shù)據(jù)的數(shù)據(jù)去計(jì)算2/,計(jì)算并將z與原始z??做誤差迭代,這樣,網(wǎng)絡(luò)就學(xué)習(xí)了這個(gè)破損(Corruputed)的數(shù)據(jù)。從而獲得的??特征不容易收到數(shù)據(jù)質(zhì)量的影響。?????OT1?C^D??(v?1)j??(Vf^JL^xxxf^?OX?XX?X?))??X?3C??圖2-2降噪自編嗎網(wǎng)絡(luò)原理??2.6卷積神經(jīng)網(wǎng)絡(luò)原理及序列特征(motif)提取??卷積核[28]是一個(gè)小的權(quán)值矩陣,通過在大的矩陣上滑動,將重合部分與卷??積核做矩陣乘法,從而達(dá)到探測與卷積核特征相似的特征,下面用一個(gè)圖來解釋??這個(gè)過程:??2?0?3?0???1????5?0??????2?0?3?0???30?0?45?????5?0=???2?0?3?0???30?〇?45??—????5?0??????2?0?3?0?????圖2-3卷積操作原理??如圖2-3所示,在原矩陣中,有列分布的特征,并且特征的大小有差別,如??果我們使用列特征的卷積核去對原矩陣進(jìn)行卷積操作,我們將得到分布相同的結(jié)??果
本文編號:3126863
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3126863.html
最近更新
教材專著