基因表達(dá)預(yù)測(cè)深度學(xué)習(xí)平臺(tái)構(gòu)建與研究
發(fā)布時(shí)間:2020-09-29 23:56
隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的發(fā)展,越來(lái)越多的算法開(kāi)始被應(yīng)用到生物信息領(lǐng)域,近些年由于微陣列技術(shù)的蓬勃發(fā)展,人體基因信息逐漸被挖掘出來(lái)。經(jīng)過(guò)調(diào)查研究,人體內(nèi)已經(jīng)有兩萬(wàn)多條基因被發(fā)現(xiàn),雖然現(xiàn)在的基因技術(shù)在不斷的發(fā)展,但是進(jìn)行一次人體的全基因組成本還是非常昂貴的。經(jīng)過(guò)美國(guó)國(guó)立衛(wèi)生院研究表明,人體內(nèi)的基因表達(dá)通常都是高度相關(guān)的,由此他們發(fā)現(xiàn)人體內(nèi)的大約1000個(gè)標(biāo)志性基因包含了人體內(nèi)其余80%基因的信息。為了有效利用這些標(biāo)志性基因,可以把這大約1000個(gè)標(biāo)志性基因作為輸入,利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的算法進(jìn)行建模,去預(yù)測(cè)剩余的基因表達(dá)數(shù)據(jù)。然而目前很少有用于基因表達(dá)預(yù)測(cè)的平臺(tái),使用機(jī)器學(xué)習(xí)深度學(xué)習(xí)算法對(duì)基因表達(dá)預(yù)測(cè)進(jìn)行建模并建立可供相關(guān)研究者和學(xué)習(xí)者使用的基因預(yù)測(cè)表達(dá)平臺(tái),是本文要解決的主要問(wèn)題。機(jī)器學(xué)習(xí)中的回歸算法主要有線(xiàn)性回歸、核嶺回歸、支持向量回歸等,深度學(xué)習(xí)主要采用神經(jīng)網(wǎng)絡(luò)去做回歸。LINCS項(xiàng)目組的成員采用線(xiàn)性回歸進(jìn)行基因表達(dá)預(yù)測(cè)。Yifei Chen等人也使用深度學(xué)習(xí)算法。但是其深度學(xué)習(xí)算法模型受限于當(dāng)時(shí)的機(jī)器設(shè)備配置,建立了兩個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行基因表達(dá)預(yù)測(cè),盡管準(zhǔn)確度上表現(xiàn)不錯(cuò),但是在訓(xùn)練和預(yù)測(cè)需要耗費(fèi)大量的時(shí)間。在本研究中,主要使用深度學(xué)習(xí)模型,并輔之以機(jī)器學(xué)習(xí)模型,如線(xiàn)性回歸、核嶺回歸和支持向量回歸,并搭建基因表達(dá)預(yù)測(cè)平臺(tái),用戶(hù)只需要輸入少部分的基因表達(dá)值,即標(biāo)志性基因的表達(dá)值,然后平臺(tái)使用后臺(tái)已經(jīng)訓(xùn)練好的模型對(duì)基因表達(dá)進(jìn)行預(yù)測(cè),并將輸出的9520個(gè)基因表達(dá)值反饋給用戶(hù)。在對(duì)基因數(shù)據(jù)集進(jìn)行預(yù)處理后,使用scikit-learn學(xué)習(xí)包建立線(xiàn)性回歸、核嶺回歸和支持向量回歸模型,使用多層全連接神經(jīng)網(wǎng)絡(luò),并采用Drop Out等技巧進(jìn)行參數(shù)調(diào)優(yōu),建立深度學(xué)習(xí)模型,對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu)后把模型保存到本地,以供平臺(tái)加載使用。本文對(duì)平臺(tái)所使用的模型原理、建模過(guò)程和使用進(jìn)行詳細(xì)闡述,并針對(duì)用戶(hù)不同的輸入進(jìn)行分析,如本地化Blast序列比對(duì)。最后采用Django框架對(duì)基因表達(dá)預(yù)測(cè)平臺(tái)進(jìn)行搭建開(kāi)發(fā),并將相關(guān)數(shù)據(jù)持久化保存到My Sql數(shù)據(jù)庫(kù)中。本研究旨在更好的幫助相關(guān)研究者和學(xué)習(xí)者進(jìn)行使用,從而對(duì)基因表達(dá)研究起到輔助作用。
【學(xué)位單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:Q811.4;TP181
【部分圖文】:
圖 2-1 嶺跡圖示例用主要有可以觀察最佳的 值,同時(shí)也可以觀察變量間是的選取,可以通過(guò)選取嶺跡圖的喇叭口,也就是剛靠近平英文全稱(chēng)時(shí) Kernel Ridge Regression。核嶺回歸就是使用行訓(xùn)練的數(shù)據(jù)不可線(xiàn)性回歸的情況時(shí),這時(shí)候一般可以使用回歸所求得的w的式子中,使用 ( )i i x代替 ,在這種,這時(shí)候使用是一個(gè)技巧讓我們可以對(duì)式子進(jìn)行一個(gè)轉(zhuǎn)換1 1 1 1 1( ) ( )T T T TP B R B B R PB BPB R + + …………式應(yīng)用到 的式子中,則:1 1( ) ( )T Td nw I y I y + + …………
1( ) ( ) ( , )i i iif x K x x +b……………...……(2.3.17)其中 ( , ) ( ) ( )Ti i jK x x x x為核函數(shù)。2.3.4 多隱層前饋神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種算法,起源于模仿動(dòng)物神經(jīng)行為特征,網(wǎng)絡(luò)內(nèi)部是很復(fù)雜的,可以通過(guò)一些手段調(diào)整層與層之間神經(jīng)元之間的連接關(guān)系,從而對(duì)數(shù)據(jù)信息進(jìn)行有效的處理計(jì)算[20]。前饋神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中最常見(jiàn)的神經(jīng)網(wǎng)絡(luò)模型,它的第一層是輸入層,最后一層是輸出層。當(dāng)中間的隱藏層有多個(gè)的時(shí)候,就稱(chēng)為多隱層前饋神經(jīng)網(wǎng)絡(luò)[21]。下面對(duì)前饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行介紹。在多隱層前饋神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)中相鄰層之間的神經(jīng)元是全連接的,同層內(nèi)或跨層的神經(jīng)元是無(wú)連接的,如圖 2-2 所示。
Blast安裝成功
【學(xué)位單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:Q811.4;TP181
【部分圖文】:
圖 2-1 嶺跡圖示例用主要有可以觀察最佳的 值,同時(shí)也可以觀察變量間是的選取,可以通過(guò)選取嶺跡圖的喇叭口,也就是剛靠近平英文全稱(chēng)時(shí) Kernel Ridge Regression。核嶺回歸就是使用行訓(xùn)練的數(shù)據(jù)不可線(xiàn)性回歸的情況時(shí),這時(shí)候一般可以使用回歸所求得的w的式子中,使用 ( )i i x代替 ,在這種,這時(shí)候使用是一個(gè)技巧讓我們可以對(duì)式子進(jìn)行一個(gè)轉(zhuǎn)換1 1 1 1 1( ) ( )T T T TP B R B B R PB BPB R + + …………式應(yīng)用到 的式子中,則:1 1( ) ( )T Td nw I y I y + + …………
1( ) ( ) ( , )i i iif x K x x +b……………...……(2.3.17)其中 ( , ) ( ) ( )Ti i jK x x x x為核函數(shù)。2.3.4 多隱層前饋神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種算法,起源于模仿動(dòng)物神經(jīng)行為特征,網(wǎng)絡(luò)內(nèi)部是很復(fù)雜的,可以通過(guò)一些手段調(diào)整層與層之間神經(jīng)元之間的連接關(guān)系,從而對(duì)數(shù)據(jù)信息進(jìn)行有效的處理計(jì)算[20]。前饋神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中最常見(jiàn)的神經(jīng)網(wǎng)絡(luò)模型,它的第一層是輸入層,最后一層是輸出層。當(dāng)中間的隱藏層有多個(gè)的時(shí)候,就稱(chēng)為多隱層前饋神經(jīng)網(wǎng)絡(luò)[21]。下面對(duì)前饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行介紹。在多隱層前饋神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)中相鄰層之間的神經(jīng)元是全連接的,同層內(nèi)或跨層的神經(jīng)元是無(wú)連接的,如圖 2-2 所示。
Blast安裝成功
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周慶;趙沛榮;;探析“基因表達(dá)”概念教學(xué)中的若干疑難問(wèn)題[J];生物學(xué)教學(xué);2016年12期
2 杜維波;郜瑞;;淺談模型建構(gòu)在基因表達(dá)計(jì)算中的運(yùn)用[J];中學(xué)生物教學(xué);2017年15期
3 老白;;返老還童的一道坎兒[J];課堂內(nèi)外(科學(xué)Fans);2017年01期
4 黃欣;陳少華;楊力建;沈琦;查顯豐;李
本文編號(hào):2830447
本文鏈接:http://sikaile.net/yixuelunwen/swyx/2830447.html
最近更新
教材專(zhuān)著