天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基因表達預(yù)測深度學(xué)習(xí)平臺構(gòu)建與研究

發(fā)布時間:2020-09-29 23:56
   隨著機器學(xué)習(xí)和深度學(xué)習(xí)的發(fā)展,越來越多的算法開始被應(yīng)用到生物信息領(lǐng)域,近些年由于微陣列技術(shù)的蓬勃發(fā)展,人體基因信息逐漸被挖掘出來。經(jīng)過調(diào)查研究,人體內(nèi)已經(jīng)有兩萬多條基因被發(fā)現(xiàn),雖然現(xiàn)在的基因技術(shù)在不斷的發(fā)展,但是進行一次人體的全基因組成本還是非常昂貴的。經(jīng)過美國國立衛(wèi)生院研究表明,人體內(nèi)的基因表達通常都是高度相關(guān)的,由此他們發(fā)現(xiàn)人體內(nèi)的大約1000個標志性基因包含了人體內(nèi)其余80%基因的信息。為了有效利用這些標志性基因,可以把這大約1000個標志性基因作為輸入,利用機器學(xué)習(xí)或深度學(xué)習(xí)的算法進行建模,去預(yù)測剩余的基因表達數(shù)據(jù)。然而目前很少有用于基因表達預(yù)測的平臺,使用機器學(xué)習(xí)深度學(xué)習(xí)算法對基因表達預(yù)測進行建模并建立可供相關(guān)研究者和學(xué)習(xí)者使用的基因預(yù)測表達平臺,是本文要解決的主要問題。機器學(xué)習(xí)中的回歸算法主要有線性回歸、核嶺回歸、支持向量回歸等,深度學(xué)習(xí)主要采用神經(jīng)網(wǎng)絡(luò)去做回歸。LINCS項目組的成員采用線性回歸進行基因表達預(yù)測。Yifei Chen等人也使用深度學(xué)習(xí)算法。但是其深度學(xué)習(xí)算法模型受限于當時的機器設(shè)備配置,建立了兩個神經(jīng)網(wǎng)絡(luò)進行基因表達預(yù)測,盡管準確度上表現(xiàn)不錯,但是在訓(xùn)練和預(yù)測需要耗費大量的時間。在本研究中,主要使用深度學(xué)習(xí)模型,并輔之以機器學(xué)習(xí)模型,如線性回歸、核嶺回歸和支持向量回歸,并搭建基因表達預(yù)測平臺,用戶只需要輸入少部分的基因表達值,即標志性基因的表達值,然后平臺使用后臺已經(jīng)訓(xùn)練好的模型對基因表達進行預(yù)測,并將輸出的9520個基因表達值反饋給用戶。在對基因數(shù)據(jù)集進行預(yù)處理后,使用scikit-learn學(xué)習(xí)包建立線性回歸、核嶺回歸和支持向量回歸模型,使用多層全連接神經(jīng)網(wǎng)絡(luò),并采用Drop Out等技巧進行參數(shù)調(diào)優(yōu),建立深度學(xué)習(xí)模型,對模型參數(shù)進行調(diào)優(yōu)后把模型保存到本地,以供平臺加載使用。本文對平臺所使用的模型原理、建模過程和使用進行詳細闡述,并針對用戶不同的輸入進行分析,如本地化Blast序列比對。最后采用Django框架對基因表達預(yù)測平臺進行搭建開發(fā),并將相關(guān)數(shù)據(jù)持久化保存到My Sql數(shù)據(jù)庫中。本研究旨在更好的幫助相關(guān)研究者和學(xué)習(xí)者進行使用,從而對基因表達研究起到輔助作用。
【學(xué)位單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:Q811.4;TP181
【部分圖文】:

嶺跡,式子


圖 2-1 嶺跡圖示例用主要有可以觀察最佳的 值,同時也可以觀察變量間是的選取,可以通過選取嶺跡圖的喇叭口,也就是剛靠近平英文全稱時 Kernel Ridge Regression。核嶺回歸就是使用行訓(xùn)練的數(shù)據(jù)不可線性回歸的情況時,這時候一般可以使用回歸所求得的w的式子中,使用 ( )i i x代替 ,在這種,這時候使用是一個技巧讓我們可以對式子進行一個轉(zhuǎn)換1 1 1 1 1( ) ( )T T T TP B R B B R PB BPB R + + …………式應(yīng)用到 的式子中,則:1 1( ) ( )T Td nw I y I y + + …………

前饋神經(jīng)網(wǎng)絡(luò),多隱層,輸入層,隱層


1( ) ( ) ( , )i i iif x K x x +b……………...……(2.3.17)其中 ( , ) ( ) ( )Ti i jK x x x x為核函數(shù)。2.3.4 多隱層前饋神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種算法,起源于模仿動物神經(jīng)行為特征,網(wǎng)絡(luò)內(nèi)部是很復(fù)雜的,可以通過一些手段調(diào)整層與層之間神經(jīng)元之間的連接關(guān)系,從而對數(shù)據(jù)信息進行有效的處理計算[20]。前饋神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中最常見的神經(jīng)網(wǎng)絡(luò)模型,它的第一層是輸入層,最后一層是輸出層。當中間的隱藏層有多個的時候,就稱為多隱層前饋神經(jīng)網(wǎng)絡(luò)[21]。下面對前饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)進行介紹。在多隱層前饋神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)中相鄰層之間的神經(jīng)元是全連接的,同層內(nèi)或跨層的神經(jīng)元是無連接的,如圖 2-2 所示。

基因表達預(yù)測深度學(xué)習(xí)平臺構(gòu)建與研究


Blast安裝成功

【相似文獻】

相關(guān)期刊論文 前10條

1 周慶;趙沛榮;;探析“基因表達”概念教學(xué)中的若干疑難問題[J];生物學(xué)教學(xué);2016年12期

2 杜維波;郜瑞;;淺談模型建構(gòu)在基因表達計算中的運用[J];中學(xué)生物教學(xué);2017年15期

3 老白;;返老還童的一道坎兒[J];課堂內(nèi)外(科學(xué)Fans);2017年01期

4 黃欣;陳少華;楊力建;沈琦;查顯豐;李

本文編號:2830447


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/swyx/2830447.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b7a88***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com