基于卷積神經(jīng)網(wǎng)絡(luò)的序列特異性預測研究
發(fā)布時間:2017-12-24 16:29
本文關(guān)鍵詞:基于卷積神經(jīng)網(wǎng)絡(luò)的序列特異性預測研究 出處:《云南大學》2016年碩士論文 論文類型:學位論文
更多相關(guān)文章: 序列特異性 模體識別 DNA結(jié)合蛋白 卷積神經(jīng)網(wǎng)絡(luò)
【摘要】:基因序列特異性的預測無論是在基因分析領(lǐng)域還是基因調(diào)控領(lǐng)域都扮演著重要作色,DNA和RNA結(jié)合蛋白的特異性模式序列對致病基因的發(fā)現(xiàn)也具有指導性作用。然而隨著分子生物學的發(fā)展,生物數(shù)據(jù)量呈現(xiàn)爆炸式增長,通過生物實驗和統(tǒng)計分析來尋找序列特異性的傳統(tǒng)方法已經(jīng)很難從海量數(shù)據(jù)中挖掘出有用數(shù)據(jù),且時間和人力成本也太高。卷積神經(jīng)網(wǎng)絡(luò)是近幾年新興的一種深度學習技術(shù),目前在圖像、語音識別及自然語言處理領(lǐng)域應用較廣,發(fā)展較成熟。這種技術(shù)基于多層感知機(multi-layer perceptron),多層感知機是上個世紀八十年代由Rumelhart、Williams、Hinton和LeCun等人共同提出的,其目標是通過模擬人腦神經(jīng)元的信息處理過程,用神經(jīng)元網(wǎng)絡(luò)來描述現(xiàn)實世界中的復雜規(guī)則(一般是函數(shù)形式)。但多層感知機結(jié)構(gòu)過于簡單,導致描述事物或者規(guī)則的能力有限。針對這一問題,人工智能專家們經(jīng)過不懈努力,不斷增加神經(jīng)網(wǎng)絡(luò)的深度,同時將不同層劃分為不同功能,從而催生出了卷積神經(jīng)網(wǎng)絡(luò)。本文主要關(guān)注點是模體識別問題中模體的序列特異性,針對這個問題,使用卷積神經(jīng)網(wǎng)絡(luò)建立了相應的序列預測模型。該模型主要涉及幾個階段:首先將字符串序列轉(zhuǎn)化為數(shù)值編碼矩陣,再用預測模式的數(shù)值矩陣對序列編碼矩陣進行卷積運算,從而自動從序列中提取預測模式的特征,卷積輸出的矩陣中每一個元素需要與給定的閾值相減,只保留結(jié)果大于0的元素傳入下一層;再將經(jīng)過閾值矯正過的輸出矩陣輸入池化(pooling)層,池化層的作用是對輸入數(shù)據(jù)進行壓縮,只保留主要特征;經(jīng)過池化壓縮的矩陣輸入一個全連接的神經(jīng)網(wǎng)絡(luò)層,這一層通過計算加權(quán)和得到一個實數(shù)輸出分數(shù),將該分數(shù)與目標分數(shù)相比較,計算出誤差,反向傳播給前面各層,通過誤差調(diào)整各層參數(shù),最終擬合得到一個模型,就是序列特異性預測模型。
【學位授予單位】:云南大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:Q811.4;TP183
,
本文編號:1329116
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1329116.html
最近更新
教材專著