基于條件隨機(jī)場(chǎng)與深度學(xué)習(xí)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
發(fā)布時(shí)間:2021-04-28 05:05
隨著生物信息學(xué)的發(fā)展,蛋白質(zhì)數(shù)據(jù)庫中的蛋白質(zhì)序列信息越來越多,尤其是生物信息學(xué)的出現(xiàn),使得人們能夠更好地利用這些蛋白質(zhì)信息了解生物系統(tǒng)。生物信息學(xué)可以利用這些序列信息尋找相關(guān)的蛋白質(zhì),并收集其他信息推測(cè)未知蛋白質(zhì)的結(jié)構(gòu)和功能等可能的特性。蛋白質(zhì)結(jié)構(gòu)分析預(yù)測(cè)也經(jīng)常被用在藥物設(shè)計(jì)中。通過實(shí)驗(yàn)方法獲取蛋白質(zhì)二級(jí)結(jié)構(gòu)所需的成本高,專業(yè)人才緊缺,所以目前面臨的核心問題就是利用生物信息學(xué)找到一種能夠高效地預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的算法。本文使用深度學(xué)習(xí)算法和條件隨機(jī)場(chǎng)算法對(duì)蛋白質(zhì)二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。在蛋白質(zhì)數(shù)據(jù)處理中,本文用到了位置特異性矩陣(Position-Specific Scoring Matrix,PSSM),同時(shí)為了更好的表示氨基酸序列,使用了滑動(dòng)窗口技術(shù)。在蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)算法方面,本文提出了兩種學(xué)習(xí)分類方法:第一種是卷積神經(jīng)網(wǎng)絡(luò)結(jié)合Softmax分類器的算法,此方法改進(jìn)了卷積神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu),針對(duì)梯度消失問題在各卷積層之后添加了修正線性單元(Rectified Linear Units,ReLU)激活層,為了最大限度地保留原始數(shù)據(jù)的重要特征,提取了全連接層之前的特征數(shù)據(jù)作為Softma...
【文章來源】:齊魯工業(yè)大學(xué)山東省
【文章頁數(shù)】:79 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景
1.2 研究目的及意義
1.3 研究現(xiàn)狀
1.3.1 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)相關(guān)基礎(chǔ)
1.3.2 國內(nèi)外相關(guān)技術(shù)發(fā)展現(xiàn)狀
1.4 本文的研究?jī)?nèi)容和基本結(jié)構(gòu)
1.4.1 研究?jī)?nèi)容
1.4.2 論文結(jié)構(gòu)安排
第2章 蛋白質(zhì)二級(jí)結(jié)構(gòu)簡(jiǎn)介與相關(guān)預(yù)測(cè)方法
2.1 蛋白質(zhì)簡(jiǎn)介
2.1.1 蛋白質(zhì)結(jié)構(gòu)分析
2.1.2 蛋白質(zhì)的層次結(jié)構(gòu)
2.1.3 蛋白質(zhì)的結(jié)構(gòu)與功能的關(guān)系
2.2 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)有關(guān)技術(shù)
2.2.1 數(shù)據(jù)處理
2.2.2 特征提取和滑動(dòng)窗口技術(shù)
2.2.3 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)評(píng)價(jià)指標(biāo)
2.3 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)相關(guān)方法介紹
2.3.1 統(tǒng)計(jì)分析方法
2.3.2 基于知識(shí)分析方法
2.3.3 機(jī)器學(xué)習(xí)方法
2.4 蛋白質(zhì)數(shù)據(jù)庫介紹
2.5 本章小結(jié)
第3章 基于條件隨機(jī)場(chǎng)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
3.1 條件隨機(jī)場(chǎng)原理
3.1.1 最大熵原理
3.1.2 隱馬爾可夫原理
3.1.3 條件隨機(jī)場(chǎng)模型
3.2 線性鏈條件隨機(jī)場(chǎng)
3.3 條件隨機(jī)場(chǎng)的基本算法
3.3.1 前向-后向算法
3.3.2 梯度下降法
3.3.3 維特比算法
3.4 實(shí)驗(yàn)工具介紹
3.5 實(shí)驗(yàn)及結(jié)果分析
3.5.1 數(shù)據(jù)集
3.5.2 實(shí)驗(yàn)過程
3.5.3 結(jié)果分析
3.6 本章小結(jié)
第4章 基于卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
4.1 卷積神經(jīng)網(wǎng)絡(luò)原理及結(jié)構(gòu)
4.1.1 卷積神經(jīng)網(wǎng)絡(luò)原理
4.1.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)組成
4.2 Softmax回歸模型
4.3 CNN-Softmax網(wǎng)絡(luò)模型
4.4 實(shí)驗(yàn)及其結(jié)果分析
4.4.1 數(shù)據(jù)集
4.4.2 實(shí)驗(yàn)過程
4.4.3 結(jié)果分析
4.5 本章小結(jié)
第5章 基于集成學(xué)習(xí)的CRF與 CNN的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
5.1 集成學(xué)習(xí)
5.1.1 集成學(xué)習(xí)原理
5.1.2 集成學(xué)習(xí)中差異性分類器的構(gòu)建
5.2 集成學(xué)習(xí)的合并策略
5.2.1 平均法和加權(quán)平均法
5.2.2 投票法
5.3 CRF 和 CNN 的集成策略
5.4 實(shí)驗(yàn)及結(jié)果分析
5.4.1 數(shù)據(jù)集
5.4.2 實(shí)驗(yàn)過程
5.4.3 結(jié)果分析
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 研究工作總結(jié)
6.2 研究工作展望
參考文獻(xiàn)
致謝
在學(xué)期間主要科研成果
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)二級(jí)結(jié)構(gòu)在線服務(wù)器預(yù)測(cè)評(píng)估[J]. 朱樹平,劉毅慧. 生物信息學(xué). 2019(01)
[2]深度學(xué)習(xí)方法在生物質(zhì)譜及蛋白質(zhì)組學(xué)中的應(yīng)用[J]. 趙新元,秦偉捷,錢小紅. 生物化學(xué)與生物物理進(jìn)展. 2018(12)
[3]基于卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)[J]. 郭延哺,李維華,王兵益,金宸. 模式識(shí)別與人工智能. 2018(06)
[4]自動(dòng)編碼器方法的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)[J]. 張帥燕,劉毅慧. 生物信息學(xué). 2018(01)
[5]基于PPI網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)的蛋白質(zhì)功能預(yù)測(cè)方法[J]. 唐家琪,吳璟莉. 計(jì)算機(jī)應(yīng)用. 2018(03)
[6]諾貝爾化學(xué)獎(jiǎng)[J]. 王毓明. 大學(xué)化學(xué). 2018(02)
[7]基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時(shí)間序列預(yù)測(cè)[J]. 王鑫,吳際,劉超,楊海燕,杜艷麗,牛文生. 北京航空航天大學(xué)學(xué)報(bào). 2018(04)
[8]深層網(wǎng)絡(luò)中的梯度消失現(xiàn)象[J]. 周祥全,張津. 科技展望. 2017(27)
[9]基于深度學(xué)習(xí)的八類蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)算法[J]. 張蕾,李征,鄭逢斌,楊偉. 計(jì)算機(jī)應(yīng)用. 2017(05)
[10]深度學(xué)習(xí)加速技術(shù)研究[J]. 楊旭瑜,張錚,張為華. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(09)
本文編號(hào):3164859
【文章來源】:齊魯工業(yè)大學(xué)山東省
【文章頁數(shù)】:79 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景
1.2 研究目的及意義
1.3 研究現(xiàn)狀
1.3.1 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)相關(guān)基礎(chǔ)
1.3.2 國內(nèi)外相關(guān)技術(shù)發(fā)展現(xiàn)狀
1.4 本文的研究?jī)?nèi)容和基本結(jié)構(gòu)
1.4.1 研究?jī)?nèi)容
1.4.2 論文結(jié)構(gòu)安排
第2章 蛋白質(zhì)二級(jí)結(jié)構(gòu)簡(jiǎn)介與相關(guān)預(yù)測(cè)方法
2.1 蛋白質(zhì)簡(jiǎn)介
2.1.1 蛋白質(zhì)結(jié)構(gòu)分析
2.1.2 蛋白質(zhì)的層次結(jié)構(gòu)
2.1.3 蛋白質(zhì)的結(jié)構(gòu)與功能的關(guān)系
2.2 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)有關(guān)技術(shù)
2.2.1 數(shù)據(jù)處理
2.2.2 特征提取和滑動(dòng)窗口技術(shù)
2.2.3 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)評(píng)價(jià)指標(biāo)
2.3 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)相關(guān)方法介紹
2.3.1 統(tǒng)計(jì)分析方法
2.3.2 基于知識(shí)分析方法
2.3.3 機(jī)器學(xué)習(xí)方法
2.4 蛋白質(zhì)數(shù)據(jù)庫介紹
2.5 本章小結(jié)
第3章 基于條件隨機(jī)場(chǎng)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
3.1 條件隨機(jī)場(chǎng)原理
3.1.1 最大熵原理
3.1.2 隱馬爾可夫原理
3.1.3 條件隨機(jī)場(chǎng)模型
3.2 線性鏈條件隨機(jī)場(chǎng)
3.3 條件隨機(jī)場(chǎng)的基本算法
3.3.1 前向-后向算法
3.3.2 梯度下降法
3.3.3 維特比算法
3.4 實(shí)驗(yàn)工具介紹
3.5 實(shí)驗(yàn)及結(jié)果分析
3.5.1 數(shù)據(jù)集
3.5.2 實(shí)驗(yàn)過程
3.5.3 結(jié)果分析
3.6 本章小結(jié)
第4章 基于卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
4.1 卷積神經(jīng)網(wǎng)絡(luò)原理及結(jié)構(gòu)
4.1.1 卷積神經(jīng)網(wǎng)絡(luò)原理
4.1.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)組成
4.2 Softmax回歸模型
4.3 CNN-Softmax網(wǎng)絡(luò)模型
4.4 實(shí)驗(yàn)及其結(jié)果分析
4.4.1 數(shù)據(jù)集
4.4.2 實(shí)驗(yàn)過程
4.4.3 結(jié)果分析
4.5 本章小結(jié)
第5章 基于集成學(xué)習(xí)的CRF與 CNN的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
5.1 集成學(xué)習(xí)
5.1.1 集成學(xué)習(xí)原理
5.1.2 集成學(xué)習(xí)中差異性分類器的構(gòu)建
5.2 集成學(xué)習(xí)的合并策略
5.2.1 平均法和加權(quán)平均法
5.2.2 投票法
5.3 CRF 和 CNN 的集成策略
5.4 實(shí)驗(yàn)及結(jié)果分析
5.4.1 數(shù)據(jù)集
5.4.2 實(shí)驗(yàn)過程
5.4.3 結(jié)果分析
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 研究工作總結(jié)
6.2 研究工作展望
參考文獻(xiàn)
致謝
在學(xué)期間主要科研成果
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)二級(jí)結(jié)構(gòu)在線服務(wù)器預(yù)測(cè)評(píng)估[J]. 朱樹平,劉毅慧. 生物信息學(xué). 2019(01)
[2]深度學(xué)習(xí)方法在生物質(zhì)譜及蛋白質(zhì)組學(xué)中的應(yīng)用[J]. 趙新元,秦偉捷,錢小紅. 生物化學(xué)與生物物理進(jìn)展. 2018(12)
[3]基于卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)[J]. 郭延哺,李維華,王兵益,金宸. 模式識(shí)別與人工智能. 2018(06)
[4]自動(dòng)編碼器方法的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)[J]. 張帥燕,劉毅慧. 生物信息學(xué). 2018(01)
[5]基于PPI網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)的蛋白質(zhì)功能預(yù)測(cè)方法[J]. 唐家琪,吳璟莉. 計(jì)算機(jī)應(yīng)用. 2018(03)
[6]諾貝爾化學(xué)獎(jiǎng)[J]. 王毓明. 大學(xué)化學(xué). 2018(02)
[7]基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時(shí)間序列預(yù)測(cè)[J]. 王鑫,吳際,劉超,楊海燕,杜艷麗,牛文生. 北京航空航天大學(xué)學(xué)報(bào). 2018(04)
[8]深層網(wǎng)絡(luò)中的梯度消失現(xiàn)象[J]. 周祥全,張津. 科技展望. 2017(27)
[9]基于深度學(xué)習(xí)的八類蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)算法[J]. 張蕾,李征,鄭逢斌,楊偉. 計(jì)算機(jī)應(yīng)用. 2017(05)
[10]深度學(xué)習(xí)加速技術(shù)研究[J]. 楊旭瑜,張錚,張為華. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(09)
本文編號(hào):3164859
本文鏈接:http://sikaile.net/projectlw/swxlw/3164859.html
最近更新
教材專著