蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
發(fā)布時間:2021-04-25 19:28
生物信息學的出現(xiàn)極大的推動了生命科學相關(guān)學科的發(fā)展,對于近年來不斷增長的生物相關(guān)海量數(shù)據(jù)提供了相應(yīng)的解決方案。其中蛋白質(zhì)結(jié)構(gòu)的研究是生物信息學中的一個熱點,通過研究蛋白質(zhì)的結(jié)構(gòu)能夠更好的認清蛋白質(zhì)的內(nèi)在機制,了解生命活動的奧秘。蛋白質(zhì)的結(jié)構(gòu)主要分為四個層級,其中四級結(jié)構(gòu)對于蛋白質(zhì)大分子來說有著重要意義,近幾年相關(guān)學者對蛋白質(zhì)四級結(jié)構(gòu)的預(yù)測做了大量的工作,可是預(yù)測率仍舊不是非常理想,本文利用不同的特征提取方法以及機器學習算法進行整合,構(gòu)造出不同的預(yù)測器,對蛋白質(zhì)四級結(jié)構(gòu)完成兩層預(yù)測,第一層預(yù)先對單聚體,同源多聚體,非同源多聚體進行判別,完成之后我通過第二層預(yù)測器能夠預(yù)測出它具體是屬于幾聚體,本文主要工作如下:(1)構(gòu)造了一種利用改進的偽氨基酸成分法進行特征提取,結(jié)合最近鄰算法的預(yù)測方法,對比于傳統(tǒng)的偽氨基酸成分法整體預(yù)測率提高了12.63%,達到了67.81%同時在第二層中部分類別提高了20%預(yù)測成功率。(2)我利用Gene Ontology數(shù)據(jù)庫結(jié)合現(xiàn)有的結(jié)構(gòu)功能域數(shù)據(jù)庫進行特征提取,利用隨機森林方法進行分類,發(fā)現(xiàn)比較于之前的研究該方法的整體預(yù)測率能夠達到74.38%,提高了3.24%...
【文章來源】:景德鎮(zhèn)陶瓷大學江西省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 引言
1.1 研究背景
1.2 蛋白質(zhì)結(jié)構(gòu)類型介紹
1.2.1 蛋白質(zhì)一級結(jié)構(gòu)
1.2.2 蛋白質(zhì)二級結(jié)構(gòu)
1.2.3 蛋白質(zhì)三級結(jié)構(gòu)
1.2.4 蛋白質(zhì)四級結(jié)構(gòu)
1.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述
1.4 蛋白質(zhì)的四級結(jié)構(gòu)研究現(xiàn)狀介紹
2 常見的特征提取方法及分類算法
2.1 蛋白質(zhì)特征提取方法
2.1.1 基于氨基酸的位置組成信息的提取方法
2.1.2 基于氨基酸物化屬性的特征提取方法
2.1.3 基于蛋白質(zhì)數(shù)據(jù)庫特征提取算法
2.1.4 基于蛋白質(zhì)進化信息的特征提取
2.2 蛋白質(zhì)預(yù)測問題中的常用分類算法
2.2.1 支持向量機
2.2.2 邏輯回歸算法
2.2.3 神經(jīng)網(wǎng)絡(luò)模型
2.3 模型的檢驗
3 基于改進的偽氨基酸成分蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
3.1 數(shù)據(jù)集的構(gòu)建
3.2 改進的偽氨基酸成分特征提取方法
3.3 K近鄰算法
3.4 結(jié)果與討論
4 基于Gene Ontology的蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
4.1 基于Gene Ontology數(shù)據(jù)庫的蛋白質(zhì)特征提取
4.1.1 GO數(shù)據(jù)庫
4.1.2 蛋白質(zhì)序列構(gòu)建
4.2 隨機森林分類器
4.2.1 決策樹
4.2.2 隨機森林
4.3 結(jié)果與討論
5 基于BP神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
5.1 數(shù)據(jù)預(yù)處理
5.1.1 正交編碼
5.1.2 PCA數(shù)據(jù)處理
5.2 BP神經(jīng)網(wǎng)絡(luò)
5.3 實驗過程
5.4 結(jié)果與討論
6 基于卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
6.1 卷積神經(jīng)網(wǎng)絡(luò)原理與結(jié)構(gòu)
6.1.1 卷積網(wǎng)絡(luò)的基本原理
6.1.2 卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)
6.1.3 激活函數(shù)
6.2 結(jié)果與討論
7 總結(jié)
致謝
參考文獻
攻讀碩士學位期間參與的項目和發(fā)表的論文
【參考文獻】:
期刊論文
[1]基于支持向量機的蛋白質(zhì)同源寡聚體分類研究[J]. 張紹武,潘泉,陳潤生,張洪才. 生物化學與生物物理進展. 2003(06)
本文編號:3159958
【文章來源】:景德鎮(zhèn)陶瓷大學江西省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 引言
1.1 研究背景
1.2 蛋白質(zhì)結(jié)構(gòu)類型介紹
1.2.1 蛋白質(zhì)一級結(jié)構(gòu)
1.2.2 蛋白質(zhì)二級結(jié)構(gòu)
1.2.3 蛋白質(zhì)三級結(jié)構(gòu)
1.2.4 蛋白質(zhì)四級結(jié)構(gòu)
1.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述
1.4 蛋白質(zhì)的四級結(jié)構(gòu)研究現(xiàn)狀介紹
2 常見的特征提取方法及分類算法
2.1 蛋白質(zhì)特征提取方法
2.1.1 基于氨基酸的位置組成信息的提取方法
2.1.2 基于氨基酸物化屬性的特征提取方法
2.1.3 基于蛋白質(zhì)數(shù)據(jù)庫特征提取算法
2.1.4 基于蛋白質(zhì)進化信息的特征提取
2.2 蛋白質(zhì)預(yù)測問題中的常用分類算法
2.2.1 支持向量機
2.2.2 邏輯回歸算法
2.2.3 神經(jīng)網(wǎng)絡(luò)模型
2.3 模型的檢驗
3 基于改進的偽氨基酸成分蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
3.1 數(shù)據(jù)集的構(gòu)建
3.2 改進的偽氨基酸成分特征提取方法
3.3 K近鄰算法
3.4 結(jié)果與討論
4 基于Gene Ontology的蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
4.1 基于Gene Ontology數(shù)據(jù)庫的蛋白質(zhì)特征提取
4.1.1 GO數(shù)據(jù)庫
4.1.2 蛋白質(zhì)序列構(gòu)建
4.2 隨機森林分類器
4.2.1 決策樹
4.2.2 隨機森林
4.3 結(jié)果與討論
5 基于BP神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
5.1 數(shù)據(jù)預(yù)處理
5.1.1 正交編碼
5.1.2 PCA數(shù)據(jù)處理
5.2 BP神經(jīng)網(wǎng)絡(luò)
5.3 實驗過程
5.4 結(jié)果與討論
6 基于卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級結(jié)構(gòu)預(yù)測
6.1 卷積神經(jīng)網(wǎng)絡(luò)原理與結(jié)構(gòu)
6.1.1 卷積網(wǎng)絡(luò)的基本原理
6.1.2 卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)
6.1.3 激活函數(shù)
6.2 結(jié)果與討論
7 總結(jié)
致謝
參考文獻
攻讀碩士學位期間參與的項目和發(fā)表的論文
【參考文獻】:
期刊論文
[1]基于支持向量機的蛋白質(zhì)同源寡聚體分類研究[J]. 張紹武,潘泉,陳潤生,張洪才. 生物化學與生物物理進展. 2003(06)
本文編號:3159958
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3159958.html
最近更新
教材專著