蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
發(fā)布時(shí)間:2021-04-25 19:28
生物信息學(xué)的出現(xiàn)極大的推動(dòng)了生命科學(xué)相關(guān)學(xué)科的發(fā)展,對(duì)于近年來不斷增長(zhǎng)的生物相關(guān)海量數(shù)據(jù)提供了相應(yīng)的解決方案。其中蛋白質(zhì)結(jié)構(gòu)的研究是生物信息學(xué)中的一個(gè)熱點(diǎn),通過研究蛋白質(zhì)的結(jié)構(gòu)能夠更好的認(rèn)清蛋白質(zhì)的內(nèi)在機(jī)制,了解生命活動(dòng)的奧秘。蛋白質(zhì)的結(jié)構(gòu)主要分為四個(gè)層級(jí),其中四級(jí)結(jié)構(gòu)對(duì)于蛋白質(zhì)大分子來說有著重要意義,近幾年相關(guān)學(xué)者對(duì)蛋白質(zhì)四級(jí)結(jié)構(gòu)的預(yù)測(cè)做了大量的工作,可是預(yù)測(cè)率仍舊不是非常理想,本文利用不同的特征提取方法以及機(jī)器學(xué)習(xí)算法進(jìn)行整合,構(gòu)造出不同的預(yù)測(cè)器,對(duì)蛋白質(zhì)四級(jí)結(jié)構(gòu)完成兩層預(yù)測(cè),第一層預(yù)先對(duì)單聚體,同源多聚體,非同源多聚體進(jìn)行判別,完成之后我通過第二層預(yù)測(cè)器能夠預(yù)測(cè)出它具體是屬于幾聚體,本文主要工作如下:(1)構(gòu)造了一種利用改進(jìn)的偽氨基酸成分法進(jìn)行特征提取,結(jié)合最近鄰算法的預(yù)測(cè)方法,對(duì)比于傳統(tǒng)的偽氨基酸成分法整體預(yù)測(cè)率提高了12.63%,達(dá)到了67.81%同時(shí)在第二層中部分類別提高了20%預(yù)測(cè)成功率。(2)我利用Gene Ontology數(shù)據(jù)庫(kù)結(jié)合現(xiàn)有的結(jié)構(gòu)功能域數(shù)據(jù)庫(kù)進(jìn)行特征提取,利用隨機(jī)森林方法進(jìn)行分類,發(fā)現(xiàn)比較于之前的研究該方法的整體預(yù)測(cè)率能夠達(dá)到74.38%,提高了3.24%...
【文章來源】:景德鎮(zhèn)陶瓷大學(xué)江西省
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 引言
1.1 研究背景
1.2 蛋白質(zhì)結(jié)構(gòu)類型介紹
1.2.1 蛋白質(zhì)一級(jí)結(jié)構(gòu)
1.2.2 蛋白質(zhì)二級(jí)結(jié)構(gòu)
1.2.3 蛋白質(zhì)三級(jí)結(jié)構(gòu)
1.2.4 蛋白質(zhì)四級(jí)結(jié)構(gòu)
1.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)綜述
1.4 蛋白質(zhì)的四級(jí)結(jié)構(gòu)研究現(xiàn)狀介紹
2 常見的特征提取方法及分類算法
2.1 蛋白質(zhì)特征提取方法
2.1.1 基于氨基酸的位置組成信息的提取方法
2.1.2 基于氨基酸物化屬性的特征提取方法
2.1.3 基于蛋白質(zhì)數(shù)據(jù)庫(kù)特征提取算法
2.1.4 基于蛋白質(zhì)進(jìn)化信息的特征提取
2.2 蛋白質(zhì)預(yù)測(cè)問題中的常用分類算法
2.2.1 支持向量機(jī)
2.2.2 邏輯回歸算法
2.2.3 神經(jīng)網(wǎng)絡(luò)模型
2.3 模型的檢驗(yàn)
3 基于改進(jìn)的偽氨基酸成分蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
3.1 數(shù)據(jù)集的構(gòu)建
3.2 改進(jìn)的偽氨基酸成分特征提取方法
3.3 K近鄰算法
3.4 結(jié)果與討論
4 基于Gene Ontology的蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
4.1 基于Gene Ontology數(shù)據(jù)庫(kù)的蛋白質(zhì)特征提取
4.1.1 GO數(shù)據(jù)庫(kù)
4.1.2 蛋白質(zhì)序列構(gòu)建
4.2 隨機(jī)森林分類器
4.2.1 決策樹
4.2.2 隨機(jī)森林
4.3 結(jié)果與討論
5 基于BP神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
5.1 數(shù)據(jù)預(yù)處理
5.1.1 正交編碼
5.1.2 PCA數(shù)據(jù)處理
5.2 BP神經(jīng)網(wǎng)絡(luò)
5.3 實(shí)驗(yàn)過程
5.4 結(jié)果與討論
6 基于卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
6.1 卷積神經(jīng)網(wǎng)絡(luò)原理與結(jié)構(gòu)
6.1.1 卷積網(wǎng)絡(luò)的基本原理
6.1.2 卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)
6.1.3 激活函數(shù)
6.2 結(jié)果與討論
7 總結(jié)
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間參與的項(xiàng)目和發(fā)表的論文
【參考文獻(xiàn)】:
期刊論文
[1]基于支持向量機(jī)的蛋白質(zhì)同源寡聚體分類研究[J]. 張紹武,潘泉,陳潤(rùn)生,張洪才. 生物化學(xué)與生物物理進(jìn)展. 2003(06)
本文編號(hào):3159958
【文章來源】:景德鎮(zhèn)陶瓷大學(xué)江西省
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 引言
1.1 研究背景
1.2 蛋白質(zhì)結(jié)構(gòu)類型介紹
1.2.1 蛋白質(zhì)一級(jí)結(jié)構(gòu)
1.2.2 蛋白質(zhì)二級(jí)結(jié)構(gòu)
1.2.3 蛋白質(zhì)三級(jí)結(jié)構(gòu)
1.2.4 蛋白質(zhì)四級(jí)結(jié)構(gòu)
1.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)綜述
1.4 蛋白質(zhì)的四級(jí)結(jié)構(gòu)研究現(xiàn)狀介紹
2 常見的特征提取方法及分類算法
2.1 蛋白質(zhì)特征提取方法
2.1.1 基于氨基酸的位置組成信息的提取方法
2.1.2 基于氨基酸物化屬性的特征提取方法
2.1.3 基于蛋白質(zhì)數(shù)據(jù)庫(kù)特征提取算法
2.1.4 基于蛋白質(zhì)進(jìn)化信息的特征提取
2.2 蛋白質(zhì)預(yù)測(cè)問題中的常用分類算法
2.2.1 支持向量機(jī)
2.2.2 邏輯回歸算法
2.2.3 神經(jīng)網(wǎng)絡(luò)模型
2.3 模型的檢驗(yàn)
3 基于改進(jìn)的偽氨基酸成分蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
3.1 數(shù)據(jù)集的構(gòu)建
3.2 改進(jìn)的偽氨基酸成分特征提取方法
3.3 K近鄰算法
3.4 結(jié)果與討論
4 基于Gene Ontology的蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
4.1 基于Gene Ontology數(shù)據(jù)庫(kù)的蛋白質(zhì)特征提取
4.1.1 GO數(shù)據(jù)庫(kù)
4.1.2 蛋白質(zhì)序列構(gòu)建
4.2 隨機(jī)森林分類器
4.2.1 決策樹
4.2.2 隨機(jī)森林
4.3 結(jié)果與討論
5 基于BP神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
5.1 數(shù)據(jù)預(yù)處理
5.1.1 正交編碼
5.1.2 PCA數(shù)據(jù)處理
5.2 BP神經(jīng)網(wǎng)絡(luò)
5.3 實(shí)驗(yàn)過程
5.4 結(jié)果與討論
6 基于卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)四級(jí)結(jié)構(gòu)預(yù)測(cè)
6.1 卷積神經(jīng)網(wǎng)絡(luò)原理與結(jié)構(gòu)
6.1.1 卷積網(wǎng)絡(luò)的基本原理
6.1.2 卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)
6.1.3 激活函數(shù)
6.2 結(jié)果與討論
7 總結(jié)
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間參與的項(xiàng)目和發(fā)表的論文
【參考文獻(xiàn)】:
期刊論文
[1]基于支持向量機(jī)的蛋白質(zhì)同源寡聚體分類研究[J]. 張紹武,潘泉,陳潤(rùn)生,張洪才. 生物化學(xué)與生物物理進(jìn)展. 2003(06)
本文編號(hào):3159958
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3159958.html
最近更新
教材專著