基于廣義溶劑化自由能理論的蛋白質(zhì)結(jié)構(gòu)模型評(píng)估
發(fā)布時(shí)間:2021-10-13 19:00
蛋白結(jié)構(gòu)預(yù)測(cè)是當(dāng)前計(jì)算生物學(xué)以及生物信息學(xué)領(lǐng)域最具代表性和影響力的研究方向之一。蛋白質(zhì)結(jié)構(gòu)模型評(píng)估一般是蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)和蛋白質(zhì)設(shè)計(jì)的最終步驟,它負(fù)責(zé)從大量候選結(jié)構(gòu)中篩選出更接近于真實(shí)結(jié)構(gòu)的結(jié)果。目前蛋白質(zhì)結(jié)構(gòu)模型評(píng)估主要有兩種思路:“基于知識(shí)的”(KB)和“基于物理的”(PB)。傳統(tǒng)的“基于物理的”模型的性能并沒有那么有效。我們提出了一種廣義溶劑化自由能框架,主要思想是將給定復(fù)雜系統(tǒng)的每個(gè)基本物理組成單元定義為溶質(zhì),并將其所有周圍單元定義為其特定溶劑。它本質(zhì)上可以靈活地用于多尺度,并且適合于機(jī)器學(xué)習(xí)的實(shí)施。Cullpdb數(shù)據(jù)集生成于2018.11.26,其中任意兩條序列的相似性小于25%,分辨率小于2.0埃并且R-factor小于0.25。我們從PDB數(shù)據(jù)庫中下載其中的8129條數(shù)據(jù),作為原始數(shù)據(jù)集。本文分別將蛋白質(zhì)的氨基酸序列中氨基酸二體和氨基酸三體視為溶質(zhì)單位。在已下載的數(shù)據(jù)中,通過定義溶質(zhì)單位的特定溶劑環(huán)境,利用python中的biopython庫來處理PDB數(shù)據(jù),提取并計(jì)算相關(guān)數(shù)據(jù)作為溶劑特征,包括代表溶質(zhì)單位與溶劑環(huán)境相對(duì)位置6個(gè)夾角,溶質(zhì)單位與溶劑環(huán)境的空間距離,以及溶...
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:52 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 引言
1.2 蛋白質(zhì)結(jié)構(gòu)
1.3 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫
1.4 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
1.5 廣義溶劑化自由能
1.6 本章小結(jié)
第2章 分類器設(shè)計(jì)
2.1 引言
2.2 神經(jīng)網(wǎng)絡(luò)
2.2.1 激活函數(shù)
2.2.2 損失函數(shù)
2.2.3 隨機(jī)梯度下降
2.3 Softmax
2.4 Hierarchical softmax
2.4.1 哈夫曼樹和哈夫曼編碼
2.4.2 Hierarchical softmax算法
2.5 神經(jīng)網(wǎng)絡(luò)性能評(píng)價(jià)
2.6 本章小結(jié)
第3章 數(shù)據(jù)處理及模型訓(xùn)練
3.1 引言
3.2 特征提取
3.2.1 單個(gè)氨基酸特征提取
3.2.2 氨基酸二體特征提取
3.2.3 氨基酸三體特征提取
3.3 模型搭建
3.3.1 二體預(yù)測(cè)模型
3.3.2 三體預(yù)測(cè)模型
3.4 本章小結(jié)
第4章 結(jié)果與討論
4.1 原始數(shù)據(jù)集
4.2 單個(gè)氨基酸特征提取結(jié)果
4.3 氨基酸二體模型訓(xùn)練結(jié)果
4.4 氨基酸三體模型訓(xùn)練結(jié)果
4.5 本章小結(jié)
第5章 結(jié)論
參考文獻(xiàn)
作者簡(jiǎn)介
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于人工神經(jīng)網(wǎng)絡(luò)的綜合負(fù)荷模型[J]. 王立德,李欣然,李培強(qiáng),陳輝華,宋軍英. 電網(wǎng)技術(shù). 2008(16)
[2]生物信息學(xué):生物實(shí)驗(yàn)數(shù)據(jù)和計(jì)算技術(shù)結(jié)合的新領(lǐng)域[J]. 歐陽曙光,賀福初. 科學(xué)通報(bào). 1999(14)
本文編號(hào):3435232
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:52 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 引言
1.2 蛋白質(zhì)結(jié)構(gòu)
1.3 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫
1.4 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
1.5 廣義溶劑化自由能
1.6 本章小結(jié)
第2章 分類器設(shè)計(jì)
2.1 引言
2.2 神經(jīng)網(wǎng)絡(luò)
2.2.1 激活函數(shù)
2.2.2 損失函數(shù)
2.2.3 隨機(jī)梯度下降
2.3 Softmax
2.4 Hierarchical softmax
2.4.1 哈夫曼樹和哈夫曼編碼
2.4.2 Hierarchical softmax算法
2.5 神經(jīng)網(wǎng)絡(luò)性能評(píng)價(jià)
2.6 本章小結(jié)
第3章 數(shù)據(jù)處理及模型訓(xùn)練
3.1 引言
3.2 特征提取
3.2.1 單個(gè)氨基酸特征提取
3.2.2 氨基酸二體特征提取
3.2.3 氨基酸三體特征提取
3.3 模型搭建
3.3.1 二體預(yù)測(cè)模型
3.3.2 三體預(yù)測(cè)模型
3.4 本章小結(jié)
第4章 結(jié)果與討論
4.1 原始數(shù)據(jù)集
4.2 單個(gè)氨基酸特征提取結(jié)果
4.3 氨基酸二體模型訓(xùn)練結(jié)果
4.4 氨基酸三體模型訓(xùn)練結(jié)果
4.5 本章小結(jié)
第5章 結(jié)論
參考文獻(xiàn)
作者簡(jiǎn)介
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于人工神經(jīng)網(wǎng)絡(luò)的綜合負(fù)荷模型[J]. 王立德,李欣然,李培強(qiáng),陳輝華,宋軍英. 電網(wǎng)技術(shù). 2008(16)
[2]生物信息學(xué):生物實(shí)驗(yàn)數(shù)據(jù)和計(jì)算技術(shù)結(jié)合的新領(lǐng)域[J]. 歐陽曙光,賀福初. 科學(xué)通報(bào). 1999(14)
本文編號(hào):3435232
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3435232.html
最近更新
教材專著