基于知識(shí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)復(fù)合打分函數(shù)
發(fā)布時(shí)間:2021-08-14 02:49
蛋白質(zhì)的三維結(jié)構(gòu)對(duì)于研究它的功能及其相關(guān)的藥物設(shè)計(jì)至關(guān)重要,多年來(lái),科學(xué)家們提出了各種各樣基于氨基酸序列的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法。通常來(lái)說(shuō),蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)包含構(gòu)象產(chǎn)生和構(gòu)象篩選兩個(gè)基本過(guò)程,其中,在對(duì)大批量構(gòu)象進(jìn)行篩選時(shí),能否挑出最接近天然結(jié)構(gòu)的蛋白質(zhì)構(gòu)象,結(jié)構(gòu)評(píng)估函數(shù)也即是通常所說(shuō)的打分函數(shù)的精準(zhǔn)與否顯得尤為重要。根據(jù)統(tǒng)計(jì)力學(xué),一個(gè)物理系統(tǒng)的穩(wěn)定狀態(tài)對(duì)應(yīng)于它的最低自由能,對(duì)于包含大量原子的蛋白質(zhì)大分子當(dāng)然也不例外,因此對(duì)于從物理自由能角度推導(dǎo)的打分函數(shù)來(lái)說(shuō),理想的打分函數(shù)應(yīng)該給予天然蛋白質(zhì)最低能量分?jǐn)?shù)。由于蛋白質(zhì)數(shù)據(jù)庫(kù)(Protein Data Bank,PDB)中包含了大量通過(guò)實(shí)驗(yàn)解出的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)信息,同時(shí)考慮到其數(shù)量不斷增長(zhǎng)的態(tài)勢(shì),基于知識(shí)的蛋白質(zhì)結(jié)構(gòu)打分函數(shù)在近幾十年獲得了廣泛關(guān)注,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域取得了很大成功,精細(xì)化程度也相應(yīng)得到不斷的提高。然而,出于對(duì)計(jì)算速度以及打分函數(shù)設(shè)計(jì)簡(jiǎn)化性的考慮,當(dāng)前的基于知識(shí)的打分函數(shù)通常只考慮非成鍵相互作用,而把構(gòu)象熵以及共價(jià)鍵的鍵長(zhǎng)勢(shì)能和鍵角勢(shì)能部分排除在外。這種處理方式導(dǎo)致打分函數(shù)在對(duì)具有良好的共價(jià)鍵結(jié)構(gòu)的蛋白質(zhì)三維構(gòu)象進(jìn)行打分時(shí)...
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:106 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
蛋白質(zhì)一到四級(jí)結(jié)構(gòu)示意圖
在圖 3-3 中。從表 3-4 和圖 3-3 中給出的對(duì)比結(jié)果可以看出,ITDA 表現(xiàn)明顯優(yōu)于其它 6 個(gè)打分函數(shù),分別在 Rosetta_set(3DR)測(cè)試集上識(shí)別出 58 個(gè)靶標(biāo)中的 53 個(gè)天然蛋白質(zhì)結(jié)構(gòu);在 Modeller_set(3DR)測(cè)試集上識(shí)別出 20 個(gè)靶標(biāo)中的 15 個(gè)天然蛋白質(zhì)結(jié)構(gòu);在 I-TASSER_set(3DR)測(cè)試集上識(shí)別出 56 個(gè)靶標(biāo)中的 39 個(gè)天然蛋白質(zhì)結(jié)構(gòu)。平均來(lái)看,ITDA 在 3 個(gè) 3DRobot 測(cè)試集上識(shí)別出全部 134 個(gè)靶標(biāo)測(cè)試集中的 107 個(gè)天然蛋白質(zhì)結(jié)構(gòu),成功率和 Z-score 分別為 80%和 2.47,而其它 6 個(gè)打分函數(shù)都僅僅獲得了低于 10%的成功率,Z-score 值小于 2.0。(5) 與 ITScore/Pro 的對(duì)比圖 3-3 ITDA 與其它 6 種打分函數(shù)在 Rosetta_set(3DR)、Modeller_set(3DR)、I-TASSER_set(3DR) 三個(gè)測(cè)試集上的總體平均成功率與 Z-score 對(duì)比。
(2) AMBER 測(cè)試集由美國(guó)佐治亞理工學(xué)院的 Skolnick 教授研究組構(gòu)建的 AMBER 測(cè)試集是另一個(gè)具有相當(dāng)挑戰(zhàn)性的、測(cè)試打分函數(shù)的基準(zhǔn)數(shù)據(jù)集。這個(gè)數(shù)據(jù)集總共包含 47 個(gè)蛋白質(zhì)靶標(biāo),每一個(gè)靶標(biāo)擁有 1040 個(gè)假結(jié)構(gòu)。所有的結(jié)構(gòu),無(wú)論天然態(tài)還是假結(jié)構(gòu),都在AMBER/GBSA 力場(chǎng)下經(jīng)過(guò) 2ns 的 MD 優(yōu)化模擬處理。這個(gè)基準(zhǔn)數(shù)據(jù)集最初的設(shè)計(jì)目的是用來(lái)檢查 AMBER/GBSA 力場(chǎng)從假結(jié)構(gòu)中識(shí)別天然態(tài)的有效性。由于使用AMBER 進(jìn)行了 2ns 的松弛模擬,其天然態(tài)或者假結(jié)構(gòu)構(gòu)象中的所有原子形成了良好的堆砌,具有良好的靜電和 VDW 相互作用接觸。因此,若是在這個(gè)測(cè)試集上進(jìn)行識(shí)別出天然態(tài)的打分測(cè)試,可想而知是具有相當(dāng)?shù)奶魬?zhàn)性。圖 4-2 展示了我們的打分函數(shù) ITCPS 在 AMBER 基準(zhǔn)測(cè)試集中,將蛋白質(zhì)天然態(tài)從各自相應(yīng)的大量假結(jié)構(gòu)中識(shí)別出來(lái)的成功率。為了進(jìn)行對(duì)比,圖中也列出了其它九種打分函數(shù)的相應(yīng)測(cè)試結(jié)果,如 ITDA、dDFIRE、ITScore/Pro、OPUS-PSP、
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)[J]. 鄧海游,賈亞,張陽(yáng). 物理學(xué)報(bào). 2016(17)
[2]Residual occurrence and energy property of proteins in HNP model[J]. 姜舟婷,竇文輝,沈瑜,孫婷婷,徐鵬. Chinese Physics B. 2015(11)
[3]生物大分子多尺度理論和計(jì)算方法[J]. 李文飛,張建,王駿,王煒. 物理學(xué)報(bào). 2015(09)
本文編號(hào):3341617
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:106 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
蛋白質(zhì)一到四級(jí)結(jié)構(gòu)示意圖
在圖 3-3 中。從表 3-4 和圖 3-3 中給出的對(duì)比結(jié)果可以看出,ITDA 表現(xiàn)明顯優(yōu)于其它 6 個(gè)打分函數(shù),分別在 Rosetta_set(3DR)測(cè)試集上識(shí)別出 58 個(gè)靶標(biāo)中的 53 個(gè)天然蛋白質(zhì)結(jié)構(gòu);在 Modeller_set(3DR)測(cè)試集上識(shí)別出 20 個(gè)靶標(biāo)中的 15 個(gè)天然蛋白質(zhì)結(jié)構(gòu);在 I-TASSER_set(3DR)測(cè)試集上識(shí)別出 56 個(gè)靶標(biāo)中的 39 個(gè)天然蛋白質(zhì)結(jié)構(gòu)。平均來(lái)看,ITDA 在 3 個(gè) 3DRobot 測(cè)試集上識(shí)別出全部 134 個(gè)靶標(biāo)測(cè)試集中的 107 個(gè)天然蛋白質(zhì)結(jié)構(gòu),成功率和 Z-score 分別為 80%和 2.47,而其它 6 個(gè)打分函數(shù)都僅僅獲得了低于 10%的成功率,Z-score 值小于 2.0。(5) 與 ITScore/Pro 的對(duì)比圖 3-3 ITDA 與其它 6 種打分函數(shù)在 Rosetta_set(3DR)、Modeller_set(3DR)、I-TASSER_set(3DR) 三個(gè)測(cè)試集上的總體平均成功率與 Z-score 對(duì)比。
(2) AMBER 測(cè)試集由美國(guó)佐治亞理工學(xué)院的 Skolnick 教授研究組構(gòu)建的 AMBER 測(cè)試集是另一個(gè)具有相當(dāng)挑戰(zhàn)性的、測(cè)試打分函數(shù)的基準(zhǔn)數(shù)據(jù)集。這個(gè)數(shù)據(jù)集總共包含 47 個(gè)蛋白質(zhì)靶標(biāo),每一個(gè)靶標(biāo)擁有 1040 個(gè)假結(jié)構(gòu)。所有的結(jié)構(gòu),無(wú)論天然態(tài)還是假結(jié)構(gòu),都在AMBER/GBSA 力場(chǎng)下經(jīng)過(guò) 2ns 的 MD 優(yōu)化模擬處理。這個(gè)基準(zhǔn)數(shù)據(jù)集最初的設(shè)計(jì)目的是用來(lái)檢查 AMBER/GBSA 力場(chǎng)從假結(jié)構(gòu)中識(shí)別天然態(tài)的有效性。由于使用AMBER 進(jìn)行了 2ns 的松弛模擬,其天然態(tài)或者假結(jié)構(gòu)構(gòu)象中的所有原子形成了良好的堆砌,具有良好的靜電和 VDW 相互作用接觸。因此,若是在這個(gè)測(cè)試集上進(jìn)行識(shí)別出天然態(tài)的打分測(cè)試,可想而知是具有相當(dāng)?shù)奶魬?zhàn)性。圖 4-2 展示了我們的打分函數(shù) ITCPS 在 AMBER 基準(zhǔn)測(cè)試集中,將蛋白質(zhì)天然態(tài)從各自相應(yīng)的大量假結(jié)構(gòu)中識(shí)別出來(lái)的成功率。為了進(jìn)行對(duì)比,圖中也列出了其它九種打分函數(shù)的相應(yīng)測(cè)試結(jié)果,如 ITDA、dDFIRE、ITScore/Pro、OPUS-PSP、
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)[J]. 鄧海游,賈亞,張陽(yáng). 物理學(xué)報(bào). 2016(17)
[2]Residual occurrence and energy property of proteins in HNP model[J]. 姜舟婷,竇文輝,沈瑜,孫婷婷,徐鵬. Chinese Physics B. 2015(11)
[3]生物大分子多尺度理論和計(jì)算方法[J]. 李文飛,張建,王駿,王煒. 物理學(xué)報(bào). 2015(09)
本文編號(hào):3341617
本文鏈接:http://sikaile.net/projectlw/swxlw/3341617.html
最近更新
教材專著