基于信息熵的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法研究
發(fā)布時(shí)間:2021-08-23 13:51
蛋白質(zhì)是生物體內(nèi)的大分子,是生命活動(dòng)的主要承擔(dān)者。遺傳密碼揭示了DNA轉(zhuǎn)譯為氨基酸序列的機(jī)制,而氨基酸序列如何折疊為蛋白質(zhì)特定空間結(jié)構(gòu)仍是未解之謎。蛋白質(zhì)只有折疊為特定空間結(jié)構(gòu)后才能發(fā)揮特定的生物學(xué)功能。因此,研究蛋白質(zhì)空間結(jié)構(gòu)對(duì)理解氨基酸序列和空間結(jié)構(gòu)的關(guān)系具有重要理論價(jià)值,有助于人類理解蛋白質(zhì)功能、設(shè)計(jì)藥物和治療疾病等。目前,測(cè)序技術(shù)高速發(fā)展,實(shí)驗(yàn)解析結(jié)構(gòu)的技術(shù)發(fā)展相對(duì)緩慢。這一現(xiàn)狀導(dǎo)致已知序列的數(shù)目與解析結(jié)構(gòu)數(shù)目的差異呈指數(shù)增加。在理論價(jià)值和現(xiàn)實(shí)意義的雙重驅(qū)動(dòng)下,利用計(jì)算機(jī),結(jié)合算法,以氨基酸序列為起點(diǎn)預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)是生物信息學(xué)領(lǐng)域的重要研究課題之一。從頭預(yù)測(cè)方法是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的一類重要方法。該方法根據(jù)Anfinsen法則,在能量函數(shù)的指導(dǎo)下,利用優(yōu)化算法進(jìn)行構(gòu)象空間采樣,期望能夠搜索并選擇出近天然態(tài)構(gòu)象。但是,蛋白質(zhì)的構(gòu)象空間巨大,能量景觀極其粗糙,這使其成為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域最具挑戰(zhàn)性的任務(wù)之一。本文針對(duì)該問(wèn)題,主要工作如下:(1)針對(duì)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問(wèn)題,提出了基于接觸圖殘基對(duì)距離約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)算法。在該算法的探索階段,通過(guò)殘基對(duì)距離離散化,設(shè)計(jì)了基于殘基對(duì)距...
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
殘基對(duì)評(píng)分Figure3-3.Scoreofaresidue-pair
茲曼標(biāo)準(zhǔn)接受的構(gòu)象的評(píng)分和 RMSD。對(duì)于 T0869-D1,score_contact 與 RM關(guān)性明顯高于能量函數(shù)與 RMSD 的相關(guān)性,從而使得算法能夠更快搜索到態(tài)區(qū)域,得到精度更高的預(yù)測(cè)結(jié)果。對(duì)于 T0866-D1,score_contact 與 RM關(guān)性稍弱,但仍能夠輔助能量函數(shù)區(qū)分構(gòu)象的優(yōu)劣。對(duì)于 T0859-D163-D1,能量函數(shù)和基于接觸圖的評(píng)分指標(biāo)均與 RMSD 的相關(guān)性弱,導(dǎo)致預(yù)精度不夠高。如表 3-4 所示,對(duì) CDPSP-E、CDPSP-O 的 RMSD-average 值 CDPSP 進(jìn)行成對(duì) t 檢驗(yàn),得到 p-value。CDPSP-E 與 CDPSP 的 p-value 值065,小于 0.05,說(shuō)明 CDPSP 顯著優(yōu)于 CDPSP-E;而 CDPSP-O 與 CDPSPa) T0859-D1 b) T0863-D1
a) BR(RMSD=3.01 ) a) QK(RMSD=5.67 ) a) RX(RMSD=9.07 ) a) CDPSP(RMSD=5.15 )b) BR(RMSD=10.76 ) b) QK(RMSD=10.06 ) b) RX(RMSD=7.75 ) b) CDPSP(RMSD=5.65 )圖3-5 預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)測(cè)定結(jié)構(gòu)比對(duì):a) T0868-D1 b) T0869-D1Figure 3-5. The structural comparisons between predicted models and experimentalstructures: a) T0868-D1 b) T0869-D1
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)[J]. 鄧海游,賈亞,張陽(yáng). 物理學(xué)報(bào). 2016(17)
[2]蛋白折疊預(yù)測(cè)[J]. 馬彬廣. 科學(xué)通報(bào). 2016(24)
[3]蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)算法綜述[J]. 王超,朱建偉,張海倉(cāng),鞏海娥,鄭偉謀,卜東波. 計(jì)算機(jī)學(xué)報(bào). 2018(04)
本文編號(hào):3357992
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
殘基對(duì)評(píng)分Figure3-3.Scoreofaresidue-pair
茲曼標(biāo)準(zhǔn)接受的構(gòu)象的評(píng)分和 RMSD。對(duì)于 T0869-D1,score_contact 與 RM關(guān)性明顯高于能量函數(shù)與 RMSD 的相關(guān)性,從而使得算法能夠更快搜索到態(tài)區(qū)域,得到精度更高的預(yù)測(cè)結(jié)果。對(duì)于 T0866-D1,score_contact 與 RM關(guān)性稍弱,但仍能夠輔助能量函數(shù)區(qū)分構(gòu)象的優(yōu)劣。對(duì)于 T0859-D163-D1,能量函數(shù)和基于接觸圖的評(píng)分指標(biāo)均與 RMSD 的相關(guān)性弱,導(dǎo)致預(yù)精度不夠高。如表 3-4 所示,對(duì) CDPSP-E、CDPSP-O 的 RMSD-average 值 CDPSP 進(jìn)行成對(duì) t 檢驗(yàn),得到 p-value。CDPSP-E 與 CDPSP 的 p-value 值065,小于 0.05,說(shuō)明 CDPSP 顯著優(yōu)于 CDPSP-E;而 CDPSP-O 與 CDPSPa) T0859-D1 b) T0863-D1
a) BR(RMSD=3.01 ) a) QK(RMSD=5.67 ) a) RX(RMSD=9.07 ) a) CDPSP(RMSD=5.15 )b) BR(RMSD=10.76 ) b) QK(RMSD=10.06 ) b) RX(RMSD=7.75 ) b) CDPSP(RMSD=5.65 )圖3-5 預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)測(cè)定結(jié)構(gòu)比對(duì):a) T0868-D1 b) T0869-D1Figure 3-5. The structural comparisons between predicted models and experimentalstructures: a) T0868-D1 b) T0869-D1
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)[J]. 鄧海游,賈亞,張陽(yáng). 物理學(xué)報(bào). 2016(17)
[2]蛋白折疊預(yù)測(cè)[J]. 馬彬廣. 科學(xué)通報(bào). 2016(24)
[3]蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)算法綜述[J]. 王超,朱建偉,張海倉(cāng),鞏海娥,鄭偉謀,卜東波. 計(jì)算機(jī)學(xué)報(bào). 2018(04)
本文編號(hào):3357992
本文鏈接:http://sikaile.net/projectlw/swxlw/3357992.html
最近更新
教材專著