天然產(chǎn)物的系統(tǒng)性藥物篩選和藥物靶點(diǎn)相互作用預(yù)測(cè)
本文選題:藥靶結(jié)合力預(yù)測(cè) + 藥靶相互作用; 參考:《西北農(nóng)林科技大學(xué)》2016年博士論文
【摘要】:天然產(chǎn)物近千年來(lái)在維持和改善人類健康方面發(fā)揮了重要的作用。從天然產(chǎn)物中開發(fā)新藥被證明是非常成功的。然而,由于化學(xué)成分和作用機(jī)制的復(fù)雜性,用傳統(tǒng)方法從天然產(chǎn)物中搜尋有效藥物和揭示藥效機(jī)制是非常困難的。最近,ADME/T預(yù)測(cè)、系統(tǒng)生物學(xué)和系統(tǒng)藥理學(xué)的成功整合已經(jīng)極大促進(jìn)了大量新的能治療多種疾病的潛在藥物的發(fā)現(xiàn)和開發(fā)。此論文中介紹了如何整合計(jì)算ADME/T、藥代動(dòng)力學(xué)、系統(tǒng)藥理學(xué)、組學(xué)和系統(tǒng)生物學(xué)來(lái)研究從天然產(chǎn)物中發(fā)掘藥物,旨在突出天然產(chǎn)物在藥物發(fā)現(xiàn)中重要作用。在獲得一個(gè)新的可成藥的天然產(chǎn)物后,尋找它治療疾病的潛在機(jī)制是對(duì)藥物安全性和藥物新藥效開發(fā)非常重要的。由于小分子化合物/藥物通常作用于蛋白質(zhì)靶標(biāo)上行使相應(yīng)的藥理學(xué)功能,因此藥靶相互作用(DTI)的確定在藥理學(xué)研究中極為關(guān)鍵。而由于實(shí)驗(yàn)耗費(fèi)高、蛋白純化難等一系列問題,傳統(tǒng)實(shí)驗(yàn)方法測(cè)定藥靶相互作用仍然面臨嚴(yán)峻的挑戰(zhàn)。而且當(dāng)前計(jì)算模型通常著眼于預(yù)測(cè)小規(guī)模的直接或間接靶標(biāo)。本文用Ki常數(shù)將DTI量化為化合物和蛋白質(zhì)分子間的親和力。從PDSP Ki數(shù)據(jù)庫(kù)(http://pdsp.med.unc.edu/kidb.php)收集配體、靶標(biāo)和二者的親和力相關(guān)信息。在構(gòu)建數(shù)據(jù)集的過程中,刪除其中不能特征化的化合物分子。通過分析數(shù)據(jù)集中的Ki值,發(fā)現(xiàn)有成百上千個(gè)Ki值為1000 nM或10 000 nM的數(shù)據(jù),這些數(shù)據(jù)很有可能是一些潛在的缺失數(shù)據(jù),而且如此多的重復(fù)數(shù)據(jù)不利于構(gòu)建準(zhǔn)確的模型。因此在構(gòu)建模型時(shí)我們刪除了Ki值重復(fù)多于70次的相關(guān)數(shù)據(jù),該閾值是根據(jù)兩個(gè)準(zhǔn)則確定:(1)盡可能保留更多的數(shù)據(jù);(2)盡可能多地排除缺失數(shù)據(jù)。最后我們得到?jīng)]有重復(fù)的2003個(gè)化合物和209個(gè)靶標(biāo)數(shù)據(jù)作為建模數(shù)據(jù)集。通過運(yùn)用Dragon軟件和PROFET服務(wù)器分別將化合物分子和蛋白質(zhì)特征化,獲得基于1589個(gè)分子描述符和1080蛋白質(zhì)描述符的9948對(duì)配體-蛋白質(zhì)數(shù)據(jù),并用支持向量機(jī)(SVM)和隨機(jī)森林(RF)這兩種算法構(gòu)建了兩個(gè)機(jī)器學(xué)習(xí)模型。運(yùn)用5倍交叉驗(yàn)證和F檢驗(yàn)對(duì)著兩個(gè)模型的性能進(jìn)行評(píng)價(jià)和比較。結(jié)果顯示,對(duì)于藥靶關(guān)系的預(yù)測(cè),兩種模型的最優(yōu)模型都顯示出較好的性能,交叉驗(yàn)證結(jié)果顯示SVM模型和RF模型的測(cè)試集的決定系數(shù)R2分別為0.6079和0.6267,均方誤差MSE分別為7.0487和6.5828,兩個(gè)模型提供了有效的Ki預(yù)測(cè)性能而且沒有過擬合現(xiàn)象。但是通過F檢驗(yàn)發(fā)現(xiàn),RF模型比SVM模型更加穩(wěn)定可靠(P0.001)。此外通過進(jìn)一步分析RF模型產(chǎn)生的描述符重要性,我們發(fā)現(xiàn)化合物分子的2D自相關(guān)性、拓?fù)潆姾芍笖?shù)和3D-MoRSE描述符以及蛋白質(zhì)的自相關(guān)描述符和兩性偽氨基酸成分對(duì)于Ki預(yù)測(cè)更為重要。因此在這里我們構(gòu)建的RF模型能作為藥靶相互作用預(yù)測(cè)的模型并將有利于藥物的靶標(biāo)預(yù)測(cè)和藥物研發(fā)過程中的毒性評(píng)價(jià)。
[Abstract]:Natural products have played an important role in maintaining and improving human health in recent millennia.The development of new drugs from natural products has proved to be very successful.However, because of the complexity of chemical composition and mechanism of action, it is very difficult to search for effective drugs from natural products by traditional methods and to reveal the mechanism of pharmacodynamics.Recently, ADME-T predicted that the successful integration of systems biology and systemic pharmacology has greatly facilitated the discovery and development of a large number of new potential drugs for the treatment of multiple diseases.This paper introduces how to integrate the calculation of ADME-T, pharmacokinetics, systematic pharmacology, cluster and systems biology to study the discovery of drugs from natural products, in order to highlight the important role of natural products in drug discovery.After obtaining the natural product of a new patent medicine, it is very important for the safety of the drug and the development of the new drug effect to find the potential mechanism of its treatment.Since small molecular compounds / drugs usually act on protein targets to perform the corresponding pharmacological functions, the determination of drug target interaction (DTI) is very important in pharmacological research.However, due to a series of problems, such as high experimental cost and difficulty in protein purification, the traditional methods for the determination of drug target interaction are still facing severe challenges.And current computational models usually aim at predicting small-scale direct or indirect targets.In this paper, the Ki constant is used to quantify DTI as the affinity between compounds and proteins.Collect information about ligands, targets, and affinity from PDSP Ki database http: r / r pdsp.med.unc.edur.kidb.php.In the process of constructing a dataset, remove compounds that cannot be characterized.By analyzing the value of Ki in the data set, we find that there are hundreds of data with Ki value of 1000 nm or 10 000 nm, which are likely to be some potentially missing data, and so many duplicate data are not conducive to building accurate models.Therefore, when we construct the model, we delete the relevant data whose Ki value is repeated more than 70 times. The threshold value is determined according to two criteria: 1) keeping as much data as possible) excluding the missing data as much as possible.Finally, we obtained 2003 compounds and 209 target data as modeling data sets.By using Dragon software and PROFET server to characterize the molecules and proteins of compounds, 9948 ligand-protein data based on 1589 molecular descriptors and 1080 protein descriptors were obtained.Two machine learning models are constructed by using support vector machine (SVM) and random forest (RF).The performance of the two models was evaluated and compared by 5 times cross validation and F test.The results show that the optimal models of the two models show good performance for the prediction of drug target relationship.The cross validation results show that the determination coefficients R2 of SVM model and RF model are 0.6079 and 0.6267, respectively, and the mean square error MSE are 7.0487 and 6.5828, respectively. The two models provide effective Ki prediction performance without over-fitting.But the F test shows that the RF model is more stable and reliable than the SVM model.In addition, by further analyzing the importance of descriptors generated by RF model, we found that the 2D autocorrelation of compound molecules,Topological charge index, 3D-MoRSE descriptors, autocorrelation descriptors of proteins and amphoteric pseudo amino acids are more important for Ki prediction.Therefore, the RF model constructed here can be used as the prediction model of drug target interaction and will be helpful to the prediction of drug target and the evaluation of toxicity in the process of drug development.
【學(xué)位授予單位】:西北農(nóng)林科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:R915
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;海洋動(dòng)物中天然產(chǎn)物有望成為治療癌癥新藥[J];中國(guó)中醫(yī)藥信息雜志;2005年08期
2 ;《天然產(chǎn)物資源化學(xué)》[J];科學(xué)通報(bào);2008年21期
3 ;第58屆天然產(chǎn)物高登研究會(huì)議(英文)[J];中國(guó)天然藥物;2009年02期
4 薛鮑;;我校承辦第三屆中泰天然產(chǎn)物與藥物發(fā)現(xiàn)雙邊學(xué)術(shù)研討會(huì)[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年06期
5 岳鳳先;中藥優(yōu)勢(shì)的根本:理論體系?天然產(chǎn)物?[J];中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志;1995年01期
6 周莉;心胸博大,回歸天然深圳博大天然產(chǎn)物有限公司介紹[J];藥物生物技術(shù);1998年03期
7 陸江海;李秀蘭;劉沁舡;趙玉英;;天然產(chǎn)物與藥物的發(fā)現(xiàn)[J];國(guó)外醫(yī)藥(植物藥分冊(cè));2000年02期
8 庾石山,馮孝章;新型結(jié)構(gòu)活性天然產(chǎn)物的化學(xué)研究[J];中國(guó)醫(yī)學(xué)科學(xué)院學(xué)報(bào);2004年04期
9 王普善;天然產(chǎn)物在新藥發(fā)現(xiàn)中的地位與機(jī)會(huì)(I)——重新審視天然產(chǎn)物藥物發(fā)現(xiàn)戰(zhàn)略[J];中國(guó)醫(yī)藥導(dǎo)刊;2005年05期
10 楊振寰,劉霞;制備高效液相色譜在天然產(chǎn)物分離中的應(yīng)用[J];中成藥;2005年12期
相關(guān)會(huì)議論文 前10條
1 胡金鋒;;低于200μg的微量天然產(chǎn)物能鑒定其化學(xué)結(jié)構(gòu)嗎?[A];第七屆全國(guó)天然有機(jī)化學(xué)學(xué)術(shù)研討會(huì)論文集[C];2008年
2 胡立宏;;經(jīng)典天然產(chǎn)物的再研究[A];第七屆全國(guó)天然有機(jī)化學(xué)學(xué)術(shù)研討會(huì)論文集[C];2008年
3 張衛(wèi)東;;天然產(chǎn)物發(fā)現(xiàn)與生物學(xué)研究相結(jié)合的思考[A];第七屆全國(guó)天然有機(jī)化學(xué)學(xué)術(shù)研討會(huì)論文集[C];2008年
4 尤啟冬;;基于天然產(chǎn)物的新藥物研究[A];2010年中國(guó)藥學(xué)大會(huì)暨第十屆中國(guó)藥師周論文集[C];2010年
5 再帕爾·阿不力孜;;基于質(zhì)譜技術(shù)的天然產(chǎn)物分析方法研究[A];中國(guó)化學(xué)會(huì)第八屆天然有機(jī)化學(xué)學(xué)術(shù)研討會(huì)論文集[C];2010年
6 胡金鋒;;利用天然產(chǎn)物調(diào)控腦功能基因的研究[A];第七屆全國(guó)天然有機(jī)化學(xué)學(xué)術(shù)研討會(huì)論文集[C];2008年
7 孫昊鵬;郭青龍;尤啟冬;;基于天然產(chǎn)物的創(chuàng)新藥物研究[A];2011年全國(guó)藥物化學(xué)學(xué)術(shù)會(huì)議——藥物的源頭創(chuàng)新論文摘要集[C];2011年
8 唐功利;;復(fù)雜抗腫瘤天然產(chǎn)物的生物合成研究[A];中國(guó)化學(xué)會(huì)第9屆天然有機(jī)化學(xué)學(xué)術(shù)會(huì)議論文集[C];2012年
9 董國(guó)強(qiáng);王勝正;繆震元;張萬(wàn)年;盛春泉;;基于抗腫瘤天然產(chǎn)物的化學(xué)生物學(xué)和新藥發(fā)現(xiàn)[A];第八屆全國(guó)化學(xué)生物學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2013年
10 王尉;杜寧;周曉晶;張婉;周悅;張經(jīng)華;;高速逆流色譜技術(shù)在天然產(chǎn)物研制方面的應(yīng)用[A];全國(guó)生物醫(yī)藥色譜學(xué)術(shù)交流會(huì)(2010景德鎮(zhèn))論文集[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 文星明;湖南組建天然產(chǎn)物國(guó)際合作基地[N];中國(guó)化工報(bào);2007年
2 本報(bào)記者 趙秋麗邋通訊員 呂善錕;以天然產(chǎn)物標(biāo)樣研究推進(jìn)中藥國(guó)際化[N];光明日?qǐng)?bào);2008年
3 柯華 本報(bào)記者 洪繼東;從天然產(chǎn)物里提取“金子”[N];成都日?qǐng)?bào);2010年
4 記者 路平 通訊員 華萱;孫寶國(guó)院士當(dāng)主任[N];廣東科技報(bào);2010年
5 楊杰松 金永紅;專家呼吁——加強(qiáng)以天然產(chǎn)物為來(lái)源的藥物創(chuàng)新[N];健康報(bào);2009年
6 魏鋒 馬雙成 林瑞超 金紅軍;天然產(chǎn)物化學(xué)研究概況[N];中國(guó)醫(yī)藥報(bào);2000年
7 高成森;我國(guó)天然產(chǎn)物數(shù)據(jù)庫(kù)投入使用[N];中國(guó)醫(yī)藥報(bào);2002年
8 羅靜;南大教授獲英國(guó)皇家化學(xué)會(huì)獎(jiǎng)[N];中國(guó)化工報(bào);2007年
9 記者 陳雪;銀廣夏組建天然產(chǎn)物研發(fā)中心[N];中國(guó)證券報(bào);2000年
10 劉洋邋鄭利剛 程卯生;組合庫(kù)設(shè)計(jì)策略助力新藥研發(fā)[N];中國(guó)醫(yī)藥報(bào);2007年
相關(guān)博士學(xué)位論文 前10條
1 陳旺;DNA拓?fù)洚悩?gòu)酶Ⅱα擬天然產(chǎn)物抑制劑的設(shè)計(jì)合成與抗腫瘤活性研究[D];山東大學(xué);2015年
2 劉杰;色酮類天然產(chǎn)物的全合成研究[D];蘭州大學(xué);2015年
3 張明智;天然產(chǎn)物Pimprinine的結(jié)構(gòu)改造及其衍生物的殺菌活性研究[D];華中師范大學(xué);2013年
4 孔凡棟;四株海洋來(lái)源真菌活性次級(jí)代謝產(chǎn)物的研究[D];中國(guó)海洋大學(xué);2015年
5 楊娟;Communesin類天然產(chǎn)物的合成研究及基于鈀、銅催化的C-H官能團(tuán)化的合成方法學(xué)研究[D];蘭州大學(xué);2013年
6 Piar Ali;天然產(chǎn)物的系統(tǒng)性藥物篩選和藥物靶點(diǎn)相互作用預(yù)測(cè)[D];西北農(nóng)林科技大學(xué);2016年
7 王立言;計(jì)算化學(xué)在天然產(chǎn)物化學(xué)中的若干應(yīng)用研究[D];華東理工大學(xué);2013年
8 薛松;海綿活性天然產(chǎn)物分離及結(jié)構(gòu)確定[D];中國(guó)科學(xué)院研究生院(大連化學(xué)物理研究所);2003年
9 張壽德;計(jì)算機(jī)技術(shù)在天然產(chǎn)物結(jié)構(gòu)和活性研究中的應(yīng)用[D];上海交通大學(xué);2012年
10 王利強(qiáng);天然產(chǎn)物中α-糖苷酶抑制劑的發(fā)現(xiàn)與評(píng)價(jià)體系研究[D];南開大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 馬曉琴;手性黃烷酮及苯并吡喃類黃酮天然產(chǎn)物的全合成研究[D];寧夏大學(xué);2015年
2 丁群山;吲哚啉衍生物的不對(duì)稱合成及在天然產(chǎn)物(-)-Angustureine合成中的應(yīng)用[D];鄭州大學(xué);2015年
3 石美智;天然產(chǎn)物與OATP1B1相互作用的研究和OATP2B1N-糖基化對(duì)功能和表達(dá)的影響[D];蘇州大學(xué);2015年
4 趙磊;Combretastatin A-4類似物的合成與活性研究[D];上海應(yīng)用技術(shù)學(xué)院;2015年
5 王風(fēng)樓;多種天然產(chǎn)物的抗衰老研究及其在眼霜中的應(yīng)用[D];上海應(yīng)用技術(shù)學(xué)院;2015年
6 王陳超;喹啉和原花色素類天然產(chǎn)物的合成研究[D];哈爾濱工業(yè)大學(xué);2015年
7 王瑤;天然產(chǎn)物奎寧和(+)-Gossonorol的合成研究[D];杭州師范大學(xué);2015年
8 蔣惠芳;二芳基庚烷類化合物的合成研究[D];杭州師范大學(xué);2015年
9 胡帥帥;新型微提取技術(shù)的研究及其在天然產(chǎn)物中的應(yīng)用[D];杭州師范大學(xué);2015年
10 張軍慶;基于齊墩果酸的“類天然產(chǎn)物”合成研究[D];西南科技大學(xué);2015年
,本文編號(hào):1770584
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/1770584.html