化合物血漿蛋白結(jié)合率和內(nèi)分泌干擾性的計算機預測研究
發(fā)布時間:2020-06-15 15:45
【摘要】:不良的 ADMET(Absorption,Distribution,Metabolism,Excretion,and Toxicity)性質(zhì)是藥物研發(fā)失敗的重要原因,隨著化學合成和生物篩選能力的飛速提高,大量化合物急需進行早期ADMET性質(zhì)研究,許多中、高通量的體外測試技術(shù)應運而生。而計算機預測作為一類更加高效與經(jīng)濟的技術(shù)可以顯著提高化合物ADMET性質(zhì)研究的能力,加快藥物研發(fā)的進程。本論文旨在利用機器學習方法預測化合物的血漿蛋白結(jié)合率和內(nèi)分泌干擾特性,主要內(nèi)容如下所述。第一章詳細介紹了課題研究中使用的定量/定性構(gòu)效關(guān)系(Quantitative/Qualitative Structure-Activity Relationship,QSAR)方法的研究過程,包括數(shù)據(jù)處理、分子結(jié)構(gòu)表征、(定量、單標簽及多標簽分類)模型構(gòu)建的常用機器學習方法和模型評價等。血漿蛋白結(jié)合率作為一個重要的藥代動力學和毒代動力學性質(zhì)在藥物研究中具有重要的意義,因此,在論文的第二章我們構(gòu)建了化合物血漿蛋白結(jié)合率的預測模型。該研究首先收集得到了一個由967個藥物分子構(gòu)成的訓練集,然后結(jié)合6種機器學習算法和26個分子描述符構(gòu)建了回歸模型,用于預測化合物的血漿蛋白結(jié)合分數(shù)。我們還使用兩種一致性策略構(gòu)建了組合模型,結(jié)果表明一致性模型相比單個模型存在一定的優(yōu)勢。所有的模型通過內(nèi)部10折交叉驗證和三個多樣的外部測試集進行驗證與評估,其中三個測試集分別由242個藥物分子、397個環(huán)境化合物和231個新設(shè)計的分子構(gòu)成,模型對整個測試集預測的平均絕對誤差(Mean Absolute Error,MAE)范圍是0.126到0.178。本研究中我們根據(jù)不同的實驗測試技術(shù)獲得的數(shù)據(jù)分析了實驗誤差近似為0.061,此外考慮到結(jié)合率0-1的范圍,0.126到0.178的誤差表明我們的模型獲得了合理的可靠性。最后,我們對影響血漿蛋白結(jié)合的關(guān)鍵分子描述符進行了分析,從而可以輔助模型的解釋;同時還定義了模型的應用域,這將有助于模型的合理使用;衔飪(nèi)分泌干擾性已成為一個嚴重的公共健康問題,也是藥物毒副作用的一種,因此對廣泛應用中的化合物進行內(nèi)分泌干擾特性預測研究具有重要的意義。為此我們在論文的第三章構(gòu)建了化合物內(nèi)分泌干擾性的預測模型。首先我們從Tox21收集了 6個內(nèi)分泌相關(guān)靶標的調(diào)節(jié)劑數(shù)據(jù),通過整合獲得了一個分別由294個和73個分子構(gòu)成的多標簽訓練集和測試集,同時為每個靶標分別整合了一個單標簽訓練集和測試集,然后我們分別構(gòu)建了多靶標單標簽和多標簽模型用于預測化合物的內(nèi)分泌干擾特性。為了處理數(shù)據(jù)不平衡問題,我們使用多次隨機欠采樣結(jié)合投票分類的策略,為每個靶標分別構(gòu)建單標簽模型,然后我們結(jié)合5種多標簽分類方法和12種指紋構(gòu)建多標簽模型。結(jié)果表明,所有靶標的單標簽模型都獲得了合理的可靠度,而多標簽模型中Label Powerset這種能夠考慮到靶標之間相互作用關(guān)系的算法結(jié)果最好。此外為了便于比較和分析,我們將每個靶標的最好的單標簽模型組合起來以獲得多標簽預測,結(jié)果表明多標簽模型的預測準確度相比組合最優(yōu)的單標簽模型存在顯著的優(yōu)勢。研究發(fā)現(xiàn)傳統(tǒng)的單標簽模型對具有“多標簽”特性的陰性樣本預測易為假陽,而多標簽模型能夠很好地彌補這一缺陷。所以我們的研究說明,通過多標簽建模策略,利用所研究靶標之間的相互作用關(guān)系,可以提升內(nèi)分泌干擾物預測模型的準確度。最后一章為全文總結(jié)。
【學位授予單位】:華東理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP181;R96
【圖文】:
1.2計算毒理學逡逑毒理學是一門研宄外界環(huán)境中的化合物進入機體后對機體產(chǎn)生危害及其作用機制逡逑的一門學科,為保護生物體的安全和環(huán)境生態(tài)系統(tǒng)的平衡提供了科學依據(jù)。一些可能對逡逑機體產(chǎn)生損傷作用的外來物質(zhì)在日常生活中無處不見,包括生活中的日用品、化妝品、逡逑食物添加劑、藥品、農(nóng)藥、各種環(huán)境污染物和工業(yè)化學物質(zhì)(如滅火器中的阻燃劑、塑逡逑料制品中的增塑劑)等。而大多數(shù)化合物缺乏全面的安全性評價[14],所以需要加快對它逡逑們進行毒理學研宄,以及時阻止有害物質(zhì)的繼續(xù)使用,保障生物體的健康和安全。長期逡逑以來毒理學研究的主要方法是動物實驗,但動物研宄成本高、費時費力且違背動物保護逡逑倫理,所以依據(jù)歐盟的邋REACH邋(Registration,Evaluation,Airthorization邋and邋Restriction邋of逡逑Chemicals)要求研究者應該逐漸減少實驗動物的使用,轉(zhuǎn)而借助一些更加快捷且逡逑經(jīng)濟的體外測試或計算方法。隨著高通量技術(shù)的廣泛應用,體外毒性測試方法也得到了逡逑發(fā)展。計算毒理學就是使用計算方法進行化合物的毒性預測,它是體外和體內(nèi)毒性分析逡逑方法的補充,可以用于化合物的篩選、指導毒性測試、減少后期研宄的失敗率。當前,逡逑基于計算的毒理學研宄方法主要有4種即:逡逑(1)定量/定性構(gòu)效關(guān)系[16]邋(Quantitative/邋Qualitative邋Structure-Activity邋Relationship,逡逑
確度不會超過建模所用實驗數(shù)據(jù)的精確度,所以如性差異(或單個數(shù)據(jù)集實驗誤差大于30%),我們該數(shù)據(jù)),因為這種情況下構(gòu)建的模型是不可靠的件能夠進行上述操作,比如ChemAxon[271邋(學術(shù)ent^28](商業(yè))、RDKit邋program邋tools[29](免費)、LKNIME[31](免費)、PipelinePilot[32](商業(yè))等。便捷,人工干預依然必不可少。對于成千上萬條記數(shù)據(jù)進行核對,或者僅僅核對結(jié)構(gòu)比較復雜的化合,每一個分子都可以獲得其正確的結(jié)構(gòu),而其活性以通過構(gòu)建一致性模型,將那些被所有模型都預測方法已被成功應用于Ames邋mutagenicity研究中[24]疑分子進行文獻驗證,發(fā)現(xiàn)其中31個(?22.2%)測的方法可以用來提高活性數(shù)據(jù)質(zhì)量。逡逑
【學位授予單位】:華東理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP181;R96
【圖文】:
1.2計算毒理學逡逑毒理學是一門研宄外界環(huán)境中的化合物進入機體后對機體產(chǎn)生危害及其作用機制逡逑的一門學科,為保護生物體的安全和環(huán)境生態(tài)系統(tǒng)的平衡提供了科學依據(jù)。一些可能對逡逑機體產(chǎn)生損傷作用的外來物質(zhì)在日常生活中無處不見,包括生活中的日用品、化妝品、逡逑食物添加劑、藥品、農(nóng)藥、各種環(huán)境污染物和工業(yè)化學物質(zhì)(如滅火器中的阻燃劑、塑逡逑料制品中的增塑劑)等。而大多數(shù)化合物缺乏全面的安全性評價[14],所以需要加快對它逡逑們進行毒理學研宄,以及時阻止有害物質(zhì)的繼續(xù)使用,保障生物體的健康和安全。長期逡逑以來毒理學研究的主要方法是動物實驗,但動物研宄成本高、費時費力且違背動物保護逡逑倫理,所以依據(jù)歐盟的邋REACH邋(Registration,Evaluation,Airthorization邋and邋Restriction邋of逡逑Chemicals)要求研究者應該逐漸減少實驗動物的使用,轉(zhuǎn)而借助一些更加快捷且逡逑經(jīng)濟的體外測試或計算方法。隨著高通量技術(shù)的廣泛應用,體外毒性測試方法也得到了逡逑發(fā)展。計算毒理學就是使用計算方法進行化合物的毒性預測,它是體外和體內(nèi)毒性分析逡逑方法的補充,可以用于化合物的篩選、指導毒性測試、減少后期研宄的失敗率。當前,逡逑基于計算的毒理學研宄方法主要有4種即:逡逑(1)定量/定性構(gòu)效關(guān)系[16]邋(Quantitative/邋Qualitative邋Structure-Activity邋Relationship,逡逑
確度不會超過建模所用實驗數(shù)據(jù)的精確度,所以如性差異(或單個數(shù)據(jù)集實驗誤差大于30%),我們該數(shù)據(jù)),因為這種情況下構(gòu)建的模型是不可靠的件能夠進行上述操作,比如ChemAxon[271邋(學術(shù)ent^28](商業(yè))、RDKit邋program邋tools[29](免費)、LKNIME[31](免費)、PipelinePilot[32](商業(yè))等。便捷,人工干預依然必不可少。對于成千上萬條記數(shù)據(jù)進行核對,或者僅僅核對結(jié)構(gòu)比較復雜的化合,每一個分子都可以獲得其正確的結(jié)構(gòu),而其活性以通過構(gòu)建一致性模型,將那些被所有模型都預測方法已被成功應用于Ames邋mutagenicity研究中[24]疑分子進行文獻驗證,發(fā)現(xiàn)其中31個(?22.2%)測的方法可以用來提高活性數(shù)據(jù)質(zhì)量。逡逑
【相似文獻】
相關(guān)期刊論文 前10條
1 王廷廷;;農(nóng)藥專利化合物的前世今生[J];農(nóng)藥市場信息;2016年28期
2 王輝;Ponmani Jeyakkumar;Sangaraiah Nagarajan;孟江平;周成合;;傒類化合物研究與應用[J];化學進展;2015年06期
3 童建軍;;非金屬及其化合物相關(guān)新型試題易錯提醒[J];中學生數(shù)理化(高一版);2015年11期
4 ;FEMA公布的第26批GRAS化合物名單[J];香料香精化妝品;2013年05期
5 沈英;;一種新型二乙酰氨乙酸乙二胺化合物及其藥物組合物[J];乙醛醋酸化工;2013年06期
6 ;更正[J];徐州師范大學學報(自然科學版);2009年02期
7 陳仕玉;胡建輝;王曉艷;楊景周;;硅鉬間化合物的研究及應用[J];山東陶瓷;2007年02期
8 池n 一也;坂gq 恒;^兲
本文編號:2714641
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/2714641.html
最近更新
教材專著