天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 醫(yī)學(xué)論文 > 中藥論文 >

基于分子振動特征的藥物靶點識別及活性預(yù)測模型研究

發(fā)布時間:2020-05-31 11:19
【摘要】:背景:目前,多數(shù)中藥化學(xué)成分作用靶點及其生物活性尚不確定,這已成為闡明中藥物質(zhì)基礎(chǔ)及其作用機制的瓶頸之一。中藥化學(xué)成分作用靶點及其生物活性的研究有助于揭示中藥在治療疾病過程中發(fā)揮藥效的程度以及為中藥化學(xué)成分在體內(nèi)發(fā)揮療效的機制提供線索與指導(dǎo),也有助于中藥化學(xué)成分作用靶點的重新定位。隨著科學(xué)技術(shù)的進步與發(fā)展,越來越多的中藥化學(xué)成分被發(fā)現(xiàn)。由于時間與資金成本的限制,利用傳統(tǒng)實驗的方法進行中藥化學(xué)成分與相關(guān)靶點之間生物活性的測定面臨很大的挑戰(zhàn),花費昂貴且效率較低。采用機器學(xué)習(xí)的方法構(gòu)建藥物與靶點的定量預(yù)測模型進行中藥化學(xué)成分作用靶點的識別及活性預(yù)測彌補了傳統(tǒng)實驗的不足,具有高效低耗的特點,被認為是研究化合物作用靶點與其生物活性的有效手段。近年來,越來越多關(guān)于藥物與靶點相互作用關(guān)系預(yù)測的模型被報道,這些模型大多數(shù)是判斷藥物與靶點之間是否存在相互作用關(guān)系,不能進行活性預(yù)測,只有少數(shù)模型用于預(yù)測藥物與靶點之間的定量關(guān)系,這些定量模型預(yù)測性能較差且只是針對少量靶點,即模型的準確性和適用范圍還需要進一步提高。因此建立預(yù)測性能高與適用范圍廣的藥物與靶點相互作用關(guān)系的定量預(yù)測模型是研究中藥化學(xué)成分潛在作用靶點及活性預(yù)測亟待解決的問題。目的:本文旨在構(gòu)建預(yù)測性能高及適用范圍廣的藥物靶點定量預(yù)測模型,彌補當(dāng)前采用實驗手段確定藥物潛在作用靶點及生物活性所帶來的不足之處,提高當(dāng)前藥物靶點定量預(yù)測模型的預(yù)測性能及適用范圍,以期為闡明中藥的物質(zhì)基礎(chǔ)及作用機制提供一定的線索與指導(dǎo)。方法:(1)藥物與靶點相互作用定量關(guān)系數(shù)據(jù)庫的考察。從數(shù)據(jù)的可靠性,準確性,完備性,可獲得性以及適用性五個方面對已有的藥物與靶點相互作用關(guān)系數(shù)據(jù)庫進行考察。數(shù)據(jù)的可靠性主要是考察數(shù)據(jù)的來源,準確性主要考察數(shù)據(jù)庫收錄數(shù)據(jù)的標準(主要是活性值的單位)是否一致,完備性主要考察數(shù)據(jù)庫對當(dāng)前藥物與靶點相互作用關(guān)系的覆蓋程度,可獲得性主要考察數(shù)據(jù)獲得的難易程度,適用性主要考察數(shù)據(jù)信息是否完善。最終,基于這五個方面確定本文的最佳數(shù)據(jù)源。(2)藥物與靶點定量預(yù)測模型的構(gòu)建。①根據(jù)收集的藥物與靶點相互作用關(guān)系數(shù)據(jù),計算化合物的分子描述符及靶點的序列描述符,從分子振動的角度對化合物的描述符進行篩選得到化合物的特征描述符子集,最后整合為藥物靶點定量關(guān)系數(shù)據(jù)集。②對數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)的清理,集成,變換,規(guī)約。數(shù)據(jù)清理是指清除異常值,數(shù)據(jù)集成是指對收集的數(shù)據(jù)進行整合,數(shù)據(jù)變換是指將數(shù)據(jù)轉(zhuǎn)化成適用于建模的形式,數(shù)據(jù)規(guī)約是指對數(shù)據(jù)進行歸一化處理。③特征篩選及模型構(gòu)建,采用“Boruta”程序包進行特征篩選構(gòu)建數(shù)據(jù)集的特征子集,分別采用隨機森林,支持向量機,人工神經(jīng)網(wǎng)絡(luò)三種機器學(xué)習(xí)算法進行藥物靶點定量預(yù)測模型的構(gòu)建。通過交叉驗證的方法對模型的穩(wěn)定性及預(yù)測性能進行驗證,采用構(gòu)建的模型對訓(xùn)練集和測試集分別進行預(yù)測,計算實驗測得的值(真實值)和預(yù)測值之間的差值以及差值絕對值,分析訓(xùn)練集和測試集在每一差值范圍內(nèi)的樣本量分布。繪制真實值與預(yù)測值的散點圖,計算決定系數(shù)(R2)和均方誤差(MSE)等回歸模型的評價指標篩選最優(yōu)模型。(3)通過與已報道的模型進行比較,判斷本文所構(gòu)建模型的準確性及適用范圍。(4)最優(yōu)預(yù)測模型在中藥化學(xué)成分作用靶點識別及活性預(yù)測中的應(yīng)用。收集Binding DB數(shù)據(jù)庫中未參與本文模型建立的中藥化學(xué)成分與靶點之間的定量關(guān)系,依據(jù)數(shù)據(jù)考察原則對數(shù)據(jù)進行收集整理獲得新的數(shù)據(jù)集,采用已獲得的最優(yōu)模型對新的數(shù)據(jù)集進行預(yù)測,將預(yù)測值與真實值進行比較證明最優(yōu)預(yù)測模型的準確性及適用性。結(jié)果:(1)選用ChEMBL數(shù)據(jù)庫中的藥物靶點定量關(guān)系數(shù)據(jù)作為本文的數(shù)據(jù)源。(2)建立了6個分別由EC50和KD值量化的藥物靶點相互作用定量預(yù)測模型。基于本文收集的數(shù)據(jù)集分別建立了由EC50和KD值量化的藥物與靶點相互作用關(guān)系的定量預(yù)測模型,涉及2207個化合物和1254個靶點共計21999條關(guān)系。從分子振動角度篩選出813個描述符表示化合物的特征子集。①采用隨機森林算法構(gòu)建的模型在訓(xùn)練集和測試集上具有良好的預(yù)測性能,EC50值量化的模型R2均大于0.96,MSE小于0.09;KD值量化的模型R2均大于0.94,MSE小于0.12;②采用支持向量機算法構(gòu)建的模型在訓(xùn)練集上的預(yù)測性能優(yōu)于測試集,EC50值量化的模型在訓(xùn)練集上的R2=0.9317,MSE=0.1270,測試集R2=0.5759,MSE=0.8356;KD值量化的模型在訓(xùn)練集上的R2=0.9099,MSE=0.1254,測試集R2=0.5083,MSE=0.7290;③采用人工神經(jīng)網(wǎng)絡(luò)算法構(gòu)建的模型在訓(xùn)練集的預(yù)測性能也優(yōu)于測試集,EC50值量化的模型在訓(xùn)練集的R2=0.7350,MSE=0.4867,測試集R2=0.5211,MSE=0.9590;KD值量化的模型在訓(xùn)練集上的R2=0.5857,MSE=0.5612,測試集R2=0.2961,MSE=1.019。比較數(shù)據(jù)集在每一差值絕對值范圍內(nèi)分布的樣本量及上述回歸模型的評價指標,隨機森林算法構(gòu)建的定量預(yù)測模型預(yù)測性能最好。(3)采用相同的模型評價指標與文獻已報道的模型進行比較,結(jié)果表明本文構(gòu)建的最優(yōu)模型具有更高的預(yù)測準確性及適用范圍。(4)采用本文構(gòu)建的最優(yōu)預(yù)測模型對Binding DB數(shù)據(jù)庫中已有的但沒有參與本文模型構(gòu)建的中藥化學(xué)成分與靶點的定量關(guān)系進行預(yù)測,結(jié)果表明本文預(yù)測的藥物靶點相互作用關(guān)系與實驗測量結(jié)果一致。在活性預(yù)測方面,實驗測量的預(yù)測值均大于真實值,但是它們之間的差值集中在某一范圍內(nèi)。出現(xiàn)這種系統(tǒng)誤差的原因可能是由于數(shù)據(jù)收集的來源不同,Binding DB數(shù)據(jù)庫與ChEMBL數(shù)據(jù)庫中的數(shù)據(jù)收入標準有所差異?梢酝ㄟ^設(shè)置校正因子來消除系統(tǒng)誤差,校正因子可以由所有差值的平均值來表示。這也在一定程度上證明了本文建立的定量預(yù)測模型在中藥化學(xué)成分作用靶點及活性預(yù)測方面的適用性。結(jié)論:本文首次提出了從分子振動的角度篩選化合物的分子描述符。成功建立了藥物與靶點相互作用關(guān)系的定量預(yù)測模型。通過回歸模型評價指標確定了隨機森林算法構(gòu)建的藥物靶點定量預(yù)測模型為最優(yōu)預(yù)測模型即模型具有更好的預(yù)測性能,支持向量機算法構(gòu)建的藥物靶點定量預(yù)測模型可能存在過擬合,人工神經(jīng)網(wǎng)絡(luò)算法構(gòu)建的藥物靶點定量預(yù)測模型可能存在欠擬合。通過比較,本文建立的最優(yōu)模型的預(yù)測性能及適用范圍均優(yōu)于文獻已經(jīng)報道的最優(yōu)模型。最終,在最優(yōu)模型的基礎(chǔ)上,對Binding DB數(shù)據(jù)庫中的部分中藥化學(xué)成分與靶點相互作用關(guān)系進行了定量預(yù)測,結(jié)果表明本文構(gòu)建的藥物與靶點相互作用關(guān)系定量預(yù)測模型在中藥化學(xué)成分作用靶點及活性預(yù)測中的適用性,證明了從分子振動角度確定化合物描述符的客觀性。
【圖文】:

數(shù)據(jù)集,類型,信息,受體


圖2-1藥物靶點相互作用關(guān)系數(shù)據(jù)集的類型及信息逡逑數(shù)化表征逡逑靶點是指藥物與機體生物大分子結(jié)合的部位,涉及受體、酶、系統(tǒng)、基因等。靶點的參數(shù)化表征是構(gòu)建模型的關(guān)鍵步驟。目用關(guān)系(Drug-TargetInteractions,DTIs)預(yù)測的方法主要包括兩基于受體的方法n6]。在基于配體的方法中,例如定量構(gòu)效關(guān)系搜索的方法[17]均是利用配體化學(xué)結(jié)構(gòu)的相似性來預(yù)測DTIs,沒。逡逑,基于受體的方法,例如反向分子對接,基于力場或評分函數(shù)評力的大。郏保福荩,這兩個參數(shù)通常被用來預(yù)測配體分子(通常是一

方法,度量標準,活性預(yù)測,準確性


邐基于分子振動特征的藥物靶點識別及活性預(yù)測模型研究邐逡逑在處理高維數(shù)據(jù)時,采用一種技術(shù)性方法處理大量數(shù)據(jù)會降低算法速度,占用太多資源,逡逑并且非常不方便,進行特征選擇可以提高算法的準確性t38,%。特征數(shù)量過多時,許多機逡逑器學(xué)習(xí)算法的準確性將受到很大影響[4叱因此,進行模型的構(gòu)建時必須進行特征篩選以逡逑達到降維、增強模型的泛化能力、避免過擬合的目的,但前提是必須保證不丟失重要的逡逑特征。主要包括基于排序的過濾方法和基于評估的包裹方法。逡逑基于排序的過濾(Filter)方法的基本思想是基于某一種度量標準,為每一個屬性特逡逑征的重要性打分,按照打分值進行排序,最后選取排名靠前的特征,具體過程如圖2-2逡逑所不。常用的度量標準有很多,如相關(guān)性(PearsonCorrelation),信息X椧媯ǎ桑睿媯錚潁恚幔簦椋錚鑠義希牽幔椋,邋I咯邋`P簇藎鲆媛剩ǎ牽幔椋睿遙幔簦椋錚澹牽遙╁澹郟矗玻藎ǚ劍ǎ茫瑁椋櫻瘢酰幔潁澹茫齲桑╁澹郟矗常藎疲椋螅瑁澹蟈澹櫻悖錚潁澹咤義系。辶x希疲澹幔簦酰潁邋澹歟椋螅翦危遙幔睿耄椋睿玨澹歟椋螅翦危疲澹幔簦酰潁邋澹螅酰猓歟椋螅翦義

本文編號:2689777

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/zhongyaolw/2689777.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶be73e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日本午夜免费观看视频| 久久国产人妻一区二区免费| 不卡中文字幕在线视频| 在线中文字幕亚洲欧美一区| 亚洲精品中文字幕一二三| 色哟哟国产精品免费视频| 不卡一区二区在线视频| 亚洲男女性生活免费视频| 中文字幕无线码一区欧美| 午夜精品国产一区在线观看| 午夜福利大片亚洲一区| 亚洲二区欧美一区二区 | 日本黄色美女日本黄色| 欧美日韩欧美国产另类| 国产精品国三级国产专不卡| 一级欧美一级欧美在线播| 高潮少妇高潮久久精品99| 欧美一级黄片欧美精品| 亚洲内射人妻一区二区| 欧美极品欧美精品欧美| 精品国产成人av一区二区三区| 97人摸人人澡人人人超碰| 欧美韩日在线观看一区| 亚洲中文字幕剧情在线播放| 成年女人午夜在线视频| 久久精视频免费视频观看| 国产精品内射婷婷一级二级| 婷婷一区二区三区四区| 老司机激情五月天在线不卡| 亚洲一区二区三区福利视频| 日韩毛片视频免费观看| 中文字幕一区二区免费| 欧美一级特黄特色大色大片| 国产毛片对白精品看片| 91插插插外国一区二区| 精品亚洲av一区二区三区| 国产亚洲精品一二三区| 亚洲综合日韩精品欧美综合区| 亚洲女同一区二区另类| 少妇毛片一区二区三区| 亚洲视频在线观看你懂的|