基于機器學習的虛擬篩選效率對比研究
發(fā)布時間:2020-03-21 10:18
【摘要】:藥物設(shè)計是一個耗時且昂貴的過程,提高藥物的篩選效率能夠為藥物設(shè)計提供早期的小分子篩選作用,具有重要科學價值。鑒于藥物設(shè)計中的巨大搜索空間,隨著人工智能技術(shù)的發(fā)展,機器學習已經(jīng)成為預(yù)測小分子藥物與靶向蛋白質(zhì)之間親和力的有效方法。然而,各種機器學習算法包括大量的參數(shù)和各種各樣的模型,使得預(yù)測框架的選擇非常困難。在這項工作中,本文探究了針對不同機器學習算法的參數(shù)優(yōu)化來進行虛擬篩選,傳統(tǒng)的機器學習算法以決策樹為例,選擇了XGBoost框架和LightGBM框架;深度學習算法則構(gòu)建了多層感知器和卷積神經(jīng)網(wǎng)絡(luò)模型。在參數(shù)優(yōu)化之后,對決策樹算法和深度學習算法的RMSE值和R2值進行了比較與評估,對于本次實驗所得到的結(jié)果是在虛擬篩選方面決策樹比神經(jīng)網(wǎng)絡(luò)更有效。這是因為在具有約160000個樣本的特定藥物篩選問題的親和力預(yù)測中,深度學習算法可能比決策樹算法更容易過擬合。最后,可以得到先進的機器學習方法可以提取比傳統(tǒng)的虛擬篩選方法更準確的蛋白質(zhì)-小分子結(jié)合信息,提高藥物設(shè)計的篩選效率可達200~1000倍。
【圖文】:
邐’逡逑劃分子節(jié)點,所測試的實例在每處節(jié)點與該節(jié)點的屬性進行比較,根據(jù)比較結(jié)果進行相逡逑應(yīng)子節(jié)點的選擇,重復(fù)該過程直到最終結(jié)論。如圖2-1所示是一個決策樹,其中X,邋Y,逡逑Z表示屬性名稱,,x,邋y,邋z分別表示X,Y,邋Z的不同取值,如果一個實例的屬性X,邋Y逡逑的取值分別為xl,邋y2,那么該實例則是第2類,其它屬性以此類推。在決策樹構(gòu)建的過逡逑程中很容易產(chǎn)生過擬合,為了防止過擬合的產(chǎn)生,一般會設(shè)定停止閾值,當信息熵或信逡逑息增益低于該閾值時,會停止創(chuàng)建分支,這種減小過擬合的方法叫做剪枝。逡逑: 」L__j逡逑,\逡逑yl/邋'邋y2邐zl邐z2逡逑O邐::)邐0邐3逡逑圖2-1決策樹模型逡逑7逡逑
在輸入層和輸出層之間添加了隱藏層,通常使用反向傳播(Backpropagation邋)算法[ ̄]進逡逑行訓練,這樣解決了感知器無法處理線性不可分的問題。MLP是一種前向人工神經(jīng)網(wǎng)絡(luò),逡逑也叫做全連接神經(jīng)網(wǎng)絡(luò),如圖2-2所示。逡逑;::v0逡逑輸入層邋隱藏層邋輸出層逡逑圖2-2多層感知器逡逑MLP包含三種節(jié)點,輸入節(jié)點:或叫做輸入層,是用來輸入數(shù)據(jù)的節(jié)點,在此節(jié)點處逡逑11逡逑
【學位授予單位】:中央民族大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:R91;TP181
【圖文】:
邐’逡逑劃分子節(jié)點,所測試的實例在每處節(jié)點與該節(jié)點的屬性進行比較,根據(jù)比較結(jié)果進行相逡逑應(yīng)子節(jié)點的選擇,重復(fù)該過程直到最終結(jié)論。如圖2-1所示是一個決策樹,其中X,邋Y,逡逑Z表示屬性名稱,,x,邋y,邋z分別表示X,Y,邋Z的不同取值,如果一個實例的屬性X,邋Y逡逑的取值分別為xl,邋y2,那么該實例則是第2類,其它屬性以此類推。在決策樹構(gòu)建的過逡逑程中很容易產(chǎn)生過擬合,為了防止過擬合的產(chǎn)生,一般會設(shè)定停止閾值,當信息熵或信逡逑息增益低于該閾值時,會停止創(chuàng)建分支,這種減小過擬合的方法叫做剪枝。逡逑: 」L__j逡逑,\逡逑yl/邋'邋y2邐zl邐z2逡逑O邐::)邐0邐3逡逑圖2-1決策樹模型逡逑7逡逑
在輸入層和輸出層之間添加了隱藏層,通常使用反向傳播(Backpropagation邋)算法[ ̄]進逡逑行訓練,這樣解決了感知器無法處理線性不可分的問題。MLP是一種前向人工神經(jīng)網(wǎng)絡(luò),逡逑也叫做全連接神經(jīng)網(wǎng)絡(luò),如圖2-2所示。逡逑;::v0逡逑輸入層邋隱藏層邋輸出層逡逑圖2-2多層感知器逡逑MLP包含三種節(jié)點,輸入節(jié)點:或叫做輸入層,是用來輸入數(shù)據(jù)的節(jié)點,在此節(jié)點處逡逑11逡逑
【學位授予單位】:中央民族大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:R91;TP181
【相似文獻】
相關(guān)期刊論文 前10條
1 張媛;劉雨桐;李達;宋新蕊;周雪松;趙勇;;反向虛擬篩選平臺及應(yīng)用[J];生物信息學;2015年04期
2 李悅青;黃雅俊;趙偉杰;王希誠;;氮雜
本文編號:2593188
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/2593188.html
最近更新
教材專著