3D卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)優(yōu)化及中樞神經(jīng)系統(tǒng)藥物的識別
發(fā)布時(shí)間:2021-04-03 00:13
該文研究了如何利用3D-CNN識別中樞神經(jīng)系統(tǒng)(CNS)藥物和non-CNS藥物。首先,構(gòu)建CNS藥物和non-CNS藥物數(shù)據(jù)集并優(yōu)化小分子構(gòu)象;然后,以3D網(wǎng)格矩陣編碼小分子結(jié)構(gòu),作為3D-CNN模型的輸入;接著,在模型訓(xùn)練中,采用正交實(shí)驗(yàn)法對3D-CNN模型的超參數(shù)進(jìn)行快速優(yōu)化;最后,使用外部測試集檢驗(yàn)?zāi)P?達(dá)到ACC為84. 3%,MCC為0. 685,AUC為0. 884的泛化性能。實(shí)驗(yàn)表明,在正交實(shí)驗(yàn)法獲取可靠超參數(shù)組合的基礎(chǔ)上,3D-CNN模型對于CNS藥物的識別具有良好效果,所構(gòu)建的模型為設(shè)計(jì)新的CNS藥物提供了基礎(chǔ)。
【文章來源】:西北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020,50(01)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1 分子在3D網(wǎng)格中的示意圖
3D-CNN的多個(gè)超參數(shù)直接影響CNN的結(jié)構(gòu),本文根據(jù)正交實(shí)驗(yàn)進(jìn)行參數(shù)組合,比較每種組合下模型的交叉驗(yàn)證結(jié)果,從而構(gòu)建可靠的3D-CNN模型,模型結(jié)構(gòu)如圖2所示。表2和表3分別是在兩個(gè)和3個(gè)卷積層時(shí)的正交實(shí)驗(yàn)結(jié)果,其中,每個(gè)數(shù)值都是五折交叉驗(yàn)證的平均。使用3個(gè)卷積層時(shí),最佳參數(shù)是第6個(gè)超參數(shù)組合,即卷積核大小為5,卷積步長3,下采樣核大小及步長為2,初始卷積核個(gè)數(shù)為64,此時(shí)所有預(yù)測率都在80%以上,MCC和AUC分別為0.629,0.848。當(dāng)采用兩個(gè)卷積核時(shí),最佳參數(shù)是第7個(gè)超參數(shù)組合,即卷積核大小為7,卷積步長1,下采樣核大小及步長為4,初始卷積核個(gè)數(shù)為64,此時(shí)的SEN比3個(gè)卷積核時(shí)低0.5%,SPE基本不變,ACC,MCC,AUC也都略低于3個(gè)卷積核時(shí)的結(jié)果。然而,這兩種結(jié)果非常接近,而且參數(shù)組合相同時(shí),不同的卷積層數(shù)并沒有表現(xiàn)出明顯的結(jié)果差異,這與Simonyan[30]提到的兩個(gè)3*3卷積層與一個(gè)5*5卷積層的效果幾乎相同的情況一致,不同的卷積層數(shù)通過調(diào)整其他超參數(shù)也可以達(dá)到類似的效果。
為了驗(yàn)證上述的0.3Dropout是否增強(qiáng)了模型的魯棒性,將不使用Dropout和使用0.3Dropout的模型分別對獨(dú)立測試集進(jìn)行測試。從圖3中看到,使用0.3比例的Dropout層時(shí),模型對獨(dú)立測試集的泛化能力更好,SPE從81.5%上升到85.2%,ACC,MCC,AUC分別提升了1.9%,0.037,0.016。這表明,通過隨機(jī)丟棄全連接層30%的神經(jīng)元,增強(qiáng)了模型的健壯性,使模型在CNS藥物與non-CNS藥物的識別上具有更好的泛化能力。3 結(jié)語
本文編號:3116225
【文章來源】:西北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020,50(01)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1 分子在3D網(wǎng)格中的示意圖
3D-CNN的多個(gè)超參數(shù)直接影響CNN的結(jié)構(gòu),本文根據(jù)正交實(shí)驗(yàn)進(jìn)行參數(shù)組合,比較每種組合下模型的交叉驗(yàn)證結(jié)果,從而構(gòu)建可靠的3D-CNN模型,模型結(jié)構(gòu)如圖2所示。表2和表3分別是在兩個(gè)和3個(gè)卷積層時(shí)的正交實(shí)驗(yàn)結(jié)果,其中,每個(gè)數(shù)值都是五折交叉驗(yàn)證的平均。使用3個(gè)卷積層時(shí),最佳參數(shù)是第6個(gè)超參數(shù)組合,即卷積核大小為5,卷積步長3,下采樣核大小及步長為2,初始卷積核個(gè)數(shù)為64,此時(shí)所有預(yù)測率都在80%以上,MCC和AUC分別為0.629,0.848。當(dāng)采用兩個(gè)卷積核時(shí),最佳參數(shù)是第7個(gè)超參數(shù)組合,即卷積核大小為7,卷積步長1,下采樣核大小及步長為4,初始卷積核個(gè)數(shù)為64,此時(shí)的SEN比3個(gè)卷積核時(shí)低0.5%,SPE基本不變,ACC,MCC,AUC也都略低于3個(gè)卷積核時(shí)的結(jié)果。然而,這兩種結(jié)果非常接近,而且參數(shù)組合相同時(shí),不同的卷積層數(shù)并沒有表現(xiàn)出明顯的結(jié)果差異,這與Simonyan[30]提到的兩個(gè)3*3卷積層與一個(gè)5*5卷積層的效果幾乎相同的情況一致,不同的卷積層數(shù)通過調(diào)整其他超參數(shù)也可以達(dá)到類似的效果。
為了驗(yàn)證上述的0.3Dropout是否增強(qiáng)了模型的魯棒性,將不使用Dropout和使用0.3Dropout的模型分別對獨(dú)立測試集進(jìn)行測試。從圖3中看到,使用0.3比例的Dropout層時(shí),模型對獨(dú)立測試集的泛化能力更好,SPE從81.5%上升到85.2%,ACC,MCC,AUC分別提升了1.9%,0.037,0.016。這表明,通過隨機(jī)丟棄全連接層30%的神經(jīng)元,增強(qiáng)了模型的健壯性,使模型在CNS藥物與non-CNS藥物的識別上具有更好的泛化能力。3 結(jié)語
本文編號:3116225
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/3116225.html
最近更新
教材專著