基于集成分類器的化合物毒性預(yù)測(cè)研究
發(fā)布時(shí)間:2023-01-08 17:36
化合物的毒性和致突變性是制藥行業(yè)新藥數(shù)量下降的主要原因之一。目前對(duì)于此類問題研究人員采用了多種方法來評(píng)估該風(fēng)險(xiǎn),包括體內(nèi)、體外和計(jì)算機(jī)模擬等方法。研究發(fā)現(xiàn),定量結(jié)構(gòu)-活性關(guān)系(QSAR)等計(jì)算方法在藥物發(fā)現(xiàn)早期階段的安全篩查中,具有出結(jié)果快、不需要藥物實(shí)驗(yàn)的優(yōu)點(diǎn)。然而大多數(shù)已發(fā)表的人類藥物性肝損傷(DILI)和化合物致突變模型的預(yù)測(cè)性能并不令人滿意,準(zhǔn)確度還有待提高。此外,人類DILI和細(xì)菌反向突變?cè)囼?yàn)(Ames試驗(yàn))等有限的可靠數(shù)據(jù)也是計(jì)算建模的一個(gè)巨大障礙。本文主要從化合物的毒性和致突變性兩個(gè)方面開展相關(guān)研究:1、提出一種基于集成分類器方法的藥物性肝損傷預(yù)測(cè)。新藥的開發(fā)受到多重因素的限制,即使很多藥物能夠到臨床試驗(yàn)這一步,依然會(huì)因?yàn)樗幬镄愿螕p傷等因素造成藥物研發(fā)失敗。美國(guó)食品和藥物管理局的國(guó)家毒理學(xué)研究中心(NCTR)建立了關(guān)于藥物性肝損傷(DILI)的數(shù)據(jù)集,并根據(jù)該數(shù)據(jù)集建立一個(gè)良好的預(yù)測(cè)模型,為以后的藥物開發(fā)提供參考。但是該模型是依據(jù)單一分類器模型進(jìn)行預(yù)測(cè)的,預(yù)測(cè)的準(zhǔn)確率很低。本文根據(jù)NCTR公開發(fā)表的數(shù)據(jù)集進(jìn)行基于多基集成分類器的方法進(jìn)行建模,從12個(gè)指紋圖譜篩選出8個(gè)對(duì)于...
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文組織結(jié)構(gòu)安排
第二章 機(jī)器學(xué)習(xí)相關(guān)理論概述
2.1 機(jī)器學(xué)習(xí)概述
2.2 基分類器概述
2.2.1 邏輯回歸(LR)
2.2.2 支持向量機(jī)(SVM)
2.2.3 隨機(jī)森林(RF)
2.2.4 梯度提升(GBDT)
2.2.5 Adaboost(AdaBT)
2.2.6 Xgboost(XGBT)
2.2.7 Extremely randomized trees(Extra Trees)
2.2.8 Lightgbm(LGBT)
2.2.9 Catboost(CatBT)
2.3 集成學(xué)習(xí)框架
2.4 本章小結(jié)
第三章 基于集成分類器方法的藥物性肝損傷預(yù)測(cè)研究
3.1 簡(jiǎn)介
3.2 材料與方法
3.2.1 材料準(zhǔn)備
3.2.2 分子指紋的計(jì)算
3.3 構(gòu)建模型
3.3.1 基分類器
3.3.2 Voting算法
3.3.3 集成模型
3.4 性能評(píng)估
3.5 實(shí)驗(yàn)結(jié)果與討論
3.5.1 結(jié)果
3.5.2 討論
3.6 本章小結(jié)
第四章 基于集成分類器方法的化合物致突變預(yù)測(cè)研究
4.1 簡(jiǎn)介
4.2 材料與方法
4.2.1 材料準(zhǔn)備
4.2.2 分子指紋的計(jì)算
4.2.3 特征選擇
4.3 構(gòu)建模型
4.3.1 基分類器
4.3.2 Stacking集成算法
4.3.3 集成模型
4.4 性能評(píng)估
4.5 實(shí)驗(yàn)結(jié)果與討論
4.5.1 結(jié)果
4.5.2 討論
4.6 本章小結(jié)
結(jié)論
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號(hào):3728899
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文組織結(jié)構(gòu)安排
第二章 機(jī)器學(xué)習(xí)相關(guān)理論概述
2.1 機(jī)器學(xué)習(xí)概述
2.2 基分類器概述
2.2.1 邏輯回歸(LR)
2.2.2 支持向量機(jī)(SVM)
2.2.3 隨機(jī)森林(RF)
2.2.4 梯度提升(GBDT)
2.2.5 Adaboost(AdaBT)
2.2.6 Xgboost(XGBT)
2.2.7 Extremely randomized trees(Extra Trees)
2.2.8 Lightgbm(LGBT)
2.2.9 Catboost(CatBT)
2.3 集成學(xué)習(xí)框架
2.4 本章小結(jié)
第三章 基于集成分類器方法的藥物性肝損傷預(yù)測(cè)研究
3.1 簡(jiǎn)介
3.2 材料與方法
3.2.1 材料準(zhǔn)備
3.2.2 分子指紋的計(jì)算
3.3 構(gòu)建模型
3.3.1 基分類器
3.3.2 Voting算法
3.3.3 集成模型
3.4 性能評(píng)估
3.5 實(shí)驗(yàn)結(jié)果與討論
3.5.1 結(jié)果
3.5.2 討論
3.6 本章小結(jié)
第四章 基于集成分類器方法的化合物致突變預(yù)測(cè)研究
4.1 簡(jiǎn)介
4.2 材料與方法
4.2.1 材料準(zhǔn)備
4.2.2 分子指紋的計(jì)算
4.2.3 特征選擇
4.3 構(gòu)建模型
4.3.1 基分類器
4.3.2 Stacking集成算法
4.3.3 集成模型
4.4 性能評(píng)估
4.5 實(shí)驗(yàn)結(jié)果與討論
4.5.1 結(jié)果
4.5.2 討論
4.6 本章小結(jié)
結(jié)論
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號(hào):3728899
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/3728899.html
最近更新
教材專著