基于生物網(wǎng)絡(luò)特征和藥物基因組學(xué)特征的抗癌協(xié)同組合藥物預(yù)測方法研究
本文選題:抗癌協(xié)同組合藥物 + 藥物靶點(diǎn)網(wǎng)絡(luò)特征 ; 參考:《上海海洋大學(xué)》2017年碩士論文
【摘要】:復(fù)雜疾病如癌癥等往往是由多基因異常引起的系統(tǒng)性疾病,基因突變、拷貝數(shù)變異以及基因表達(dá)失衡等均可能成為腫瘤發(fā)生的原因或表現(xiàn)。傳統(tǒng)的“一藥一靶”藥物研發(fā)策略已經(jīng)被證明存在一定的缺陷,比如容易產(chǎn)生耐藥性和毒副作用等。此外生物系統(tǒng)的魯棒性使得單一藥物很難完全抑制腫瘤細(xì)胞的生長。腫瘤的化學(xué)治療要求藥物可以作用于多個靶點(diǎn)和多條信號通路,并從多個靶點(diǎn)和通路上阻止疾病相關(guān)信號的發(fā)生、傳導(dǎo)和作用。組合藥物療法是多靶點(diǎn)治療中最常使用的一種療法,其具有毒性低、效率高等優(yōu)點(diǎn)。因此建立協(xié)同組合藥物篩選的方法具有重要意義。篩選協(xié)同組合藥物的傳統(tǒng)方法是實(shí)驗(yàn)篩選法,然而實(shí)驗(yàn)篩選法往往成本很高且效率低下,只能發(fā)現(xiàn)少量具有協(xié)同作用的藥物組合,而基于計算機(jī)模擬的方法對協(xié)同藥物進(jìn)行篩選具有通量大、效率高、成本低和污染少等優(yōu)點(diǎn)。隨著多組學(xué)數(shù)據(jù)的大量積累和生物信息學(xué)技術(shù)的不斷發(fā)展,使用計算機(jī)模擬的方法有望代替實(shí)驗(yàn)篩選法進(jìn)行協(xié)同藥物篩選。因此對于腫瘤研究人員來說,建立一種有效的預(yù)測抗癌協(xié)同藥物的計算模型將會具有重要意義。近年來,基于計算模型預(yù)測協(xié)同藥物的研究發(fā)展迅速。根據(jù)構(gòu)建預(yù)測模型時使用機(jī)器學(xué)習(xí)算法的不同,可將這些模型分為無監(jiān)督學(xué)習(xí)預(yù)測模型、半監(jiān)督學(xué)習(xí)預(yù)測模型和監(jiān)督學(xué)習(xí)預(yù)測模型。其中監(jiān)督學(xué)習(xí)預(yù)測模型中較常使用的是隨機(jī)森林算法(Random Forest)。基于隨機(jī)森林算法的模型需要適量的有標(biāo)記樣本做訓(xùn)練集數(shù)據(jù),然后進(jìn)行特征設(shè)計,再對有標(biāo)記樣本進(jìn)行特征值打分。這些預(yù)測模型的核心是所設(shè)計的特征。這些特征往往是基于藥物表型數(shù)據(jù)設(shè)計的,如藥物靶點(diǎn)、化學(xué)結(jié)構(gòu)等。盡管這些特征也是藥物的重要特征,但是這些特征并不能全面地反映藥物的藥理學(xué)特性。藥物基因組學(xué)數(shù)據(jù)(藥物處理細(xì)胞系后的表達(dá)譜數(shù)據(jù))可以精確地反映藥物對細(xì)胞系的擾動情況,能夠從一定程度上反映藥物的藥理學(xué)特性。因此特征設(shè)計時,需要綜合考慮藥物表型特征和藥物基因組學(xué)特征。本研究以DREAM Challenge 7 sub-challenge 2中已知的協(xié)同藥物組合、疊加藥物組合和拮抗藥物組合為基礎(chǔ),結(jié)合相應(yīng)的藥物表型數(shù)據(jù)和藥物處理細(xì)胞系后的基因表達(dá)譜數(shù)據(jù),設(shè)計和分析了21個組合藥物的特征(包括藥物表型特征和藥物基因組學(xué)特征)。通過使用隨機(jī)森林算法進(jìn)行特征篩選、模型構(gòu)建,得到了最優(yōu)預(yù)測模型。然后我們篩選出Connectivity Map數(shù)據(jù)庫中美國食品與藥品監(jiān)察管理局(U.S.FDA)已批準(zhǔn)的抗癌藥物。并將這些藥物表型數(shù)據(jù)及其相應(yīng)的基因表達(dá)譜數(shù)據(jù)作為測試集數(shù)據(jù),應(yīng)用到最優(yōu)預(yù)測模型中預(yù)測協(xié)同組合藥物并評估模型的預(yù)測效果。我們構(gòu)建的最優(yōu)預(yù)測模型在訓(xùn)練集數(shù)據(jù)上分類錯誤率(Out-of-bag estimate error rate)為0.15,曲線下面積(Area Under Curve)為0.89。Connectivity Map中符合要求的藥物共組成187對抗癌藥物組合。我們的最優(yōu)預(yù)測模型(SyDRa)預(yù)測出這187對藥物組合中有28對為潛在協(xié)同組合藥物。通過公共數(shù)據(jù)庫進(jìn)行文獻(xiàn)檢索,我們發(fā)現(xiàn)其中有3對藥物組合已經(jīng)被報道為有效的藥物組合,即:azacitidine和thalidomide,imatinib和paclitaxel,streptozocin和carmustine。可見SyDRa具有較好的預(yù)測能力。綜上所述,本研究分析和篩選了與協(xié)同組合藥物預(yù)測有關(guān)的重要特征,其中包括藥物表型數(shù)據(jù)特征和藥物基因組學(xué)數(shù)據(jù)特征。同時構(gòu)建了一個基于監(jiān)督學(xué)習(xí)算法的協(xié)同組合藥物預(yù)測模型,該模型可為大規(guī)模協(xié)同藥物組合的初篩提供參考。
[Abstract]:Complex diseases such as cancer, such as cancer, are often systemic diseases caused by polygenic abnormalities. Gene mutation, copy number variation, and gene expression imbalance may be the causes or manifestations of cancer. The traditional "one drug target" drug development strategy has been proved to have some defects, such as susceptibility to drug resistance and toxic side effects. In addition, the robustness of the biological system makes it difficult for a single drug to completely inhibit the growth of tumor cells. Chemical therapy for cancer requires drugs to act on multiple targets and multiple signaling pathways, and to prevent the occurrence, transmission and action of disease related signals from multiple targets and pathways. Combined drug therapy is the most targeted therapy. A commonly used therapy has the advantages of low toxicity and high efficiency. Therefore, it is of great significance to establish a collaborative combination drug screening method. The traditional method of screening synergistic combination drugs is experimental screening. However, the experimental screening method is often costly and inefficient, and only a small amount of synergistic drug combinations can be found. The computer simulation method has the advantages of large flux, high efficiency, low cost and less pollution. With the accumulation of multi - component data and the continuous development of bioinformatics technology, the computer simulation method is expected to replace the experimental screening method for collaborative drug screening. It will be of great significance to establish an effective model for predicting anticancer synergistic drugs. In recent years, the research of collaborative drugs based on computational models has developed rapidly. According to the difference of machine learning algorithms used in building prediction models, these models can be divided into unsupervised learning prediction models and semi supervised learning prediction models. Model and supervised learning prediction model. The more often used in the supervised learning prediction model is the random forest algorithm (Random Forest). The model based on the random forest algorithm requires a proper number of labeled samples to do the training set data, then the feature design, and then the marked Yang Benjin line characteristic value score. The core of these prediction models is the These characteristics are often designed based on drug phenotypic data, such as drug targets, chemical structures, etc. Although these characteristics are also important characteristics of the drug, these characteristics do not fully reflect the pharmacological properties of drugs. Pharmacogenomics data (the expression profiles after the drug processing cell lines) can be accurately measured. Reflecting the disturbance of the drug on the cell line, it can reflect the pharmacological properties of the drug to a certain extent. Therefore, when the characteristics are designed, the drug phenotypes and pharmacogenomics features need to be taken into consideration. This study uses the known synergistic drug combinations in DREAM Challenge 7 sub-challenge 2, superimposed drug combinations and antagonistic combinations of drugs The characteristics of the 21 combined drugs (including drug phenotypes and pharmacogenomics) were designed and analyzed on the basis of the corresponding drug phenotypic data and the gene expression profiles after the treatment of the cell lines. The optimal prediction model was obtained by using the random forest algorithm for feature selection and model construction. Then we screened the model. The anti cancer drugs approved by the US Food and Drug Administration (U.S.FDA) in the Connectivity Map database and the data of the phenotypic data of these drugs and their corresponding gene expression profiles are used as test set data to predict the synergistic combination drugs in the optimal prediction model and evaluate the prediction effect of the model. The classification error rate (Out-of-bag estimate error rate) on the training set is 0.15, and the area under the curve (Area Under Curve) constitutes a total of 187 pairs of anticancer drugs in 0.89.Connectivity Map. Our optimal prediction model (SyDRa) predicts that 28 pairs of these 187 pairs of drug combinations are potential synergistic combinations. Bibliographic retrieval through public databases, we found that 3 of these combinations have been reported as effective drug combinations, that is, azacitidine and thalidomide, imatinib and paclitaxel, streptozocin and carmustine. can be found to have good predictive ability. In summary, this study analyzed and screened synergistic drugs. The important features of the prediction are the characteristics of drug phenotypic data and pharmacogenomics data, and a collaborative combined drug prediction model based on supervised learning algorithm is constructed, which can provide reference for the screening of large-scale synergistic drug combination.
【學(xué)位授予單位】:上海海洋大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:R96
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張志勇,潘小鷗,陳兵;藥物基因組學(xué)與藥物開發(fā)[J];華西醫(yī)學(xué);2000年03期
2 孫樂非,馬登科;藥物基因組學(xué)簡介[J];生物化學(xué)與生物物理進(jìn)展;2001年05期
3 ;藥物基因組學(xué)和藥物基因組計劃[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2001年06期
4 張驍,束梅英,張韜;藥物基因組學(xué)的應(yīng)用及其市場前景[J];中國藥房;2001年05期
5 莫惠平;淺談藥物基因組學(xué)的研究及應(yīng)用[J];中國藥業(yè);2002年01期
6 方福德;藥物基因組學(xué)(pharmacogenomics)[J];中華預(yù)防醫(yī)學(xué)雜志;2003年03期
7 楊繼章,楊樹民;藥物基因組學(xué)與新藥開發(fā)[J];上海醫(yī)藥;2003年08期
8 屈會起,楊秀穎,林珊;藥物基因組學(xué)與循證醫(yī)學(xué)[J];循證醫(yī)學(xué);2003年01期
9 汪桂清;藥物基因組學(xué)的研究與應(yīng)用[J];藥物流行病學(xué)雜志;2004年01期
10 謝軼,余柏松,賈文祥;藥物基因組學(xué)與新藥開發(fā)[J];國外醫(yī)藥(抗生素分冊);2004年03期
相關(guān)會議論文 前10條
1 祁鳴;;藥物基因組學(xué)及其應(yīng)用[A];第七屆中國生物產(chǎn)業(yè)大會·2013基因組學(xué)與創(chuàng)新型藥物研制高峰論壇會刊[C];2013年
2 婁建石;;藥物基因組學(xué)[A];中國藥理學(xué)會數(shù)學(xué)藥理專業(yè)委員會2010年度理事會暨第四屆全國定量藥理研究方法學(xué)研討會論文集[C];2010年
3 潘繼紅;韓金祥;李鳳琴;高雪芹;;腫瘤藥物基因組學(xué)[A];第四屆中國腫瘤大會中國藥理學(xué)會腫瘤藥理專業(yè)委員會分會場學(xué)術(shù)會議論文摘要[C];2006年
4 劉昭前;;藥物基因組學(xué)和個體化醫(yī)學(xué)[A];中南地區(qū)第八屆生理學(xué)學(xué)術(shù)大會論文摘要匯編[C];2012年
5 劉勝男;趙志剛;;心血管藥物基因組學(xué)的研究進(jìn)展[A];第二屆全國治療藥物監(jiān)測學(xué)術(shù)年會會議指南[C];2012年
6 周帆;辛華雯;;藥物基因組學(xué)與個體化治療[A];第十三次全國臨床藥理學(xué)學(xué)術(shù)大會論文匯編[C];2012年
7 周鵬;孫淵;杜有功;;藥物基因組學(xué)與循證藥學(xué)[A];新醫(yī)藥衛(wèi)生改革與藥學(xué)發(fā)展高峰論壇暨《中國藥學(xué)雜志》第十二屆編委會會議論文集[C];2009年
8 王憲剛;馬大衛(wèi);王新民;;呼吸內(nèi)科常用藥物的基因組學(xué)[A];四川省藥學(xué)會第七次全省會員代表大會暨學(xué)術(shù)年會論文集[C];2011年
9 李翠蘭;胡大一;;藥物基因組學(xué)與女性心血管病健康[A];中華醫(yī)學(xué)會第十三次全國心血管病學(xué)術(shù)會議專題報告專輯[C];2011年
10 梁鳳英;房霞;;藥物基因組學(xué)與臨床合理用藥[A];山東省藥學(xué)會第一屆學(xué)術(shù)年會論文集(上)[C];2005年
相關(guān)重要報紙文章 前10條
1 本報特約撰稿人 陸志城;藥物基因組學(xué)數(shù)據(jù)呈報指南[N];醫(yī)藥經(jīng)濟(jì)報;2003年
2 記者 黃每裕;藥物基因組學(xué)嶄露頭角[N];健康報;2000年
3 束梅英;藥物基因組學(xué)及應(yīng)用前景[N];中國醫(yī)藥報;2001年
4 韓寶惠;藥物基因組學(xué)與肺癌個體化治療[N];健康報;2007年
5 北京軍區(qū)總醫(yī)院臨床藥物研究所主任 許景峰;藥物基因組學(xué)研究強(qiáng)調(diào)臨床應(yīng)用[N];健康報;2008年
6 鑫國;藥物基因組學(xué):“重磅炸彈”藥物的克星[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2001年
7 ;藥物基因組學(xué)的應(yīng)用及其市場前景[N];醫(yī)藥經(jīng)濟(jì)報;2000年
8 陸志城;藥物基因組學(xué)常見問題解答[N];醫(yī)藥經(jīng)濟(jì)報;2001年
9 軍事醫(yī)學(xué)科學(xué)院 張迎輝;藥物基因組學(xué)蘊(yùn)含無限商機(jī)[N];醫(yī)藥經(jīng)濟(jì)報;2001年
10 鐘義琴;神奇的“藥物基因組學(xué)”[N];江蘇經(jīng)濟(jì)報;2003年
相關(guān)博士學(xué)位論文 前3條
1 魏之昀;利培酮的藥物基因組學(xué)和高血壓的分子遺傳學(xué)[D];上海交通大學(xué);2012年
2 祖麗皮亞·玉努斯;中國新疆四個少數(shù)民族藥物基因組學(xué)相關(guān)基因VIP位點(diǎn)遺傳差異研究[D];西北大學(xué);2013年
3 王磊;抗精神分裂癥藥物利培酮的藥物基因組學(xué)和高血壓的遺傳學(xué)研究[D];上海交通大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 李相宜;基于生物網(wǎng)絡(luò)特征和藥物基因組學(xué)特征的抗癌協(xié)同組合藥物預(yù)測方法研究[D];上海海洋大學(xué);2017年
2 夏瓊瓊;高職高專醫(yī)學(xué)生對藥物基因組學(xué)知識知曉現(xiàn)況及需求分析[D];中南大學(xué);2013年
3 李曉琪;適合中國人群抗凝治療的華法林藥物基因組學(xué)劑量預(yù)測模型建立和臨床應(yīng)用研究[D];中國人民解放軍醫(yī)學(xué)院;2015年
4 呂文文;轉(zhuǎn)錄組學(xué)和藥物基因組學(xué)在人類復(fù)雜疾病研究中的應(yīng)用[D];安徽大學(xué);2016年
5 趙志婷;藥物基因組學(xué)的臨床倫理問題探究[D];山西大學(xué);2007年
6 邢一;UGT1A6基因在中國不同人群中的藥物基因組學(xué)研究[D];上海交通大學(xué);2009年
7 蔣生珍;山區(qū)公路彎坡組合路段行車特性分析[D];重慶交通大學(xué);2017年
8 曹永明;組合圓環(huán)抗震耗能支撐體系及設(shè)計方法[D];濟(jì)南大學(xué);2016年
9 謝威;基于車路耦合安全度模型的彎坡組合路段設(shè)計理論研究[D];重慶交通大學(xué);2017年
10 陳澤;高速公路長大隧道與連續(xù)上下坡組合路段安全保障技術(shù)研究[D];長安大學(xué);2017年
,本文編號:1905902
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/1905902.html