基于生物網(wǎng)絡(luò)特征和藥物基因組學(xué)特征的抗癌協(xié)同組合藥物預(yù)測(cè)方法研究
本文選題:抗癌協(xié)同組合藥物 + 藥物靶點(diǎn)網(wǎng)絡(luò)特征; 參考:《上海海洋大學(xué)》2017年碩士論文
【摘要】:復(fù)雜疾病如癌癥等往往是由多基因異常引起的系統(tǒng)性疾病,基因突變、拷貝數(shù)變異以及基因表達(dá)失衡等均可能成為腫瘤發(fā)生的原因或表現(xiàn)。傳統(tǒng)的“一藥一靶”藥物研發(fā)策略已經(jīng)被證明存在一定的缺陷,比如容易產(chǎn)生耐藥性和毒副作用等。此外生物系統(tǒng)的魯棒性使得單一藥物很難完全抑制腫瘤細(xì)胞的生長(zhǎng)。腫瘤的化學(xué)治療要求藥物可以作用于多個(gè)靶點(diǎn)和多條信號(hào)通路,并從多個(gè)靶點(diǎn)和通路上阻止疾病相關(guān)信號(hào)的發(fā)生、傳導(dǎo)和作用。組合藥物療法是多靶點(diǎn)治療中最常使用的一種療法,其具有毒性低、效率高等優(yōu)點(diǎn)。因此建立協(xié)同組合藥物篩選的方法具有重要意義。篩選協(xié)同組合藥物的傳統(tǒng)方法是實(shí)驗(yàn)篩選法,然而實(shí)驗(yàn)篩選法往往成本很高且效率低下,只能發(fā)現(xiàn)少量具有協(xié)同作用的藥物組合,而基于計(jì)算機(jī)模擬的方法對(duì)協(xié)同藥物進(jìn)行篩選具有通量大、效率高、成本低和污染少等優(yōu)點(diǎn)。隨著多組學(xué)數(shù)據(jù)的大量積累和生物信息學(xué)技術(shù)的不斷發(fā)展,使用計(jì)算機(jī)模擬的方法有望代替實(shí)驗(yàn)篩選法進(jìn)行協(xié)同藥物篩選。因此對(duì)于腫瘤研究人員來(lái)說(shuō),建立一種有效的預(yù)測(cè)抗癌協(xié)同藥物的計(jì)算模型將會(huì)具有重要意義。近年來(lái),基于計(jì)算模型預(yù)測(cè)協(xié)同藥物的研究發(fā)展迅速。根據(jù)構(gòu)建預(yù)測(cè)模型時(shí)使用機(jī)器學(xué)習(xí)算法的不同,可將這些模型分為無(wú)監(jiān)督學(xué)習(xí)預(yù)測(cè)模型、半監(jiān)督學(xué)習(xí)預(yù)測(cè)模型和監(jiān)督學(xué)習(xí)預(yù)測(cè)模型。其中監(jiān)督學(xué)習(xí)預(yù)測(cè)模型中較常使用的是隨機(jī)森林算法(Random Forest);陔S機(jī)森林算法的模型需要適量的有標(biāo)記樣本做訓(xùn)練集數(shù)據(jù),然后進(jìn)行特征設(shè)計(jì),再對(duì)有標(biāo)記樣本進(jìn)行特征值打分。這些預(yù)測(cè)模型的核心是所設(shè)計(jì)的特征。這些特征往往是基于藥物表型數(shù)據(jù)設(shè)計(jì)的,如藥物靶點(diǎn)、化學(xué)結(jié)構(gòu)等。盡管這些特征也是藥物的重要特征,但是這些特征并不能全面地反映藥物的藥理學(xué)特性。藥物基因組學(xué)數(shù)據(jù)(藥物處理細(xì)胞系后的表達(dá)譜數(shù)據(jù))可以精確地反映藥物對(duì)細(xì)胞系的擾動(dòng)情況,能夠從一定程度上反映藥物的藥理學(xué)特性。因此特征設(shè)計(jì)時(shí),需要綜合考慮藥物表型特征和藥物基因組學(xué)特征。本研究以DREAM Challenge 7 sub-challenge 2中已知的協(xié)同藥物組合、疊加藥物組合和拮抗藥物組合為基礎(chǔ),結(jié)合相應(yīng)的藥物表型數(shù)據(jù)和藥物處理細(xì)胞系后的基因表達(dá)譜數(shù)據(jù),設(shè)計(jì)和分析了21個(gè)組合藥物的特征(包括藥物表型特征和藥物基因組學(xué)特征)。通過(guò)使用隨機(jī)森林算法進(jìn)行特征篩選、模型構(gòu)建,得到了最優(yōu)預(yù)測(cè)模型。然后我們篩選出Connectivity Map數(shù)據(jù)庫(kù)中美國(guó)食品與藥品監(jiān)察管理局(U.S.FDA)已批準(zhǔn)的抗癌藥物。并將這些藥物表型數(shù)據(jù)及其相應(yīng)的基因表達(dá)譜數(shù)據(jù)作為測(cè)試集數(shù)據(jù),應(yīng)用到最優(yōu)預(yù)測(cè)模型中預(yù)測(cè)協(xié)同組合藥物并評(píng)估模型的預(yù)測(cè)效果。我們構(gòu)建的最優(yōu)預(yù)測(cè)模型在訓(xùn)練集數(shù)據(jù)上分類(lèi)錯(cuò)誤率(Out-of-bag estimate error rate)為0.15,曲線(xiàn)下面積(Area Under Curve)為0.89。Connectivity Map中符合要求的藥物共組成187對(duì)抗癌藥物組合。我們的最優(yōu)預(yù)測(cè)模型(SyDRa)預(yù)測(cè)出這187對(duì)藥物組合中有28對(duì)為潛在協(xié)同組合藥物。通過(guò)公共數(shù)據(jù)庫(kù)進(jìn)行文獻(xiàn)檢索,我們發(fā)現(xiàn)其中有3對(duì)藥物組合已經(jīng)被報(bào)道為有效的藥物組合,即:azacitidine和thalidomide,imatinib和paclitaxel,streptozocin和carmustine。可見(jiàn)SyDRa具有較好的預(yù)測(cè)能力。綜上所述,本研究分析和篩選了與協(xié)同組合藥物預(yù)測(cè)有關(guān)的重要特征,其中包括藥物表型數(shù)據(jù)特征和藥物基因組學(xué)數(shù)據(jù)特征。同時(shí)構(gòu)建了一個(gè)基于監(jiān)督學(xué)習(xí)算法的協(xié)同組合藥物預(yù)測(cè)模型,該模型可為大規(guī)模協(xié)同藥物組合的初篩提供參考。
[Abstract]:Complex diseases such as cancer, such as cancer, are often systemic diseases caused by polygenic abnormalities. Gene mutation, copy number variation, and gene expression imbalance may be the causes or manifestations of cancer. The traditional "one drug target" drug development strategy has been proved to have some defects, such as susceptibility to drug resistance and toxic side effects. In addition, the robustness of the biological system makes it difficult for a single drug to completely inhibit the growth of tumor cells. Chemical therapy for cancer requires drugs to act on multiple targets and multiple signaling pathways, and to prevent the occurrence, transmission and action of disease related signals from multiple targets and pathways. Combined drug therapy is the most targeted therapy. A commonly used therapy has the advantages of low toxicity and high efficiency. Therefore, it is of great significance to establish a collaborative combination drug screening method. The traditional method of screening synergistic combination drugs is experimental screening. However, the experimental screening method is often costly and inefficient, and only a small amount of synergistic drug combinations can be found. The computer simulation method has the advantages of large flux, high efficiency, low cost and less pollution. With the accumulation of multi - component data and the continuous development of bioinformatics technology, the computer simulation method is expected to replace the experimental screening method for collaborative drug screening. It will be of great significance to establish an effective model for predicting anticancer synergistic drugs. In recent years, the research of collaborative drugs based on computational models has developed rapidly. According to the difference of machine learning algorithms used in building prediction models, these models can be divided into unsupervised learning prediction models and semi supervised learning prediction models. Model and supervised learning prediction model. The more often used in the supervised learning prediction model is the random forest algorithm (Random Forest). The model based on the random forest algorithm requires a proper number of labeled samples to do the training set data, then the feature design, and then the marked Yang Benjin line characteristic value score. The core of these prediction models is the These characteristics are often designed based on drug phenotypic data, such as drug targets, chemical structures, etc. Although these characteristics are also important characteristics of the drug, these characteristics do not fully reflect the pharmacological properties of drugs. Pharmacogenomics data (the expression profiles after the drug processing cell lines) can be accurately measured. Reflecting the disturbance of the drug on the cell line, it can reflect the pharmacological properties of the drug to a certain extent. Therefore, when the characteristics are designed, the drug phenotypes and pharmacogenomics features need to be taken into consideration. This study uses the known synergistic drug combinations in DREAM Challenge 7 sub-challenge 2, superimposed drug combinations and antagonistic combinations of drugs The characteristics of the 21 combined drugs (including drug phenotypes and pharmacogenomics) were designed and analyzed on the basis of the corresponding drug phenotypic data and the gene expression profiles after the treatment of the cell lines. The optimal prediction model was obtained by using the random forest algorithm for feature selection and model construction. Then we screened the model. The anti cancer drugs approved by the US Food and Drug Administration (U.S.FDA) in the Connectivity Map database and the data of the phenotypic data of these drugs and their corresponding gene expression profiles are used as test set data to predict the synergistic combination drugs in the optimal prediction model and evaluate the prediction effect of the model. The classification error rate (Out-of-bag estimate error rate) on the training set is 0.15, and the area under the curve (Area Under Curve) constitutes a total of 187 pairs of anticancer drugs in 0.89.Connectivity Map. Our optimal prediction model (SyDRa) predicts that 28 pairs of these 187 pairs of drug combinations are potential synergistic combinations. Bibliographic retrieval through public databases, we found that 3 of these combinations have been reported as effective drug combinations, that is, azacitidine and thalidomide, imatinib and paclitaxel, streptozocin and carmustine. can be found to have good predictive ability. In summary, this study analyzed and screened synergistic drugs. The important features of the prediction are the characteristics of drug phenotypic data and pharmacogenomics data, and a collaborative combined drug prediction model based on supervised learning algorithm is constructed, which can provide reference for the screening of large-scale synergistic drug combination.
【學(xué)位授予單位】:上海海洋大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:R96
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張志勇,潘小鷗,陳兵;藥物基因組學(xué)與藥物開(kāi)發(fā)[J];華西醫(yī)學(xué);2000年03期
2 孫樂(lè)非,馬登科;藥物基因組學(xué)簡(jiǎn)介[J];生物化學(xué)與生物物理進(jìn)展;2001年05期
3 ;藥物基因組學(xué)和藥物基因組計(jì)劃[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2001年06期
4 張驍,束梅英,張韜;藥物基因組學(xué)的應(yīng)用及其市場(chǎng)前景[J];中國(guó)藥房;2001年05期
5 莫惠平;淺談藥物基因組學(xué)的研究及應(yīng)用[J];中國(guó)藥業(yè);2002年01期
6 方福德;藥物基因組學(xué)(pharmacogenomics)[J];中華預(yù)防醫(yī)學(xué)雜志;2003年03期
7 楊繼章,楊樹(shù)民;藥物基因組學(xué)與新藥開(kāi)發(fā)[J];上海醫(yī)藥;2003年08期
8 屈會(huì)起,楊秀穎,林珊;藥物基因組學(xué)與循證醫(yī)學(xué)[J];循證醫(yī)學(xué);2003年01期
9 汪桂清;藥物基因組學(xué)的研究與應(yīng)用[J];藥物流行病學(xué)雜志;2004年01期
10 謝軼,余柏松,賈文祥;藥物基因組學(xué)與新藥開(kāi)發(fā)[J];國(guó)外醫(yī)藥(抗生素分冊(cè));2004年03期
相關(guān)會(huì)議論文 前10條
1 祁鳴;;藥物基因組學(xué)及其應(yīng)用[A];第七屆中國(guó)生物產(chǎn)業(yè)大會(huì)·2013基因組學(xué)與創(chuàng)新型藥物研制高峰論壇會(huì)刊[C];2013年
2 婁建石;;藥物基因組學(xué)[A];中國(guó)藥理學(xué)會(huì)數(shù)學(xué)藥理專(zhuān)業(yè)委員會(huì)2010年度理事會(huì)暨第四屆全國(guó)定量藥理研究方法學(xué)研討會(huì)論文集[C];2010年
3 潘繼紅;韓金祥;李鳳琴;高雪芹;;腫瘤藥物基因組學(xué)[A];第四屆中國(guó)腫瘤大會(huì)中國(guó)藥理學(xué)會(huì)腫瘤藥理專(zhuān)業(yè)委員會(huì)分會(huì)場(chǎng)學(xué)術(shù)會(huì)議論文摘要[C];2006年
4 劉昭前;;藥物基因組學(xué)和個(gè)體化醫(yī)學(xué)[A];中南地區(qū)第八屆生理學(xué)學(xué)術(shù)大會(huì)論文摘要匯編[C];2012年
5 劉勝男;趙志剛;;心血管藥物基因組學(xué)的研究進(jìn)展[A];第二屆全國(guó)治療藥物監(jiān)測(cè)學(xué)術(shù)年會(huì)會(huì)議指南[C];2012年
6 周帆;辛華雯;;藥物基因組學(xué)與個(gè)體化治療[A];第十三次全國(guó)臨床藥理學(xué)學(xué)術(shù)大會(huì)論文匯編[C];2012年
7 周鵬;孫淵;杜有功;;藥物基因組學(xué)與循證藥學(xué)[A];新醫(yī)藥衛(wèi)生改革與藥學(xué)發(fā)展高峰論壇暨《中國(guó)藥學(xué)雜志》第十二屆編委會(huì)會(huì)議論文集[C];2009年
8 王憲剛;馬大衛(wèi);王新民;;呼吸內(nèi)科常用藥物的基因組學(xué)[A];四川省藥學(xué)會(huì)第七次全省會(huì)員代表大會(huì)暨學(xué)術(shù)年會(huì)論文集[C];2011年
9 李翠蘭;胡大一;;藥物基因組學(xué)與女性心血管病健康[A];中華醫(yī)學(xué)會(huì)第十三次全國(guó)心血管病學(xué)術(shù)會(huì)議專(zhuān)題報(bào)告專(zhuān)輯[C];2011年
10 梁鳳英;房霞;;藥物基因組學(xué)與臨床合理用藥[A];山東省藥學(xué)會(huì)第一屆學(xué)術(shù)年會(huì)論文集(上)[C];2005年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)特約撰稿人 陸志城;藥物基因組學(xué)數(shù)據(jù)呈報(bào)指南[N];醫(yī)藥經(jīng)濟(jì)報(bào);2003年
2 記者 黃每裕;藥物基因組學(xué)嶄露頭角[N];健康報(bào);2000年
3 束梅英;藥物基因組學(xué)及應(yīng)用前景[N];中國(guó)醫(yī)藥報(bào);2001年
4 韓寶惠;藥物基因組學(xué)與肺癌個(gè)體化治療[N];健康報(bào);2007年
5 北京軍區(qū)總醫(yī)院臨床藥物研究所主任 許景峰;藥物基因組學(xué)研究強(qiáng)調(diào)臨床應(yīng)用[N];健康報(bào);2008年
6 鑫國(guó);藥物基因組學(xué):“重磅炸彈”藥物的克星[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2001年
7 ;藥物基因組學(xué)的應(yīng)用及其市場(chǎng)前景[N];醫(yī)藥經(jīng)濟(jì)報(bào);2000年
8 陸志城;藥物基因組學(xué)常見(jiàn)問(wèn)題解答[N];醫(yī)藥經(jīng)濟(jì)報(bào);2001年
9 軍事醫(yī)學(xué)科學(xué)院 張迎輝;藥物基因組學(xué)蘊(yùn)含無(wú)限商機(jī)[N];醫(yī)藥經(jīng)濟(jì)報(bào);2001年
10 鐘義琴;神奇的“藥物基因組學(xué)”[N];江蘇經(jīng)濟(jì)報(bào);2003年
相關(guān)博士學(xué)位論文 前3條
1 魏之昀;利培酮的藥物基因組學(xué)和高血壓的分子遺傳學(xué)[D];上海交通大學(xué);2012年
2 祖麗皮亞·玉努斯;中國(guó)新疆四個(gè)少數(shù)民族藥物基因組學(xué)相關(guān)基因VIP位點(diǎn)遺傳差異研究[D];西北大學(xué);2013年
3 王磊;抗精神分裂癥藥物利培酮的藥物基因組學(xué)和高血壓的遺傳學(xué)研究[D];上海交通大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 李相宜;基于生物網(wǎng)絡(luò)特征和藥物基因組學(xué)特征的抗癌協(xié)同組合藥物預(yù)測(cè)方法研究[D];上海海洋大學(xué);2017年
2 夏瓊瓊;高職高專(zhuān)醫(yī)學(xué)生對(duì)藥物基因組學(xué)知識(shí)知曉現(xiàn)況及需求分析[D];中南大學(xué);2013年
3 李曉琪;適合中國(guó)人群抗凝治療的華法林藥物基因組學(xué)劑量預(yù)測(cè)模型建立和臨床應(yīng)用研究[D];中國(guó)人民解放軍醫(yī)學(xué)院;2015年
4 呂文文;轉(zhuǎn)錄組學(xué)和藥物基因組學(xué)在人類(lèi)復(fù)雜疾病研究中的應(yīng)用[D];安徽大學(xué);2016年
5 趙志婷;藥物基因組學(xué)的臨床倫理問(wèn)題探究[D];山西大學(xué);2007年
6 邢一;UGT1A6基因在中國(guó)不同人群中的藥物基因組學(xué)研究[D];上海交通大學(xué);2009年
7 蔣生珍;山區(qū)公路彎坡組合路段行車(chē)特性分析[D];重慶交通大學(xué);2017年
8 曹永明;組合圓環(huán)抗震耗能支撐體系及設(shè)計(jì)方法[D];濟(jì)南大學(xué);2016年
9 謝威;基于車(chē)路耦合安全度模型的彎坡組合路段設(shè)計(jì)理論研究[D];重慶交通大學(xué);2017年
10 陳澤;高速公路長(zhǎng)大隧道與連續(xù)上下坡組合路段安全保障技術(shù)研究[D];長(zhǎng)安大學(xué);2017年
,本文編號(hào):1905902
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/1905902.html