生物小分子與通路相互作用預(yù)測方法研究
發(fā)布時間:2017-05-26 12:06
本文關(guān)鍵詞:生物小分子與通路相互作用預(yù)測方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:藥物研發(fā)是一個漫長而復(fù)雜的過程,除了挖掘生物小分子與靶蛋白之間的關(guān)系外,更重要的是找到生物小分子在組織內(nèi)發(fā)揮作用的代謝或傳導(dǎo)途徑,即挖掘小分子與全局生理過程之間的潛在作用關(guān)系。由于傳統(tǒng)的實驗方法受到實驗條件和成本等很多方面的限制,難以對生物小分子與通路之間的相互作用關(guān)系進行全面的研究,而有效的機器學(xué)習(xí)方法恰好能彌補這些方面的不足。本文以生物小分子(包括藥物和化合物)和通路為研究對象,通過挖掘各類生物知識,預(yù)測生物小分子與通路之間的相互作用關(guān)系,為臨床實驗提供有價值的信息。主要內(nèi)容如下:1.基于多特征整合方法,預(yù)測KEGG數(shù)據(jù)庫中與癌癥相關(guān)的通路和藥物之間的相互作用關(guān)系。具體來講是將化學(xué)結(jié)構(gòu)空間信息,藥物的官能團信息整合構(gòu)成藥物特征譜;將與通路關(guān)聯(lián)的基因信息(包括基于NCI-60實驗中的基因表達(dá)數(shù)據(jù)的平均值和方差值,基因本體語義信息)整合構(gòu)成通路特征譜;同時在特征譜中加入藥物-通路相互作用網(wǎng)絡(luò)拓?fù)湫畔ⅰN恼逻x擇三種半監(jiān)督學(xué)習(xí)算法對藥物-通路相互作用進行預(yù)測,實驗結(jié)果證明特征整合是有效的,并且有一些潛在的藥物-通路相互作用在權(quán)威的數(shù)據(jù)庫中能夠得到驗證。2.基于改進的旋轉(zhuǎn)森林算法預(yù)測化合物與通路之間的相互作用關(guān)系。本章拓寬研究范圍,以cMap數(shù)據(jù)庫中的基因為依據(jù)篩選出78條通路,并從實驗使用的1309個化合物小分子中篩選出147個化合物,構(gòu)建得到化合物-通路相互作用數(shù)據(jù)集。特征構(gòu)建相比之前也更有針對性,使用基于該實驗的基因微陣列數(shù)據(jù)計算化合物和通路特征譜。我們對傳統(tǒng)的旋轉(zhuǎn)森林集成學(xué)習(xí)算法進行改進,選擇Relief算法作為特征旋轉(zhuǎn)算法,基于圖的半監(jiān)督學(xué)習(xí)算法作為基礎(chǔ)分類器,并將改進后的方法簡稱為RGRF (ReliefGBSSL-Rotation Forest)算法。實驗結(jié)果表明RGRF算法比原始的旋轉(zhuǎn)森林算法性能要好,并且預(yù)測得到的部分化合物-通路相互作用關(guān)系在數(shù)據(jù)庫和文獻(xiàn)中都能得到驗證。3.實現(xiàn)了基于RGRF算法的可視化預(yù)測工具。該工具可以提供化合物在KEGG數(shù)據(jù)庫中基本信息,同時實現(xiàn)對cMap實驗中包括的幾乎全部的化合物與相關(guān)通路的相互作用預(yù)測,并按照預(yù)測出的相互作用概率值給出一個相關(guān)通路列表。
【關(guān)鍵詞】:藥物-通路相互作用 多特征整合 化合物-通路相互作用 集成學(xué)習(xí) RGRF算法
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:R917;TP311.13
【目錄】:
- 摘要6-8
- Abstract8-13
- 第一章 緒論13-19
- 1.1 研究背景,目的及意義13-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-16
- 1.3 論文主要工作16-17
- 1.4 論文結(jié)構(gòu)17-19
- 第二章 相關(guān)知識19-29
- 2.1 通路知識19-24
- 2.1.1 通路的概念19-20
- 2.1.2 相關(guān)數(shù)據(jù)庫20-24
- 2.2 機器學(xué)習(xí)方法概述24-26
- 2.2.1 監(jiān)督學(xué)習(xí)25
- 2.2.2 無監(jiān)督學(xué)習(xí)25-26
- 2.2.3 半監(jiān)督學(xué)習(xí)26
- 2.2.4 集成學(xué)習(xí)26
- 2.3 模型選擇方法26-27
- 2.4 模型評價方法27-29
- 第三章 基于多特征整合方法預(yù)測藥物-通路相互作用29-42
- 3.1 引言29-30
- 3.2 構(gòu)建數(shù)據(jù)集30-31
- 3.3 方法概述31-35
- 3.3.1 藥物特征構(gòu)建31
- 3.3.2 通路特征構(gòu)建31-33
- 3.3.3 基于高斯內(nèi)核的規(guī)范化最小二乘算法33
- 3.3.4 基于圖的半監(jiān)督學(xué)習(xí)算法33-34
- 3.3.5 分圖局部模型34-35
- 3.4 結(jié)果與討論35-41
- 3.4.1 性能評價35-38
- 3.4.2 預(yù)測結(jié)果38-41
- 3.5 本章小結(jié)41-42
- 第四章 基于改進的旋轉(zhuǎn)森林方法預(yù)測化合物-通路相互作用42-58
- 4.1 引言42-44
- 4.2 構(gòu)建數(shù)據(jù)集44-45
- 4.3 方法概述45-51
- 4.3.1 化合物結(jié)構(gòu)特征45-46
- 4.3.2 化合物的MOA特征46-47
- 4.3.3 通路的基因空間特征47-48
- 4.3.4 旋轉(zhuǎn)森林48-49
- 4.3.5 Relief特征過濾和GBSSL基礎(chǔ)分類49-50
- 4.3.6 RGRF算法描述50-51
- 4.4 結(jié)果與討論51-56
- 4.4.1 性能評價51-53
- 4.4.2 預(yù)測結(jié)果53-55
- 4.4.3 驗證分析55-56
- 4.5 本章小結(jié)56-58
- 第五章 RGRF算法工具的設(shè)計與實現(xiàn)58-62
- 5.1 設(shè)計目的58
- 5.2 設(shè)計原理58-59
- 5.3 輸入與輸出59
- 5.4 用戶界面59-61
- 5.5 本章小節(jié)61-62
- 第六章 總結(jié)與展望62-64
- 6.1 論文工作總結(jié)62-63
- 6.2 工作展望63-64
- 參考文獻(xiàn)64-71
- 致謝71-72
- 附錄 攻讀學(xué)位期間發(fā)表論文目錄72
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 李清玉;司民真;鄧?yán)蛱m;李永鑄;董勤;;FT-IR對藥用蕨類植物節(jié)節(jié)草的分析[J];光散射學(xué)報;2008年02期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 宋美s
本文編號:396744
本文鏈接:http://sikaile.net/yixuelunwen/yxlw/396744.html
最近更新
教材專著