分子相似性網(wǎng)絡(luò)中關(guān)鍵化合物發(fā)現(xiàn)算法研究
發(fā)布時(shí)間:2017-05-19 17:26
本文關(guān)鍵詞:分子相似性網(wǎng)絡(luò)中關(guān)鍵化合物發(fā)現(xiàn)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:新藥研發(fā)是一個(gè)十分復(fù)雜且昂貴耗時(shí)的過程。虛擬篩選技術(shù)需要使用一系列計(jì)算方法從龐大的化合物數(shù)據(jù)庫(kù)中選出一定數(shù)量的先導(dǎo)化合物。具有相似結(jié)構(gòu)的化合物可能具有相似的理化性質(zhì),基于相似性的虛擬篩選計(jì)算高度依賴于特定靶標(biāo)的結(jié)構(gòu)活性關(guān)系。在藥物發(fā)現(xiàn)的初期階段,根據(jù)分子間的相似性確定化學(xué)庫(kù)中的首要研究對(duì)象,或預(yù)測(cè)藥物專利申請(qǐng)書中的關(guān)鍵化合物,將有助于制定合理的藥物研發(fā)計(jì)劃,降低成本,縮短藥物研發(fā)周期。分子網(wǎng)絡(luò)中的關(guān)鍵化合物是占據(jù)網(wǎng)絡(luò)拓?fù)鋱D中關(guān)鍵節(jié)點(diǎn)位置的分子。在藥物發(fā)現(xiàn)初期階段涉及的分子中,關(guān)鍵化合物將是具有最優(yōu)物化性質(zhì)、藥代動(dòng)力學(xué)特征或生物活性的分子。對(duì)專利說明書中的示例化合物集合,關(guān)鍵化合物很可能就是候選藥物。本文針對(duì)基于分子相似性的虛擬篩選,將網(wǎng)絡(luò)分析方法使用到分子篩選研究中。在分析一個(gè)分子集合時(shí),發(fā)現(xiàn)其中的關(guān)鍵化合物并首先對(duì)其進(jìn)行分析研究,將加快對(duì)整個(gè)集合分子物化特性以及生物性質(zhì)的分析和把握。本文基于指紋的分子相似性計(jì)算算法構(gòu)建分子相似性網(wǎng)絡(luò)。借鑒Google搜索引擎用于頁(yè)面評(píng)分的PageRank算法的主要思想,提出用于分子相似性網(wǎng)絡(luò)中發(fā)現(xiàn)關(guān)鍵化合物的MolecularRank算法。使用MolecularRank算法對(duì)分子進(jìn)行評(píng)分,化合物的MolecularRank值越高(MolecularRank值高的分子占據(jù)了分子相似性網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn))則表示該化合物在分子集合中越重要。該算法通過求分子相似性網(wǎng)絡(luò)對(duì)應(yīng)鄰接矩陣特征向量計(jì)算化合物的MolecularRank 分值并進(jìn)行排序,能夠準(zhǔn)確地發(fā)現(xiàn)分子相似性網(wǎng)絡(luò)中占據(jù)重要節(jié)點(diǎn)的分子。本文以用于藥物發(fā)現(xiàn)的大型生物活性數(shù)據(jù)庫(kù)ChEMBL為數(shù)據(jù)來源對(duì)算法進(jìn)行了實(shí)例分析。為滿足海量數(shù)據(jù)的計(jì)算需求,論文進(jìn)一步研究了MolecularRank算法在云計(jì)算平臺(tái)下的并行化,實(shí)現(xiàn)了其在MapReduce框架下的并行化計(jì)算。最后,使用MolecularRank算法預(yù)測(cè)藥物專利中的關(guān)鍵化合物,并與H attori等人提出的CSA (Cluster Seed Analysis)算法進(jìn)行對(duì)比分析,結(jié)果顯示本文提出的MolecularRank算法在實(shí)驗(yàn)參數(shù)設(shè)定及實(shí)驗(yàn)結(jié)果上均優(yōu)于CSA算法,可以作為一種預(yù)測(cè)專利中關(guān)鍵化合物行之有效的方法。
【關(guān)鍵詞】:虛擬篩選 分子網(wǎng)絡(luò) 關(guān)鍵化合物發(fā)現(xiàn) MolecularRank算法
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13
【目錄】:
- 中文摘要3-4
- Abstract4-7
- 第一章 緒論7-16
- 1.1 研究背景和意義7-10
- 1.1.1 藥物發(fā)現(xiàn)和虛擬篩選7-8
- 1.1.2 大數(shù)據(jù)環(huán)境下藥物發(fā)現(xiàn)面臨的機(jī)遇和挑戰(zhàn)8-9
- 1.1.3 化學(xué)專利中關(guān)鍵化合物的預(yù)測(cè)9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-14
- 1.2.1 基于相似性的虛擬篩選研究10-12
- 1.2.2 分子網(wǎng)絡(luò)的研究與應(yīng)用12-13
- 1.2.3 化學(xué)專利的分析研究13-14
- 1.3 本文研究的內(nèi)容14-15
- 1.4 本文組織結(jié)構(gòu)15-16
- 第二章 相關(guān)理論技術(shù)16-25
- 2.1 基于指紋的分子相似性16-19
- 2.1.1 分子描述符16-18
- 2.1.2 分子相似性度量18-19
- 2.2 分布式系統(tǒng)架構(gòu)Hadoop19-25
- 2.2.1 HDFS21-22
- 2.2.2 MapReduce分布式并行編程模型22-24
- 2.2.3 Sqoop24-25
- 第三章 基于指紋的分子相似性計(jì)算25-41
- 3.1 分子預(yù)處理25-32
- 3.1.1 ChEMBL數(shù)據(jù)庫(kù)25-28
- 3.1.2 分子數(shù)據(jù)預(yù)處理28-32
- 3.2 基于指紋的分子相似性計(jì)算32-34
- 3.3 相似性計(jì)算結(jié)果分析34-40
- 3.4 本章小結(jié)40-41
- 第四章 關(guān)鍵化合物發(fā)現(xiàn)的MolecularRank算法41-61
- 4.1 分子相似性網(wǎng)絡(luò)41-42
- 4.2 PageRank算法42-44
- 4.3 基于PageRank的MolecularRank算法44-51
- 4.3.1 MolecularRank算法思想44-45
- 4.3.2 MolecularRank算法模型45-47
- 4.3.3 算法實(shí)例分析47-51
- 4.4 MolecularRank算法的并行化51-56
- 4.4.1 分布式計(jì)算模型51-52
- 4.4.2 MolecularRank并行算法實(shí)現(xiàn)52-56
- 4.5 與CSA算法的對(duì)比分析56-61
- 4.5.1 CSA算法56-57
- 4.5.2 實(shí)驗(yàn)數(shù)據(jù)57-58
- 4.5.3 實(shí)驗(yàn)結(jié)果對(duì)比分析58-61
- 第五章 總結(jié)與展望61-63
- 5.1 本文總結(jié)61
- 5.2 研究展望61-63
- 參考文獻(xiàn)63-67
- 研究生間參與的項(xiàng)目67-68
- 致謝68
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 王珊;王會(huì)舉;覃雄派;周p,
本文編號(hào):379346
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/379346.html
最近更新
教材專著