基于深度學(xué)習(xí)的化合物與蛋白質(zhì)相互作用關(guān)系的研究
發(fā)布時(shí)間:2021-01-18 15:21
化合物與蛋白質(zhì)相互作用的研究,能夠產(chǎn)生對(duì)藥物設(shè)計(jì)和研發(fā)有重要提示性作用的化合物-蛋白質(zhì)組合。傳統(tǒng)的藥物研發(fā)通;趯(shí)驗(yàn)驗(yàn)證,可能會(huì)遺漏重要的候選組合,并且研發(fā)周期長(zhǎng)、費(fèi)用高、成功率低。目前,臨床和動(dòng)物細(xì)胞實(shí)驗(yàn)積累了大量化合物與蛋白質(zhì)相互作用的數(shù)據(jù),這些基礎(chǔ)數(shù)據(jù)為發(fā)現(xiàn)新的組合模式提供了可能。近年來(lái),基于深度學(xué)習(xí)的方法在很多領(lǐng)域都取得了突破性進(jìn)展,該方法受生物神經(jīng)系統(tǒng)信息處理的啟發(fā),能夠從大量訓(xùn)練數(shù)據(jù)中自動(dòng)分層提取特征,因此,使用該方法訓(xùn)練百萬(wàn)級(jí)別的數(shù)據(jù)集,可探索和發(fā)現(xiàn)新的化合物與蛋白質(zhì)相互作用模式,并據(jù)此預(yù)測(cè)與特定化合物相互作用的蛋白質(zhì),從而為藥物設(shè)計(jì)和研發(fā)的實(shí)驗(yàn)驗(yàn)證提供小范圍、相對(duì)可靠的假設(shè)。本文的主要工作是使用TensorFlow框架構(gòu)建并訓(xùn)練用于預(yù)測(cè)化合物和蛋白質(zhì)相互作用的深度學(xué)習(xí)模型。本文的數(shù)據(jù)來(lái)源于BindingDB數(shù)據(jù)庫(kù)。在本文中,將BindingDB中提取的化合物-蛋白質(zhì)組合數(shù)據(jù)作為正樣本,標(biāo)簽為1;將化合物與蛋白質(zhì)序列隨機(jī)組合并去除正樣本后的數(shù)據(jù)作為負(fù)樣本,標(biāo)簽為0。將正負(fù)樣本混合后按照98:1:1的比例劃分訓(xùn)練集、驗(yàn)證集及測(cè)試集。本文構(gòu)建的深度學(xué)習(xí)模型是由循環(huán)神經(jīng)網(wǎng)絡(luò)和...
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
藥物開發(fā)以及藥物發(fā)現(xiàn)的流程
;在沒(méi)有類別信息的情況下,尋找好的特征[34]。習(xí)與深度學(xué)習(xí)技術(shù)給現(xiàn)代社會(huì)的很多方面都提供了動(dòng)力,例如網(wǎng)絡(luò)搜索商務(wù)網(wǎng)站上的推薦等等。但是傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在處理原制。多年以來(lái),構(gòu)建一套機(jī)器學(xué)習(xí)系統(tǒng)需要相當(dāng)多的專業(yè)一個(gè)特征提取器,將原始數(shù)據(jù)轉(zhuǎn)換為合適的特征表示,然能給機(jī)器學(xué)習(xí)算法進(jìn)行學(xué)習(xí)。因此,這些傳統(tǒng)的機(jī)器學(xué)習(xí)度上依賴于給定數(shù)據(jù)的表示。然而,對(duì)于很多任務(wù)來(lái)說(shuō),那些特征。解決這個(gè)問(wèn)題的方法就是使用機(jī)器學(xué)習(xí)自身來(lái)稱之為表示學(xué)習(xí)(representationlearning)。如圖 2-2 是表示法學(xué)習(xí)到的表示往往比手動(dòng)設(shè)計(jì)的表示表現(xiàn)更好。對(duì)于簡(jiǎn)幾分鐘就可以發(fā)現(xiàn)一個(gè)好的特征集;對(duì)于復(fù)雜任務(wù),一般時(shí)間。然而如果人工設(shè)計(jì)特征,則需要耗費(fèi)大量的人力和費(fèi)研究人員幾十年的時(shí)間。
成功克服了深層網(wǎng)絡(luò)難以訓(xùn)練的問(wèn)題,開啟了深度學(xué)習(xí)的熱潮圖 2-3 機(jī)器學(xué)習(xí)、表示學(xué)習(xí)以及深度學(xué)習(xí)的流程深度學(xué)習(xí)的引入解決了表示學(xué)習(xí)中難以分離變差因素的核心問(wèn)題。深度學(xué)習(xí)是一種表示學(xué)習(xí),也是一種機(jī)器學(xué)習(xí),如圖 2-3 的流程所示,它可以讓計(jì)算機(jī)過(guò)較簡(jiǎn)單的特征組合構(gòu)建出更復(fù)雜的特征,從而擁有了更強(qiáng)大的能力。隨著可數(shù)據(jù)的不斷增加、軟硬件基礎(chǔ)設(shè)施的不斷發(fā)展,深度學(xué)習(xí)已經(jīng)可以解決日益復(fù)的應(yīng)用,在很多領(lǐng)域都得到了應(yīng)用并取得了突破性的成就。[35]2.3 神經(jīng)元與感知機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]小分子與生物大分子間非共價(jià)相互作用分析方法研究進(jìn)展[J]. 李銳,任海平,孫艷亭,姚英艷,盧奎,馬麗. 分析化學(xué). 2006(12)
碩士論文
[1]深度無(wú)監(jiān)督學(xué)習(xí)算法研究[D]. 岳永鵬.西南石油大學(xué) 2015
本文編號(hào):2985178
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
藥物開發(fā)以及藥物發(fā)現(xiàn)的流程
;在沒(méi)有類別信息的情況下,尋找好的特征[34]。習(xí)與深度學(xué)習(xí)技術(shù)給現(xiàn)代社會(huì)的很多方面都提供了動(dòng)力,例如網(wǎng)絡(luò)搜索商務(wù)網(wǎng)站上的推薦等等。但是傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在處理原制。多年以來(lái),構(gòu)建一套機(jī)器學(xué)習(xí)系統(tǒng)需要相當(dāng)多的專業(yè)一個(gè)特征提取器,將原始數(shù)據(jù)轉(zhuǎn)換為合適的特征表示,然能給機(jī)器學(xué)習(xí)算法進(jìn)行學(xué)習(xí)。因此,這些傳統(tǒng)的機(jī)器學(xué)習(xí)度上依賴于給定數(shù)據(jù)的表示。然而,對(duì)于很多任務(wù)來(lái)說(shuō),那些特征。解決這個(gè)問(wèn)題的方法就是使用機(jī)器學(xué)習(xí)自身來(lái)稱之為表示學(xué)習(xí)(representationlearning)。如圖 2-2 是表示法學(xué)習(xí)到的表示往往比手動(dòng)設(shè)計(jì)的表示表現(xiàn)更好。對(duì)于簡(jiǎn)幾分鐘就可以發(fā)現(xiàn)一個(gè)好的特征集;對(duì)于復(fù)雜任務(wù),一般時(shí)間。然而如果人工設(shè)計(jì)特征,則需要耗費(fèi)大量的人力和費(fèi)研究人員幾十年的時(shí)間。
成功克服了深層網(wǎng)絡(luò)難以訓(xùn)練的問(wèn)題,開啟了深度學(xué)習(xí)的熱潮圖 2-3 機(jī)器學(xué)習(xí)、表示學(xué)習(xí)以及深度學(xué)習(xí)的流程深度學(xué)習(xí)的引入解決了表示學(xué)習(xí)中難以分離變差因素的核心問(wèn)題。深度學(xué)習(xí)是一種表示學(xué)習(xí),也是一種機(jī)器學(xué)習(xí),如圖 2-3 的流程所示,它可以讓計(jì)算機(jī)過(guò)較簡(jiǎn)單的特征組合構(gòu)建出更復(fù)雜的特征,從而擁有了更強(qiáng)大的能力。隨著可數(shù)據(jù)的不斷增加、軟硬件基礎(chǔ)設(shè)施的不斷發(fā)展,深度學(xué)習(xí)已經(jīng)可以解決日益復(fù)的應(yīng)用,在很多領(lǐng)域都得到了應(yīng)用并取得了突破性的成就。[35]2.3 神經(jīng)元與感知機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]小分子與生物大分子間非共價(jià)相互作用分析方法研究進(jìn)展[J]. 李銳,任海平,孫艷亭,姚英艷,盧奎,馬麗. 分析化學(xué). 2006(12)
碩士論文
[1]深度無(wú)監(jiān)督學(xué)習(xí)算法研究[D]. 岳永鵬.西南石油大學(xué) 2015
本文編號(hào):2985178
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/2985178.html
最近更新
教材專著