基于深度學(xué)習(xí)的化合物與蛋白質(zhì)相互作用關(guān)系的研究
發(fā)布時間:2021-01-18 15:21
化合物與蛋白質(zhì)相互作用的研究,能夠產(chǎn)生對藥物設(shè)計和研發(fā)有重要提示性作用的化合物-蛋白質(zhì)組合。傳統(tǒng)的藥物研發(fā)通;趯(shí)驗(yàn)驗(yàn)證,可能會遺漏重要的候選組合,并且研發(fā)周期長、費(fèi)用高、成功率低。目前,臨床和動物細(xì)胞實(shí)驗(yàn)積累了大量化合物與蛋白質(zhì)相互作用的數(shù)據(jù),這些基礎(chǔ)數(shù)據(jù)為發(fā)現(xiàn)新的組合模式提供了可能。近年來,基于深度學(xué)習(xí)的方法在很多領(lǐng)域都取得了突破性進(jìn)展,該方法受生物神經(jīng)系統(tǒng)信息處理的啟發(fā),能夠從大量訓(xùn)練數(shù)據(jù)中自動分層提取特征,因此,使用該方法訓(xùn)練百萬級別的數(shù)據(jù)集,可探索和發(fā)現(xiàn)新的化合物與蛋白質(zhì)相互作用模式,并據(jù)此預(yù)測與特定化合物相互作用的蛋白質(zhì),從而為藥物設(shè)計和研發(fā)的實(shí)驗(yàn)驗(yàn)證提供小范圍、相對可靠的假設(shè)。本文的主要工作是使用TensorFlow框架構(gòu)建并訓(xùn)練用于預(yù)測化合物和蛋白質(zhì)相互作用的深度學(xué)習(xí)模型。本文的數(shù)據(jù)來源于BindingDB數(shù)據(jù)庫。在本文中,將BindingDB中提取的化合物-蛋白質(zhì)組合數(shù)據(jù)作為正樣本,標(biāo)簽為1;將化合物與蛋白質(zhì)序列隨機(jī)組合并去除正樣本后的數(shù)據(jù)作為負(fù)樣本,標(biāo)簽為0。將正負(fù)樣本混合后按照98:1:1的比例劃分訓(xùn)練集、驗(yàn)證集及測試集。本文構(gòu)建的深度學(xué)習(xí)模型是由循環(huán)神經(jīng)網(wǎng)絡(luò)和...
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
藥物開發(fā)以及藥物發(fā)現(xiàn)的流程
;在沒有類別信息的情況下,尋找好的特征[34]。習(xí)與深度學(xué)習(xí)技術(shù)給現(xiàn)代社會的很多方面都提供了動力,例如網(wǎng)絡(luò)搜索商務(wù)網(wǎng)站上的推薦等等。但是傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在處理原制。多年以來,構(gòu)建一套機(jī)器學(xué)習(xí)系統(tǒng)需要相當(dāng)多的專業(yè)一個特征提取器,將原始數(shù)據(jù)轉(zhuǎn)換為合適的特征表示,然能給機(jī)器學(xué)習(xí)算法進(jìn)行學(xué)習(xí)。因此,這些傳統(tǒng)的機(jī)器學(xué)習(xí)度上依賴于給定數(shù)據(jù)的表示。然而,對于很多任務(wù)來說,那些特征。解決這個問題的方法就是使用機(jī)器學(xué)習(xí)自身來稱之為表示學(xué)習(xí)(representationlearning)。如圖 2-2 是表示法學(xué)習(xí)到的表示往往比手動設(shè)計的表示表現(xiàn)更好。對于簡幾分鐘就可以發(fā)現(xiàn)一個好的特征集;對于復(fù)雜任務(wù),一般時間。然而如果人工設(shè)計特征,則需要耗費(fèi)大量的人力和費(fèi)研究人員幾十年的時間。
成功克服了深層網(wǎng)絡(luò)難以訓(xùn)練的問題,開啟了深度學(xué)習(xí)的熱潮圖 2-3 機(jī)器學(xué)習(xí)、表示學(xué)習(xí)以及深度學(xué)習(xí)的流程深度學(xué)習(xí)的引入解決了表示學(xué)習(xí)中難以分離變差因素的核心問題。深度學(xué)習(xí)是一種表示學(xué)習(xí),也是一種機(jī)器學(xué)習(xí),如圖 2-3 的流程所示,它可以讓計算機(jī)過較簡單的特征組合構(gòu)建出更復(fù)雜的特征,從而擁有了更強(qiáng)大的能力。隨著可數(shù)據(jù)的不斷增加、軟硬件基礎(chǔ)設(shè)施的不斷發(fā)展,深度學(xué)習(xí)已經(jīng)可以解決日益復(fù)的應(yīng)用,在很多領(lǐng)域都得到了應(yīng)用并取得了突破性的成就。[35]2.3 神經(jīng)元與感知機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]小分子與生物大分子間非共價相互作用分析方法研究進(jìn)展[J]. 李銳,任海平,孫艷亭,姚英艷,盧奎,馬麗. 分析化學(xué). 2006(12)
碩士論文
[1]深度無監(jiān)督學(xué)習(xí)算法研究[D]. 岳永鵬.西南石油大學(xué) 2015
本文編號:2985178
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
藥物開發(fā)以及藥物發(fā)現(xiàn)的流程
;在沒有類別信息的情況下,尋找好的特征[34]。習(xí)與深度學(xué)習(xí)技術(shù)給現(xiàn)代社會的很多方面都提供了動力,例如網(wǎng)絡(luò)搜索商務(wù)網(wǎng)站上的推薦等等。但是傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在處理原制。多年以來,構(gòu)建一套機(jī)器學(xué)習(xí)系統(tǒng)需要相當(dāng)多的專業(yè)一個特征提取器,將原始數(shù)據(jù)轉(zhuǎn)換為合適的特征表示,然能給機(jī)器學(xué)習(xí)算法進(jìn)行學(xué)習(xí)。因此,這些傳統(tǒng)的機(jī)器學(xué)習(xí)度上依賴于給定數(shù)據(jù)的表示。然而,對于很多任務(wù)來說,那些特征。解決這個問題的方法就是使用機(jī)器學(xué)習(xí)自身來稱之為表示學(xué)習(xí)(representationlearning)。如圖 2-2 是表示法學(xué)習(xí)到的表示往往比手動設(shè)計的表示表現(xiàn)更好。對于簡幾分鐘就可以發(fā)現(xiàn)一個好的特征集;對于復(fù)雜任務(wù),一般時間。然而如果人工設(shè)計特征,則需要耗費(fèi)大量的人力和費(fèi)研究人員幾十年的時間。
成功克服了深層網(wǎng)絡(luò)難以訓(xùn)練的問題,開啟了深度學(xué)習(xí)的熱潮圖 2-3 機(jī)器學(xué)習(xí)、表示學(xué)習(xí)以及深度學(xué)習(xí)的流程深度學(xué)習(xí)的引入解決了表示學(xué)習(xí)中難以分離變差因素的核心問題。深度學(xué)習(xí)是一種表示學(xué)習(xí),也是一種機(jī)器學(xué)習(xí),如圖 2-3 的流程所示,它可以讓計算機(jī)過較簡單的特征組合構(gòu)建出更復(fù)雜的特征,從而擁有了更強(qiáng)大的能力。隨著可數(shù)據(jù)的不斷增加、軟硬件基礎(chǔ)設(shè)施的不斷發(fā)展,深度學(xué)習(xí)已經(jīng)可以解決日益復(fù)的應(yīng)用,在很多領(lǐng)域都得到了應(yīng)用并取得了突破性的成就。[35]2.3 神經(jīng)元與感知機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]小分子與生物大分子間非共價相互作用分析方法研究進(jìn)展[J]. 李銳,任海平,孫艷亭,姚英艷,盧奎,馬麗. 分析化學(xué). 2006(12)
碩士論文
[1]深度無監(jiān)督學(xué)習(xí)算法研究[D]. 岳永鵬.西南石油大學(xué) 2015
本文編號:2985178
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/2985178.html
最近更新
教材專著