基于密集連接神經(jīng)網(wǎng)絡(luò)模型預(yù)測化合物與蛋白質(zhì)綁定的研究
發(fā)布時間:2021-04-12 05:14
傳統(tǒng)的藥物研發(fā)(合成新物質(zhì)的方法)耗時,又昂貴,成功率低,該模式遇到發(fā)展瓶頸。近現(xiàn)代的實驗化學(xué)、理論化學(xué)、藥理學(xué)和毒理學(xué)等學(xué)科的發(fā)展,揭示了一些化合物與蛋白質(zhì)之間綁定的特征,但仍然有限,這制約了藥物研發(fā)的進程;谔烊恢参、動物、礦物化學(xué)成分的方法在藥物研發(fā)過程中一直占有重要位置,并積累了大量的實驗數(shù)據(jù)。如何從這些實驗數(shù)據(jù)中抽取更多化合物與蛋白質(zhì)之間綁定的特征,預(yù)測新的化合物與蛋白質(zhì)之間綁定關(guān)系,對于藥物研發(fā)具有重要的提示性作用。近些年,隨著人工智能得到迅猛發(fā)展,各領(lǐng)域積極引入基于深度學(xué)習(xí)的實驗方法,并且取得了突破性進展。深度學(xué)習(xí)也稱為分層學(xué)習(xí),該方法主要是受生物大腦啟發(fā)所設(shè)計出來的模型。深度學(xué)習(xí)在規(guī)模較大的原始數(shù)據(jù)規(guī)模上,通過逐層變化自動提取特征,并對提取的層次化特征自動學(xué)習(xí)。由于深度學(xué)習(xí)可以對特征自動進行提取,對研究者的專業(yè)知識沒有太高要求,并且速度快,精度高,對處理數(shù)據(jù)量規(guī)模較大的實驗占據(jù)很大優(yōu)勢,從而為抽取更多化合物與蛋白質(zhì)之間綁定特征提供了新的途徑。本文利用了深度學(xué)習(xí)模型中的密集連接,通過在不同層之間增加跳躍連接加強了模型的信息交流,幫助模型學(xué)習(xí)到更加魯棒的特征,還可以解決深...
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
新藥研發(fā)流程
蘭州大學(xué)碩士研究生學(xué)位論文基于密集連接神經(jīng)網(wǎng)絡(luò)模型預(yù)測化合物與蛋白質(zhì)綁定的研究7圖2-2臨床試驗各階段的成功率第一步:確定靶向新藥研發(fā)的起點是確定疾病治療目標(biāo)和作用的環(huán)節(jié)和靶標(biāo),該起點也是日后實施各項操作的根據(jù)。藥物作用的靶點是多種多樣的,有人類自身相關(guān)的藥物靶點,也有針對病原體的藥物靶點。來自人類自身的藥物靶點,主要包括蛋白質(zhì)、核酸及其他大分子,如糖、脂質(zhì)體等;來自病原體的靶點也大致相同,只是具體的靶點可能有所不同。這里主要討論來自人類自身的靶點——蛋白質(zhì),主要包括受體、酶和離子通道,是最常見的的藥物作用靶點。同時,不同靶點藥物占總藥物的比例也會有所差異。確定靶向主要包括靶點的發(fā)現(xiàn)和鑒定兩個過程。靶點的鑒定主要采用三種現(xiàn)代技術(shù):基因組學(xué)的方法、蛋白質(zhì)組學(xué)方法和遺傳學(xué)分析;蚪M學(xué)的方法是通過對RNA的研究尋找疾病相關(guān)基因。蛋白質(zhì)組學(xué)方法主要是通過雙向(2D)電泳、SDS-PAGE,結(jié)合質(zhì)譜分析發(fā)現(xiàn)與疾病相關(guān)的蛋白質(zhì)。遺傳學(xué)分析主要是對靶點候選基因展開核苷酸多態(tài)性分析,完成DNA的基因分型,再展開相關(guān)數(shù)據(jù)分析。通過比較正常樣本和病理樣本在基因水平和蛋白質(zhì)水平的兩個層面的差異,揭示疾病發(fā)生的分子機制,從而發(fā)現(xiàn)新的藥物靶點。靶點的驗證可以通過調(diào)控靶點在疾病組織的表達(dá)水平,也可以通過RNAi技術(shù)在細(xì)胞水平特異并高效地抑制靶基因產(chǎn)物的表達(dá),或在動物模型中,通過基因敲除手術(shù),獲得去靶點基因表達(dá)功能表型,亦可采用轉(zhuǎn)基因鼠等技術(shù)驗證靶點與疾病的相關(guān)性[15]。第二步:篩選化合物,確定先導(dǎo)化合物
學(xué)習(xí)并發(fā)掘數(shù)據(jù)背后隱藏的關(guān)系模式,為進一步的數(shù)據(jù)提供分析基矗此類學(xué)習(xí)任務(wù)中研究最多、應(yīng)用最廣、最具代表性的是聚類。機器學(xué)習(xí)的目標(biāo)是使學(xué)得的模型能更好的適用于“新樣本”,而不是僅僅在訓(xùn)練樣本上工作的很好;即便對聚類這樣的無監(jiān)督學(xué)習(xí)任務(wù),也希望學(xué)得的簇劃分能適用于沒在訓(xùn)練集中出現(xiàn)的樣本。機器學(xué)習(xí)與基于人工規(guī)則的模型相比,無須人工給出規(guī)則,而是讓程序自動從大量的樣本中抽象、歸納出知識與規(guī)則。因此,它具有更好的通用性,采用這種統(tǒng)一的處理框架,人們可以將機器學(xué)習(xí)算法用于各種不同的領(lǐng)域。圖2-3機器學(xué)習(xí)任務(wù)的一般流程2.2.2表示學(xué)習(xí)及深度學(xué)習(xí)概述機器學(xué)習(xí)算法之所以能夠取得成功一個至關(guān)重要的因素是數(shù)據(jù)表示,機器學(xué)習(xí)的上限取決于數(shù)據(jù)表示,而算法只是盡可能的接近該上限。此處所提到的數(shù)據(jù)是特征工程加工后得到的。特征工程是指專家依據(jù)自身的專業(yè)背景知識,從原始
【參考文獻(xiàn)】:
期刊論文
[1]基于分子描述符和機器學(xué)習(xí)方法預(yù)測和虛擬篩選乳腺癌靶向蛋白HEC1抑制劑[J]. 何冰,羅勇,李秉軻,薛英,余洛汀,邱小龍,楊登貴. 物理化學(xué)學(xué)報. 2015(09)
[2]生物技術(shù)與中藥研發(fā)[J]. 施偲. 衛(wèi)生職業(yè)教育. 2013(11)
[3]膽紅素與血紅蛋白分子作用的發(fā)光光譜分析[J]. 楊培慧,鄭志雯,蔡繼業(yè). 發(fā)光學(xué)報. 2004(03)
[4]光譜法研究苯甲酸鈉與牛血清白蛋白的作用[J]. 王亞俐,王海芳. 北京大學(xué)學(xué)報(自然科學(xué)版). 2002(02)
碩士論文
[1]基于深度學(xué)習(xí)的化合物與蛋白質(zhì)相互作用關(guān)系的研究[D]. 李成強.蘭州大學(xué) 2019
本文編號:3132689
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
新藥研發(fā)流程
蘭州大學(xué)碩士研究生學(xué)位論文基于密集連接神經(jīng)網(wǎng)絡(luò)模型預(yù)測化合物與蛋白質(zhì)綁定的研究7圖2-2臨床試驗各階段的成功率第一步:確定靶向新藥研發(fā)的起點是確定疾病治療目標(biāo)和作用的環(huán)節(jié)和靶標(biāo),該起點也是日后實施各項操作的根據(jù)。藥物作用的靶點是多種多樣的,有人類自身相關(guān)的藥物靶點,也有針對病原體的藥物靶點。來自人類自身的藥物靶點,主要包括蛋白質(zhì)、核酸及其他大分子,如糖、脂質(zhì)體等;來自病原體的靶點也大致相同,只是具體的靶點可能有所不同。這里主要討論來自人類自身的靶點——蛋白質(zhì),主要包括受體、酶和離子通道,是最常見的的藥物作用靶點。同時,不同靶點藥物占總藥物的比例也會有所差異。確定靶向主要包括靶點的發(fā)現(xiàn)和鑒定兩個過程。靶點的鑒定主要采用三種現(xiàn)代技術(shù):基因組學(xué)的方法、蛋白質(zhì)組學(xué)方法和遺傳學(xué)分析;蚪M學(xué)的方法是通過對RNA的研究尋找疾病相關(guān)基因。蛋白質(zhì)組學(xué)方法主要是通過雙向(2D)電泳、SDS-PAGE,結(jié)合質(zhì)譜分析發(fā)現(xiàn)與疾病相關(guān)的蛋白質(zhì)。遺傳學(xué)分析主要是對靶點候選基因展開核苷酸多態(tài)性分析,完成DNA的基因分型,再展開相關(guān)數(shù)據(jù)分析。通過比較正常樣本和病理樣本在基因水平和蛋白質(zhì)水平的兩個層面的差異,揭示疾病發(fā)生的分子機制,從而發(fā)現(xiàn)新的藥物靶點。靶點的驗證可以通過調(diào)控靶點在疾病組織的表達(dá)水平,也可以通過RNAi技術(shù)在細(xì)胞水平特異并高效地抑制靶基因產(chǎn)物的表達(dá),或在動物模型中,通過基因敲除手術(shù),獲得去靶點基因表達(dá)功能表型,亦可采用轉(zhuǎn)基因鼠等技術(shù)驗證靶點與疾病的相關(guān)性[15]。第二步:篩選化合物,確定先導(dǎo)化合物
學(xué)習(xí)并發(fā)掘數(shù)據(jù)背后隱藏的關(guān)系模式,為進一步的數(shù)據(jù)提供分析基矗此類學(xué)習(xí)任務(wù)中研究最多、應(yīng)用最廣、最具代表性的是聚類。機器學(xué)習(xí)的目標(biāo)是使學(xué)得的模型能更好的適用于“新樣本”,而不是僅僅在訓(xùn)練樣本上工作的很好;即便對聚類這樣的無監(jiān)督學(xué)習(xí)任務(wù),也希望學(xué)得的簇劃分能適用于沒在訓(xùn)練集中出現(xiàn)的樣本。機器學(xué)習(xí)與基于人工規(guī)則的模型相比,無須人工給出規(guī)則,而是讓程序自動從大量的樣本中抽象、歸納出知識與規(guī)則。因此,它具有更好的通用性,采用這種統(tǒng)一的處理框架,人們可以將機器學(xué)習(xí)算法用于各種不同的領(lǐng)域。圖2-3機器學(xué)習(xí)任務(wù)的一般流程2.2.2表示學(xué)習(xí)及深度學(xué)習(xí)概述機器學(xué)習(xí)算法之所以能夠取得成功一個至關(guān)重要的因素是數(shù)據(jù)表示,機器學(xué)習(xí)的上限取決于數(shù)據(jù)表示,而算法只是盡可能的接近該上限。此處所提到的數(shù)據(jù)是特征工程加工后得到的。特征工程是指專家依據(jù)自身的專業(yè)背景知識,從原始
【參考文獻(xiàn)】:
期刊論文
[1]基于分子描述符和機器學(xué)習(xí)方法預(yù)測和虛擬篩選乳腺癌靶向蛋白HEC1抑制劑[J]. 何冰,羅勇,李秉軻,薛英,余洛汀,邱小龍,楊登貴. 物理化學(xué)學(xué)報. 2015(09)
[2]生物技術(shù)與中藥研發(fā)[J]. 施偲. 衛(wèi)生職業(yè)教育. 2013(11)
[3]膽紅素與血紅蛋白分子作用的發(fā)光光譜分析[J]. 楊培慧,鄭志雯,蔡繼業(yè). 發(fā)光學(xué)報. 2004(03)
[4]光譜法研究苯甲酸鈉與牛血清白蛋白的作用[J]. 王亞俐,王海芳. 北京大學(xué)學(xué)報(自然科學(xué)版). 2002(02)
碩士論文
[1]基于深度學(xué)習(xí)的化合物與蛋白質(zhì)相互作用關(guān)系的研究[D]. 李成強.蘭州大學(xué) 2019
本文編號:3132689
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3132689.html
最近更新
教材專著