基于智能計(jì)算的生物網(wǎng)絡(luò)構(gòu)建算法的研究
發(fā)布時(shí)間:2017-05-05 11:05
本文關(guān)鍵詞:基于智能計(jì)算的生物網(wǎng)絡(luò)構(gòu)建算法的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人類基因組計(jì)劃(HGP)的完成,人類進(jìn)入后基因組時(shí)代。研究也從單純分析基因堿基構(gòu)成,逐漸轉(zhuǎn)向特定功能基因的研究。細(xì)胞是一個(gè)復(fù)雜的非線性系統(tǒng),任何細(xì)胞活動(dòng)都需要多個(gè)基因、多個(gè)蛋白質(zhì)以及多種代謝物共同作用來完成,僅僅對(duì)單個(gè)基因進(jìn)行分析很難獲得其具體生物學(xué)功能,于是人們逐步開始探索多個(gè)基因、多個(gè)蛋白質(zhì)之間的相互關(guān)系。生物網(wǎng)絡(luò)是研究生物分子之間相互關(guān)系的一個(gè)重要工具。它能直觀反映基因、蛋白質(zhì)、代謝物以及環(huán)境之間相互作用的規(guī)律,對(duì)在分子水平上認(rèn)識(shí)基因和蛋白質(zhì)功能具有重要作用。同時(shí),也能幫助揭示新陳代謝、信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞分化、細(xì)胞生成和凋亡等細(xì)胞活動(dòng)規(guī)律,為下一步進(jìn)行新藥開發(fā)、疾病預(yù)防和治療提供重要理論依據(jù)。生物網(wǎng)絡(luò)的構(gòu)建十分困難,傳統(tǒng)上利用人工方法通過生物實(shí)驗(yàn)數(shù)據(jù)進(jìn)行,這種方法不但費(fèi)時(shí)費(fèi)力,效率也很低。隨著生物技術(shù)特別是高通量技術(shù)發(fā)展,大量生物數(shù)據(jù)被測(cè)定出來,人工方法也越來越不能適應(yīng)生物數(shù)據(jù)的快速增長,因此,人們開始探索使用計(jì)算方法來自動(dòng)完成生物網(wǎng)絡(luò)的構(gòu)建。本文就是從這個(gè)思路出發(fā),利用計(jì)算智能的方法,通過反向工程學(xué)原理,對(duì)生物網(wǎng)絡(luò)進(jìn)行自動(dòng)構(gòu)建。對(duì)于生物網(wǎng)絡(luò)的構(gòu)建,本文分為動(dòng)態(tài)網(wǎng)絡(luò)的構(gòu)建和靜態(tài)網(wǎng)絡(luò)的構(gòu)建兩部分。動(dòng)態(tài)網(wǎng)絡(luò)的構(gòu)建是指基因調(diào)控網(wǎng)絡(luò)(GRN)的構(gòu)建,是通過算法學(xué)習(xí)基因表達(dá)的時(shí)間序列數(shù)據(jù),自動(dòng)構(gòu)建基因調(diào)控網(wǎng)絡(luò)的動(dòng)態(tài)調(diào)控模型,進(jìn)而分析其動(dòng)力學(xué)特性。靜態(tài)網(wǎng)絡(luò)的構(gòu)建是指蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建,是通過算法學(xué)習(xí)蛋白質(zhì)序列數(shù)據(jù),建立蛋白質(zhì)相互作用的預(yù)測(cè)模型,進(jìn)而確定網(wǎng)絡(luò)中的邊(即存在相互作用的蛋白質(zhì)對(duì))。對(duì)于這兩個(gè)問題的研究,本文主要?jiǎng)?chuàng)新之處在于:1、提出使用基于質(zhì)量作用定律的模型描述基因調(diào)控網(wǎng)絡(luò)。描述基因調(diào)控網(wǎng)絡(luò)的模型有很多,微分方程模型由于能反映基因調(diào)控的動(dòng)力學(xué)特性而廣受歡迎。傳統(tǒng)的微分方程模型大都基于S-System模型,但該模型僅是一個(gè)經(jīng)典數(shù)學(xué)模型,其參數(shù)沒有具體生物學(xué)含義,因此即使模型被建立起來也難以對(duì)其進(jìn)行解釋。為解決這個(gè)問題,本文提出基于質(zhì)量作用定律的微分方程模型(MA)。MA模型基于經(jīng)典生化反應(yīng)定律——質(zhì)量作用定律,方程推導(dǎo)充分考慮基因調(diào)控的生物機(jī)制,能更精確反映基因相互作用的真實(shí)情況。此外,該模型的所有參數(shù)都可解釋,有利于人們進(jìn)一步分析基因調(diào)控背后的規(guī)律。2、提出基于質(zhì)量作用模型的基因調(diào)控網(wǎng)絡(luò)自動(dòng)構(gòu)建算法。MA模型雖然具有參數(shù)生物學(xué)含義明確、生物理論基礎(chǔ)扎實(shí)的特點(diǎn),但如何通過基因表達(dá)的時(shí)間序列數(shù)據(jù),自動(dòng)構(gòu)建該模型仍是一個(gè)需要解決的問題。本文提出基于種群的增量學(xué)習(xí)算法(PBIL)和三角法差分進(jìn)化算法(TDE)的混合算法,用于MA模型的構(gòu)建。該算法分兩步進(jìn)行,第一步是利用改進(jìn)的PBIL算法推導(dǎo)基因之間的相互作用(“激活”、“抑制”或“無調(diào)控”),構(gòu)建出MA模型的結(jié)構(gòu)。第二步是在第一步的基礎(chǔ)上,利用TDE算法優(yōu)化MA模型的參數(shù),使計(jì)算出的數(shù)據(jù)與真實(shí)生物實(shí)驗(yàn)數(shù)據(jù)在最大程度上擬合。為驗(yàn)證該算法,實(shí)驗(yàn)在人工合成網(wǎng)絡(luò)、酵母菌的IRMA合成網(wǎng)絡(luò)、簡化的IRMA合成網(wǎng)絡(luò)、大腸桿菌的SOS DNA修復(fù)網(wǎng)絡(luò)上進(jìn)行,結(jié)果表明,該方法不僅能夠完成基因調(diào)控網(wǎng)絡(luò)MA模型的自動(dòng)構(gòu)建,而且與其他方法相比,該方法構(gòu)建的網(wǎng)絡(luò)也更加準(zhǔn)確。3、提出使用基于時(shí)間延遲的質(zhì)量作用模型(TDMA)描述基因調(diào)控網(wǎng)絡(luò);蛘{(diào)控過程并不是一個(gè)瞬時(shí)完成的過程,期間涉及到很多化學(xué)反應(yīng)環(huán)節(jié),而這些環(huán)節(jié)都需要消耗一定的時(shí)間。傳統(tǒng)的微分方程模型大都不考慮時(shí)間延遲,這顯然是不符合事實(shí)的。為解決這個(gè)問題,本文在MA模型的基礎(chǔ)上引入了時(shí)間延遲,提出TDMA模型,使用時(shí)滯微分方程去替代原來的常微分方程,這樣可以更加精細(xì)的刻畫基因調(diào)控的真實(shí)過程。4、提出基于延遲質(zhì)量作用模型的基因調(diào)控網(wǎng)絡(luò)并行化自動(dòng)構(gòu)建算法。對(duì)TDMA模型的基因調(diào)控網(wǎng)絡(luò)自動(dòng)構(gòu)建算法仍采用PBIL和TDE的混合算法。但由于時(shí)間參數(shù)的引入造成了計(jì)算復(fù)雜度提升,為解決這個(gè)問題,本文利用消息傳遞接口模型(MPI),將上述網(wǎng)絡(luò)自動(dòng)構(gòu)建算法進(jìn)行并行化改進(jìn),使該算法能充分利用主流處理器的多個(gè)核心,實(shí)現(xiàn)算法加速。實(shí)驗(yàn)在三個(gè)基因調(diào)控網(wǎng)絡(luò)模體協(xié)調(diào)-1型前饋環(huán)、非協(xié)調(diào)-1型前饋環(huán)、雙扇網(wǎng)絡(luò),以及酵母菌的簡化IRMA合成網(wǎng)絡(luò)中進(jìn)行,結(jié)果表明,該方法不僅能夠成功的推導(dǎo)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),也能夠成功推導(dǎo)出基因調(diào)控延遲。5、提出基于集成概率神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)相互作用預(yù)測(cè)算法。構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò)的一個(gè)重要問題就是尋找存在相互作用的蛋白質(zhì)對(duì),即預(yù)測(cè)蛋白質(zhì)之間是否存在相互作用。蛋白質(zhì)相互作用預(yù)測(cè)中最常用的方法是基于蛋白質(zhì)序列的方法。但由于蛋白質(zhì)序列十分簡單,如何選擇合適的特征來表示蛋白質(zhì)序列就顯得至關(guān)重要。以前的方法都是選擇單一的較優(yōu)特征或者選擇多個(gè)特征形成組合特征,然后輸入預(yù)測(cè)模型計(jì)算。然而,選擇單一特征往往不能全面反映蛋白質(zhì)的特性,而選擇多個(gè)特征雖然比較全面,但也存在計(jì)算量大,多個(gè)特征相互干擾的問題。為了解決這個(gè)問題,本文提出基于集成概率神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法。該方法首先利用11種不同的蛋白質(zhì)理化性質(zhì)和自協(xié)方差(AC)方法對(duì)蛋白質(zhì)序列進(jìn)行特征提取,獲得11個(gè)不同的特征向量。然后,利用11個(gè)不同的概率神經(jīng)網(wǎng)絡(luò)(PNN)分別學(xué)習(xí)這11個(gè)特征。最后,通過將這些PNN的結(jié)果集成來確定最終結(jié)果。由于每個(gè)PNN僅學(xué)習(xí)一個(gè)特征,因此避免了多個(gè)特征之間的干擾。又由于它們學(xué)習(xí)的特征不同,因此會(huì)形成不同的決策函數(shù),從而增加了決策多樣性。此外,所有的PNN都參與了集成,使得所有的特征都得到了利用,這避免了選擇部分特征學(xué)習(xí)而造成的偏差。實(shí)驗(yàn)對(duì)主流的DIP、H.pylori、Human三個(gè)數(shù)據(jù)集進(jìn)行了測(cè)試,結(jié)果表明該算法相比于其他算法,具有更好的預(yù)測(cè)性能。
【關(guān)鍵詞】:基因調(diào)控網(wǎng)絡(luò) 蛋白質(zhì)相互作用網(wǎng)絡(luò) 質(zhì)量作用定律 智能計(jì)算 集成學(xué)習(xí)
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q811.4;TP301.6
【目錄】:
- 英文縮寫對(duì)照表14-16
- 中文摘要16-19
- ABSTRACT19-23
- 第1章 緒論23-30
- §1.1 研究背景和意義23-24
- §1.2 國內(nèi)外研究現(xiàn)狀24-27
- §1.3 論文研究內(nèi)容與組織結(jié)構(gòu)27-30
- 第2章 生物背景知識(shí)和相關(guān)方法30-44
- §2.1 基因調(diào)控網(wǎng)絡(luò)構(gòu)建的相關(guān)方法30-36
- 2.1.1 基因調(diào)控與基因調(diào)控網(wǎng)絡(luò)30-31
- 2.1.2 基因調(diào)控網(wǎng)絡(luò)模型31-36
- §2.2 蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建的相關(guān)方法36-43
- 2.2.1 蛋白質(zhì)相互作用36
- 2.2.2 生物實(shí)驗(yàn)方法36-38
- 2.2.3 基于計(jì)算的方法38-43
- §2.3 本章小結(jié)43-44
- 第3章 基于質(zhì)量作用定律的微分方程模型44-56
- §3.1 概述44
- §3.2 質(zhì)量作用定律44-45
- §3.3 質(zhì)量作用定律描述基因的調(diào)控與表達(dá)45-54
- 3.3.1 組成型基因表達(dá)過程的動(dòng)力學(xué)描述45-47
- 3.3.2 受單基因調(diào)控的基因表達(dá)過程的動(dòng)力學(xué)描述47-49
- 3.3.3 受雙基因調(diào)控的基因表達(dá)過程的動(dòng)力學(xué)描述49-52
- 3.3.4 受多基因調(diào)控的基因表達(dá)過程的動(dòng)力學(xué)描述52-54
- §3.4 基因調(diào)控網(wǎng)絡(luò)的表示54-55
- §3.5 本章小結(jié)55-56
- 第4章 基于質(zhì)量作用模型的基因調(diào)控網(wǎng)絡(luò)反向工程的研究56-89
- §4.1 概述56-57
- §4.2 基于PBIL的網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建算法57-62
- 4.2.1 PBIL算法57-58
- 4.2.2 改進(jìn)的PBIL算法58-60
- 4.2.3 PBIL算法推導(dǎo)網(wǎng)絡(luò)結(jié)構(gòu)的算法流程60-62
- §4.3 基于TDE的模型參數(shù)優(yōu)化算法62-70
- 4.3.1 差分進(jìn)化算法62-63
- 4.3.2 TDE優(yōu)化模型參數(shù)63-67
- 4.3.3 優(yōu)化模型參數(shù)的算法流程67-68
- 4.3.4 四階龍格庫塔法求解微分方程68-70
- §4.4 評(píng)價(jià)函數(shù)70-73
- 4.4.1 適應(yīng)值函數(shù)70-71
- 4.4.2 評(píng)價(jià)指標(biāo)71-73
- §4.5 算法總流程73-75
- §4.6 實(shí)驗(yàn)結(jié)果及分析75-88
- 4.6.1 人工合成網(wǎng)絡(luò)75-80
- 4.6.2 酵母菌IRMA合成網(wǎng)絡(luò)80-85
- 4.6.3 大腸桿菌SOS DNA修復(fù)網(wǎng)絡(luò)85-88
- §4.7 本章小結(jié)88-89
- 第5章 基于時(shí)間延遲模型的基因調(diào)控網(wǎng)絡(luò)反向工程的研究89-111
- §5.1 概述89-90
- §5.2 基于時(shí)間延遲的質(zhì)量作用模型90-92
- 5.2.1 組成型基因表達(dá)90-91
- 5.2.2 受控基因表達(dá)91-92
- §5.3 基于TDMA模型的基因調(diào)控網(wǎng)絡(luò)自動(dòng)構(gòu)建算法92-98
- 5.3.1 基于MPI的并行PBIL算法93-96
- 5.3.2 并行PBIL算法構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)的流程96-97
- 5.3.3 TDE算法優(yōu)化時(shí)間延遲參數(shù)97-98
- §5.4 實(shí)驗(yàn)結(jié)果及分析98-110
- 5.4.1 協(xié)調(diào)-1型前饋環(huán)網(wǎng)絡(luò)99-102
- 5.4.2 非協(xié)調(diào)-1型前饋環(huán)網(wǎng)絡(luò)102-105
- 5.4.3 雙扇網(wǎng)絡(luò)105-108
- 5.4.4 酵母菌IRMA合成網(wǎng)絡(luò)108-110
- §5.5 本章小結(jié)110-111
- 第6章 基于集成概率神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)相互作用預(yù)測(cè)研究111-130
- §6.1 概述111-112
- §6.2 基于概率神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)相互作用預(yù)測(cè)算法112-120
- 6.2.1 基于自協(xié)方差方法的蛋白質(zhì)特征提取算法112-116
- 6.2.2 概率神經(jīng)網(wǎng)絡(luò)116-118
- 6.2.3 概率神經(jīng)網(wǎng)絡(luò)的集成118-120
- §6.3 實(shí)驗(yàn)結(jié)果及分析120-129
- 6.3.1 數(shù)據(jù)集120-122
- 6.3.2 算法參數(shù)的確定122-125
- 6.3.3 單個(gè)PNN性能測(cè)試125-127
- 6.3.4 集成PNN性能測(cè)試127-129
- §6.4 本章小結(jié)129-130
- 第7章 總結(jié)與展望130-132
- §7.1 本論文的總結(jié)130-131
- §7.2 未來工作的展望131-132
- 參考文獻(xiàn)132-144
- 致謝144-145
- 攻讀博士學(xué)位期間發(fā)表的論文和參與的項(xiàng)目145-146
- 附件146-168
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 顧天元;張寧;宋科璞;;環(huán)境感知固定翼驗(yàn)證機(jī)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];飛行力學(xué);2014年06期
2 張博;李軍懷;王志曉;張t,
本文編號(hào):346203
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/346203.html
最近更新
教材專著