生物網(wǎng)絡(luò)中的模體發(fā)現(xiàn)算法研究
發(fā)布時(shí)間:2020-05-12 09:40
【摘要】:大量的高通量實(shí)驗(yàn)產(chǎn)生了PB級的生物組學(xué)數(shù)據(jù),這些組學(xué)數(shù)據(jù)包含了海量的生物分子作用信息。如何從這些組學(xué)數(shù)據(jù)中挖掘出有價(jià)值的信息是計(jì)算生物學(xué)的一個(gè)重大挑戰(zhàn)。為了研究生物分子間的調(diào)控機(jī)制,常用的研究方法是將生物分子間的作用關(guān)系抽象為一個(gè)網(wǎng)絡(luò)圖,然后通過基于圖論的數(shù)據(jù)挖掘方法,從生物分子作用網(wǎng)絡(luò)中挖掘出生物分子間的調(diào)控機(jī)制。模體結(jié)構(gòu)是一種被認(rèn)為包含潛在生物分子調(diào)控機(jī)制的子圖結(jié)構(gòu),在共調(diào)控網(wǎng)絡(luò)中挖掘共調(diào)控網(wǎng)絡(luò)模體,對研究共調(diào)控網(wǎng)絡(luò)中的生物分子調(diào)控機(jī)制有重大的意義。相比于蛋白質(zhì)作用網(wǎng)絡(luò)、基因調(diào)控網(wǎng)絡(luò)等單一分子類型的調(diào)控網(wǎng)絡(luò),共調(diào)控網(wǎng)絡(luò)規(guī)模更大、節(jié)點(diǎn)類型更多,F(xiàn)有的模體發(fā)現(xiàn)算法難以高效的處理該類型網(wǎng)絡(luò)圖,所以需要設(shè)計(jì)一種更加高效的共調(diào)控網(wǎng)絡(luò)模體發(fā)現(xiàn)算法。本文的主要研究工作如下:1)為了提升共調(diào)控網(wǎng)絡(luò)模體發(fā)現(xiàn)算法的效率,本文將G-trie結(jié)構(gòu)應(yīng)用于共調(diào)控網(wǎng)絡(luò)模體發(fā)現(xiàn)算法,把多種共調(diào)控網(wǎng)絡(luò)模體類型存儲于一棵前綴樹結(jié)構(gòu)中,通過重用查找過程,提升了子圖統(tǒng)計(jì)的效率。并通過多線程技術(shù),實(shí)現(xiàn)了該算法的并行,進(jìn)一步提升了共調(diào)控網(wǎng)絡(luò)模體發(fā)現(xiàn)算法的效率。為了發(fā)現(xiàn)更大規(guī)模的共調(diào)控網(wǎng)絡(luò)模體類型,本文設(shè)計(jì)了一種采樣生成候選子圖的方法,通過該方法本文最多能發(fā)現(xiàn)8個(gè)節(jié)點(diǎn)的共調(diào)控網(wǎng)絡(luò)模體類型。另外,本文根據(jù)共調(diào)控網(wǎng)絡(luò)模體結(jié)構(gòu)在共調(diào)控網(wǎng)絡(luò)中的實(shí)例,發(fā)現(xiàn)了共調(diào)控網(wǎng)絡(luò)模體的團(tuán)簇性特征。2)通過采樣生成候選子圖的方法雖然能查找較大規(guī)模的模體類型,但難以查找共調(diào)控網(wǎng)絡(luò)中全部的模體類型。查找共調(diào)控網(wǎng)絡(luò)中全部的模體類型是一個(gè)NP難問題,計(jì)算量會隨著模體規(guī)模的增加呈指數(shù)增長。為此,本文設(shè)計(jì)一個(gè)基于MapReduce計(jì)算模型的共調(diào)控網(wǎng)絡(luò)模體發(fā)現(xiàn)算法。該算法解決了以往模體發(fā)現(xiàn)算法中迭代依賴問題,以及難以通過MapReduce計(jì)算模型精確統(tǒng)計(jì)網(wǎng)絡(luò)圖中每個(gè)子圖出現(xiàn)頻率的問題,并且通過多線程并行的方法解決了MapReduce計(jì)算模型CPU利用率不足的問題;贛apReduce計(jì)算模型的共調(diào)控網(wǎng)絡(luò)模體發(fā)現(xiàn)算法實(shí)現(xiàn)了對計(jì)算機(jī)資源的融合與高效利用,并極大限度的縮短了在共調(diào)控網(wǎng)絡(luò)中查找全部模體類型的時(shí)間。
【圖文】:
圖2.1共調(diào)控網(wǎng)絡(luò)圖G(V,£)示例逡逑G(K五)被定義為包含miRNA,TF,靶基因以及它們之間的調(diào)控關(guān)系組逡逑成的共調(diào)控網(wǎng)絡(luò),,如圖2.1所示。本文定義V邋=邋{Vw,V,,邋%}作為網(wǎng)絡(luò)中的節(jié)逡逑點(diǎn)集,其中%以及%分別代表miRNA,邋TF以及靶基因集,r(w)表示節(jié)逡逑點(diǎn)w的類型。這里本文采用整數(shù)來表示miRNA,TF以及靶基因等節(jié)點(diǎn)類逡逑型!赍濉赍澹ǎ皱澹澹郑┳鳛檫吋。每一條有向邊e(?,v)邋£邋£表示兩生物分子之間逡逑13逡逑
噪聲中的穩(wěn)定性。從而減少不同細(xì)胞之間蛋白質(zhì)水平的變化。逡逑2)正反饋?zhàn)哉{(diào)控回路(PAR)逡逑正向反饋調(diào)控通常發(fā)生在轉(zhuǎn)錄因子需要提供自身生產(chǎn)速率時(shí)。與NAR模體類逡逑型的作用相反,PAR模體類型減緩了響應(yīng)時(shí)間,該模體類型可能導(dǎo)致細(xì)胞中的蛋逡逑白質(zhì)水平呈雙峰分布。逡逑3)前饋環(huán)路(FFL)逡逑FFL模體類型在基因系統(tǒng)和生物體中比較常見,該模體類型由三個(gè)調(diào)控因子逡逑以及三個(gè)調(diào)控作用組成,靶基因C由兩個(gè)TF(A和B)調(diào)控,另外TFB也由TFA調(diào)逡逑控。由于每種調(diào)控作用可能是可能是抑制作用,也可能是促進(jìn)作用。所以可能逡逑有8種類型的FFL模體類型。其中相干類型lFFL(Cl-FFL)(其中所有的調(diào)控作用都逡逑為促進(jìn))和非相干類型1FFL(11-FFL)(I1-FFL)(A激活C并且還激活B抑制C)被發(fā)現(xiàn)在逡逑大腸桿菌和酵母的轉(zhuǎn)錄網(wǎng)絡(luò)中比其它6種類型出現(xiàn)的更加頻繁。逡逑4)雙扇網(wǎng)絡(luò)模體(Bi-fan)逡逑一
【學(xué)位授予單位】:湖南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP301.6;O157.5
本文編號:2660020
【圖文】:
圖2.1共調(diào)控網(wǎng)絡(luò)圖G(V,£)示例逡逑G(K五)被定義為包含miRNA,TF,靶基因以及它們之間的調(diào)控關(guān)系組逡逑成的共調(diào)控網(wǎng)絡(luò),,如圖2.1所示。本文定義V邋=邋{Vw,V,,邋%}作為網(wǎng)絡(luò)中的節(jié)逡逑點(diǎn)集,其中%以及%分別代表miRNA,邋TF以及靶基因集,r(w)表示節(jié)逡逑點(diǎn)w的類型。這里本文采用整數(shù)來表示miRNA,TF以及靶基因等節(jié)點(diǎn)類逡逑型!赍濉赍澹ǎ皱澹澹郑┳鳛檫吋。每一條有向邊e(?,v)邋£邋£表示兩生物分子之間逡逑13逡逑
噪聲中的穩(wěn)定性。從而減少不同細(xì)胞之間蛋白質(zhì)水平的變化。逡逑2)正反饋?zhàn)哉{(diào)控回路(PAR)逡逑正向反饋調(diào)控通常發(fā)生在轉(zhuǎn)錄因子需要提供自身生產(chǎn)速率時(shí)。與NAR模體類逡逑型的作用相反,PAR模體類型減緩了響應(yīng)時(shí)間,該模體類型可能導(dǎo)致細(xì)胞中的蛋逡逑白質(zhì)水平呈雙峰分布。逡逑3)前饋環(huán)路(FFL)逡逑FFL模體類型在基因系統(tǒng)和生物體中比較常見,該模體類型由三個(gè)調(diào)控因子逡逑以及三個(gè)調(diào)控作用組成,靶基因C由兩個(gè)TF(A和B)調(diào)控,另外TFB也由TFA調(diào)逡逑控。由于每種調(diào)控作用可能是可能是抑制作用,也可能是促進(jìn)作用。所以可能逡逑有8種類型的FFL模體類型。其中相干類型lFFL(Cl-FFL)(其中所有的調(diào)控作用都逡逑為促進(jìn))和非相干類型1FFL(11-FFL)(I1-FFL)(A激活C并且還激活B抑制C)被發(fā)現(xiàn)在逡逑大腸桿菌和酵母的轉(zhuǎn)錄網(wǎng)絡(luò)中比其它6種類型出現(xiàn)的更加頻繁。逡逑4)雙扇網(wǎng)絡(luò)模體(Bi-fan)逡逑一
【學(xué)位授予單位】:湖南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP301.6;O157.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 周琳;孔雷;趙方慶;;生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J];科學(xué)通報(bào);2015年Z1期
2 覃桂敏;高琳;呼加璐;;生物網(wǎng)絡(luò)模體發(fā)現(xiàn)算法研究綜述[J];電子學(xué)報(bào);2009年10期
相關(guān)博士學(xué)位論文 前1條
1 李光輝;蛋白質(zhì)網(wǎng)絡(luò)模體發(fā)現(xiàn)算法及其在關(guān)鍵蛋白質(zhì)識別中的應(yīng)用[D];湖南大學(xué);2015年
本文編號:2660020
本文鏈接:http://sikaile.net/kejilunwen/yysx/2660020.html
最近更新
教材專著