基于Hi-C數(shù)據(jù)的染色質(zhì)三維結(jié)構(gòu)重構(gòu)算法和網(wǎng)絡(luò)服務(wù)
發(fā)布時(shí)間:2020-12-10 20:22
染色質(zhì)的三維結(jié)構(gòu)在基因表達(dá)調(diào)控、細(xì)胞發(fā)育以及遺傳疾病發(fā)生等過程中發(fā)揮著重要的作用。隨著染色質(zhì)構(gòu)象捕獲技術(shù)及其衍生技術(shù)的發(fā)展,尤其是全基因組范圍內(nèi)捕獲染色質(zhì)交互的Hi-C技術(shù)的出現(xiàn),現(xiàn)已獲得大量的染色質(zhì)交互頻率數(shù)據(jù)。如何利用這些數(shù)據(jù)重構(gòu)出染色質(zhì)的三維構(gòu)象,已經(jīng)成為三維基因組學(xué)領(lǐng)域的一個(gè)重要研究方向。目前已有的重構(gòu)算法主要分為兩類:基于熱力學(xué)的方法和基于距離約束的方法。這些重構(gòu)方法的應(yīng)用有助于揭示染色質(zhì)結(jié)構(gòu)的形成機(jī)制及其生物學(xué)功能。本文提出了一種基于共聚集系數(shù)和誤差矢量合成的三維結(jié)構(gòu)重構(gòu)算法——EVRC算法。該算法首先計(jì)算染色質(zhì)片段間的共聚集系數(shù),然后將一個(gè)片段的所有誤差矢量加和,通過不斷迭代優(yōu)化,重構(gòu)出染色質(zhì)的三維結(jié)構(gòu)。為了評(píng)價(jià)算法的有效性和準(zhǔn)確性,我們將其應(yīng)用于六種典型結(jié)構(gòu)的模擬數(shù)據(jù)集和真實(shí)的Hi-C數(shù)據(jù)集。在不同轉(zhuǎn)換參數(shù)與隨機(jī)噪聲下,重構(gòu)從簡(jiǎn)單到復(fù)雜的六種模擬結(jié)構(gòu)時(shí),結(jié)果顯示,重構(gòu)結(jié)構(gòu)與真實(shí)結(jié)構(gòu)之間均具有很高的相似性,表明了EVRC算法的有效性和魯棒性。應(yīng)用于真實(shí)的Hi-C數(shù)據(jù)時(shí),我們首先對(duì)野生型擬南芥的5條染色體在不同分辨率下進(jìn)行三維重構(gòu),顯示了染色體間的結(jié)構(gòu)特征差異。在重構(gòu)野生型...
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
及其衍生技術(shù)(BonevandCav.lli2016)
基于 Hi-C 數(shù)據(jù)的染色質(zhì)三維結(jié)構(gòu)重構(gòu)算法和網(wǎng)絡(luò)服務(wù) 。式中, 表示 中節(jié)點(diǎn)兩兩連接的邊數(shù)目。在實(shí)際交互網(wǎng)絡(luò)中, 之間存在連接的邊數(shù)目為 ,那么節(jié)點(diǎn) 和 的共聚集系數(shù)為: 。式中, 表示節(jié)點(diǎn) 和 的共聚集系數(shù)(圖 2)。 越接近 1,表明 和 在染色質(zhì)三維結(jié)構(gòu)中聚集傾向越大,比如位于 TAD 區(qū)域中的 。我們把共聚集系數(shù)作為三維結(jié)構(gòu)重構(gòu)的重要參數(shù)。
個(gè)時(shí)刻 和 的位置關(guān)系如圖 3(A)所示, 和 表示對(duì)應(yīng)的位置矢量, 表示 的單位矢量, 表示 和 之間的空間距離, 和 之間的誤差矢量為 ,其表達(dá)式如下: | | | | 。根據(jù) Hi-C 分辨率的不同, 自身具有一定的線性長(zhǎng)度(即核苷酸數(shù)目),折疊后形成空間結(jié)構(gòu)。而染色質(zhì)折疊狀態(tài)不同,空間結(jié)構(gòu)的直徑也不同。我們假定單個(gè) 的最大直徑為 ,最小直徑為 。雖然 Hi-C 數(shù)據(jù)處理后的交互矩陣通過負(fù)指數(shù)關(guān)系轉(zhuǎn)換為了空間距離矩陣,但由于實(shí)驗(yàn)誤差等原因,某些空間距離信息并不準(zhǔn)確。因此,我們可以根據(jù)距離閾值條件來矯正誤差矢量計(jì)算。根據(jù) 和 在基因組上的線性關(guān)系,該算法又可分為兩個(gè)部分:1. 計(jì)算線性不相鄰的 之間的誤差矢量。不相鄰的 和 之間的最小距離
本文編號(hào):2909314
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
及其衍生技術(shù)(BonevandCav.lli2016)
基于 Hi-C 數(shù)據(jù)的染色質(zhì)三維結(jié)構(gòu)重構(gòu)算法和網(wǎng)絡(luò)服務(wù) 。式中, 表示 中節(jié)點(diǎn)兩兩連接的邊數(shù)目。在實(shí)際交互網(wǎng)絡(luò)中, 之間存在連接的邊數(shù)目為 ,那么節(jié)點(diǎn) 和 的共聚集系數(shù)為: 。式中, 表示節(jié)點(diǎn) 和 的共聚集系數(shù)(圖 2)。 越接近 1,表明 和 在染色質(zhì)三維結(jié)構(gòu)中聚集傾向越大,比如位于 TAD 區(qū)域中的 。我們把共聚集系數(shù)作為三維結(jié)構(gòu)重構(gòu)的重要參數(shù)。
個(gè)時(shí)刻 和 的位置關(guān)系如圖 3(A)所示, 和 表示對(duì)應(yīng)的位置矢量, 表示 的單位矢量, 表示 和 之間的空間距離, 和 之間的誤差矢量為 ,其表達(dá)式如下: | | | | 。根據(jù) Hi-C 分辨率的不同, 自身具有一定的線性長(zhǎng)度(即核苷酸數(shù)目),折疊后形成空間結(jié)構(gòu)。而染色質(zhì)折疊狀態(tài)不同,空間結(jié)構(gòu)的直徑也不同。我們假定單個(gè) 的最大直徑為 ,最小直徑為 。雖然 Hi-C 數(shù)據(jù)處理后的交互矩陣通過負(fù)指數(shù)關(guān)系轉(zhuǎn)換為了空間距離矩陣,但由于實(shí)驗(yàn)誤差等原因,某些空間距離信息并不準(zhǔn)確。因此,我們可以根據(jù)距離閾值條件來矯正誤差矢量計(jì)算。根據(jù) 和 在基因組上的線性關(guān)系,該算法又可分為兩個(gè)部分:1. 計(jì)算線性不相鄰的 之間的誤差矢量。不相鄰的 和 之間的最小距離
本文編號(hào):2909314
本文鏈接:http://sikaile.net/projectlw/swxlw/2909314.html
最近更新
教材專著