基于Hi-C數(shù)據(jù)的染色質(zhì)三維結(jié)構(gòu)重構(gòu)算法和網(wǎng)絡(luò)服務(wù)
發(fā)布時間:2020-12-10 20:22
染色質(zhì)的三維結(jié)構(gòu)在基因表達調(diào)控、細胞發(fā)育以及遺傳疾病發(fā)生等過程中發(fā)揮著重要的作用。隨著染色質(zhì)構(gòu)象捕獲技術(shù)及其衍生技術(shù)的發(fā)展,尤其是全基因組范圍內(nèi)捕獲染色質(zhì)交互的Hi-C技術(shù)的出現(xiàn),現(xiàn)已獲得大量的染色質(zhì)交互頻率數(shù)據(jù)。如何利用這些數(shù)據(jù)重構(gòu)出染色質(zhì)的三維構(gòu)象,已經(jīng)成為三維基因組學領(lǐng)域的一個重要研究方向。目前已有的重構(gòu)算法主要分為兩類:基于熱力學的方法和基于距離約束的方法。這些重構(gòu)方法的應用有助于揭示染色質(zhì)結(jié)構(gòu)的形成機制及其生物學功能。本文提出了一種基于共聚集系數(shù)和誤差矢量合成的三維結(jié)構(gòu)重構(gòu)算法——EVRC算法。該算法首先計算染色質(zhì)片段間的共聚集系數(shù),然后將一個片段的所有誤差矢量加和,通過不斷迭代優(yōu)化,重構(gòu)出染色質(zhì)的三維結(jié)構(gòu)。為了評價算法的有效性和準確性,我們將其應用于六種典型結(jié)構(gòu)的模擬數(shù)據(jù)集和真實的Hi-C數(shù)據(jù)集。在不同轉(zhuǎn)換參數(shù)與隨機噪聲下,重構(gòu)從簡單到復雜的六種模擬結(jié)構(gòu)時,結(jié)果顯示,重構(gòu)結(jié)構(gòu)與真實結(jié)構(gòu)之間均具有很高的相似性,表明了EVRC算法的有效性和魯棒性。應用于真實的Hi-C數(shù)據(jù)時,我們首先對野生型擬南芥的5條染色體在不同分辨率下進行三維重構(gòu),顯示了染色體間的結(jié)構(gòu)特征差異。在重構(gòu)野生型...
【文章來源】:華中農(nóng)業(yè)大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
及其衍生技術(shù)(BonevandCav.lli2016)
基于 Hi-C 數(shù)據(jù)的染色質(zhì)三維結(jié)構(gòu)重構(gòu)算法和網(wǎng)絡(luò)服務(wù) 。式中, 表示 中節(jié)點兩兩連接的邊數(shù)目。在實際交互網(wǎng)絡(luò)中, 之間存在連接的邊數(shù)目為 ,那么節(jié)點 和 的共聚集系數(shù)為: 。式中, 表示節(jié)點 和 的共聚集系數(shù)(圖 2)。 越接近 1,表明 和 在染色質(zhì)三維結(jié)構(gòu)中聚集傾向越大,比如位于 TAD 區(qū)域中的 。我們把共聚集系數(shù)作為三維結(jié)構(gòu)重構(gòu)的重要參數(shù)。
個時刻 和 的位置關(guān)系如圖 3(A)所示, 和 表示對應的位置矢量, 表示 的單位矢量, 表示 和 之間的空間距離, 和 之間的誤差矢量為 ,其表達式如下: | | | | 。根據(jù) Hi-C 分辨率的不同, 自身具有一定的線性長度(即核苷酸數(shù)目),折疊后形成空間結(jié)構(gòu)。而染色質(zhì)折疊狀態(tài)不同,空間結(jié)構(gòu)的直徑也不同。我們假定單個 的最大直徑為 ,最小直徑為 。雖然 Hi-C 數(shù)據(jù)處理后的交互矩陣通過負指數(shù)關(guān)系轉(zhuǎn)換為了空間距離矩陣,但由于實驗誤差等原因,某些空間距離信息并不準確。因此,我們可以根據(jù)距離閾值條件來矯正誤差矢量計算。根據(jù) 和 在基因組上的線性關(guān)系,該算法又可分為兩個部分:1. 計算線性不相鄰的 之間的誤差矢量。不相鄰的 和 之間的最小距離
本文編號:2909314
【文章來源】:華中農(nóng)業(yè)大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
及其衍生技術(shù)(BonevandCav.lli2016)
基于 Hi-C 數(shù)據(jù)的染色質(zhì)三維結(jié)構(gòu)重構(gòu)算法和網(wǎng)絡(luò)服務(wù) 。式中, 表示 中節(jié)點兩兩連接的邊數(shù)目。在實際交互網(wǎng)絡(luò)中, 之間存在連接的邊數(shù)目為 ,那么節(jié)點 和 的共聚集系數(shù)為: 。式中, 表示節(jié)點 和 的共聚集系數(shù)(圖 2)。 越接近 1,表明 和 在染色質(zhì)三維結(jié)構(gòu)中聚集傾向越大,比如位于 TAD 區(qū)域中的 。我們把共聚集系數(shù)作為三維結(jié)構(gòu)重構(gòu)的重要參數(shù)。
個時刻 和 的位置關(guān)系如圖 3(A)所示, 和 表示對應的位置矢量, 表示 的單位矢量, 表示 和 之間的空間距離, 和 之間的誤差矢量為 ,其表達式如下: | | | | 。根據(jù) Hi-C 分辨率的不同, 自身具有一定的線性長度(即核苷酸數(shù)目),折疊后形成空間結(jié)構(gòu)。而染色質(zhì)折疊狀態(tài)不同,空間結(jié)構(gòu)的直徑也不同。我們假定單個 的最大直徑為 ,最小直徑為 。雖然 Hi-C 數(shù)據(jù)處理后的交互矩陣通過負指數(shù)關(guān)系轉(zhuǎn)換為了空間距離矩陣,但由于實驗誤差等原因,某些空間距離信息并不準確。因此,我們可以根據(jù)距離閾值條件來矯正誤差矢量計算。根據(jù) 和 在基因組上的線性關(guān)系,該算法又可分為兩個部分:1. 計算線性不相鄰的 之間的誤差矢量。不相鄰的 和 之間的最小距離
本文編號:2909314
本文鏈接:http://sikaile.net/projectlw/swxlw/2909314.html
最近更新
教材專著