Hi-C輔助棉花基因組組裝
發(fā)布時間:2022-01-05 06:02
棉花是重要的天然纖維作物,在國民經濟中占有重要地位。隨著棉花基因組測序工作的深入展開,因棉花染色體小而多、基因組大、重復序列豐富等因素的存在,致使測序后基因組裝配困難,甚至出現不正確拼接。Hi-C(High-throughput Chromosome Conformation Capture)技術即高通量染色質構象捕獲技術,是以整個細胞核為研究對象,在全基因組范圍內研究整個染色質DNA在空間位置上的關系,通過對染色質內全部DNA相互作用模式進行捕獲,獲得高分辨率的染色質三維結構信息。真核生物的Hi-C分析中顯示了兩種經典交互的模式,一種為順式-反式比模式,即同一條染色體上的兩位點間的交互頻率顯著高于不同染色體上兩位點間的交互頻率,基于這一模式,通過對Hi-C數據進行聚類,可以將測序得到的scaffold劃分到相應的染色體上。另一種為距離依賴性衰減模式(distance-dependent-decay,DDD),即交互頻率會隨著兩位點的距離的增大而減小,基于該模式,可以對聚類好的scaffold進行排序定向。我們所已經于2012年完成了對雷蒙德氏棉的測序工作。但是由于遺傳圖譜的密度不高,...
【文章來源】:中國農業(yè)科學院北京市
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
Hi-C技術原理(Beltonetal.2012)
從而進行基因組組裝(Xie et al. 2015; Korbel et al. 2013)。1.6.4 解析調控元件與基因的作用模式許多調控元件與基因的作用模式都是遠程交互模式,即一維序列上與靶基因相差比控元件,會通過折疊盤曲等方式在三維空間上靠近靶基因,從而發(fā)揮作用。通過對原據進行標準化,去掉數據的背景噪聲,即可找出真正的功能交互,若 Hi-C 數據的分辨比如人類的 Hi-C 數據的分辨率可以達到 1kb,便可以找出相應的調控元件和靶基因,從們的作用模式(Lu et al. 2013; Mifsud et al. 2015)。1.6.5 染色體相互作用差異比較分析通過比較不同發(fā)育階段或不同處理下測出的某物種的 Hi-C 數據,分析染色質在不段或不同處理下的結構變化,從而分析不同發(fā)育階段的基因的調控模式,或者不同處理結構的影響(Mcgovern et al. 2016; Feng et al. 2014)。1.7 Hi-C 輔助基因組組裝Hi-C 輔助基因組組裝的主要過程如圖 1.2 所示:
圖 1.3 利用 Hi-C 數據組裝基因組示意圖(Burton et al. 2013)Figure1.3 The pipline of genome assembly based on Hi-C data(Burton et al. 2013)a:將已經組裝好的 contig/scaffold 及其對應的全基因組 Hi-C 數據作為輸入文件。b:根據 Hi-C 數據的第一個經典模式間位點的交互顯著低于染色體內部位點的交互,Lachesis 通過該原理將 contig/scaffold 進行聚類分群,確定其所在的染色體Hi-C 數據的第一個經典模式,即距離越近的兩位點的交互越高,Lachesis 通過該原理將 contig/scaffold 進行排序。d:最后,件利用相鄰 contig/scaffold 之間交互的精確位置信息來預測每個 contig/scaffold 的相對方向(Burton et al. 2013)。1.8 Hi-C 輔助基因組組裝研究現狀Hi-C 技術最早用在研究人類染色體構象,結果表明,染色體中任意兩個 DNA 位點互強弱與它們的一維空間距離密切相關。因此,Job Dekker 等研究者認為,基因組上兩位一維物理距離可以根據 Hi-C 技術捕獲到的交互頻率衡量,所以可以用 Hi-C 數據來輔助基裝(Burton et al. 2013; Kaplan and Dekker 2013)。Dekker 和他的同事用 Hi-C 數據結合鳥槍法測序序列以及短序配對(short jump mate庫序列得到的 scaffold 數據(Nagarajan et al. 2013),重新組裝了人類基因組,其中定位尚未錨定到染色體上的 scaffold,其定位結果與其他方法得出的結論一致性高達 84%。其中聚類掛載到染色體的準確率更是高達 98%,而排序和定向的準確率也是高達到 99%(Ka
本文編號:3569875
【文章來源】:中國農業(yè)科學院北京市
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
Hi-C技術原理(Beltonetal.2012)
從而進行基因組組裝(Xie et al. 2015; Korbel et al. 2013)。1.6.4 解析調控元件與基因的作用模式許多調控元件與基因的作用模式都是遠程交互模式,即一維序列上與靶基因相差比控元件,會通過折疊盤曲等方式在三維空間上靠近靶基因,從而發(fā)揮作用。通過對原據進行標準化,去掉數據的背景噪聲,即可找出真正的功能交互,若 Hi-C 數據的分辨比如人類的 Hi-C 數據的分辨率可以達到 1kb,便可以找出相應的調控元件和靶基因,從們的作用模式(Lu et al. 2013; Mifsud et al. 2015)。1.6.5 染色體相互作用差異比較分析通過比較不同發(fā)育階段或不同處理下測出的某物種的 Hi-C 數據,分析染色質在不段或不同處理下的結構變化,從而分析不同發(fā)育階段的基因的調控模式,或者不同處理結構的影響(Mcgovern et al. 2016; Feng et al. 2014)。1.7 Hi-C 輔助基因組組裝Hi-C 輔助基因組組裝的主要過程如圖 1.2 所示:
圖 1.3 利用 Hi-C 數據組裝基因組示意圖(Burton et al. 2013)Figure1.3 The pipline of genome assembly based on Hi-C data(Burton et al. 2013)a:將已經組裝好的 contig/scaffold 及其對應的全基因組 Hi-C 數據作為輸入文件。b:根據 Hi-C 數據的第一個經典模式間位點的交互顯著低于染色體內部位點的交互,Lachesis 通過該原理將 contig/scaffold 進行聚類分群,確定其所在的染色體Hi-C 數據的第一個經典模式,即距離越近的兩位點的交互越高,Lachesis 通過該原理將 contig/scaffold 進行排序。d:最后,件利用相鄰 contig/scaffold 之間交互的精確位置信息來預測每個 contig/scaffold 的相對方向(Burton et al. 2013)。1.8 Hi-C 輔助基因組組裝研究現狀Hi-C 技術最早用在研究人類染色體構象,結果表明,染色體中任意兩個 DNA 位點互強弱與它們的一維空間距離密切相關。因此,Job Dekker 等研究者認為,基因組上兩位一維物理距離可以根據 Hi-C 技術捕獲到的交互頻率衡量,所以可以用 Hi-C 數據來輔助基裝(Burton et al. 2013; Kaplan and Dekker 2013)。Dekker 和他的同事用 Hi-C 數據結合鳥槍法測序序列以及短序配對(short jump mate庫序列得到的 scaffold 數據(Nagarajan et al. 2013),重新組裝了人類基因組,其中定位尚未錨定到染色體上的 scaffold,其定位結果與其他方法得出的結論一致性高達 84%。其中聚類掛載到染色體的準確率更是高達 98%,而排序和定向的準確率也是高達到 99%(Ka
本文編號:3569875
本文鏈接:http://sikaile.net/nykjlw/nzwlw/3569875.html
最近更新
教材專著