天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 理工論文 > 生物學論文 >

單倍型Hi-C軟件的開發(fā)與應用

發(fā)布時間:2020-07-12 04:37
【摘要】:基于染色體構象捕獲技術及其衍生技術(如Hi-C)的研究表明,染色質高階結構在轉錄調控、DNA復制、早期胚胎發(fā)育以及疾病發(fā)生等過程中發(fā)揮著重要的作用。近年來,人們利用已定相遺傳變異來區(qū)分二倍體細胞中同源染色體的高階結構,發(fā)現(xiàn)父本染色質高階結構和母本染色質高階結構在特定區(qū)間或者特定發(fā)育階段存在著顯著差異,即染色質高階結構具有等位效應,并且染色質高階結構等位效應在調控等位特異性基因表達方面可能起著重要作用。本文將這種使用已定相遺傳變異把Hi-C數(shù)據(jù)區(qū)分為父本和母本染色質互作的研究簡稱為單倍型Hi-C(haplotype-resolved Hi-C)。然而,由于遺傳變異數(shù)量有限且分布不均衡,單倍型Hi-C的數(shù)據(jù)利用率較低并且數(shù)據(jù)偏好很強,因此優(yōu)化單倍型Hi-C數(shù)據(jù)處理和結構識別對于提高單倍型染色質高階結構識別的精度和準確性具有重要意義。本文開發(fā)了一種新型單倍型Hi-C軟件HiCHap,主要功能包括利用Hi-C讀段的所有序列信息來提高單倍型數(shù)據(jù)利用率,使用兩步校正策略分別校正遺傳變異分布密度不均衡和Hi-C實驗引起的單倍型數(shù)據(jù)偏好,使用新的識別方法得到單倍型染色質高階結構。最后本文使用HiCHap軟件初步研究了染色質環(huán)等位特異性與關鍵轉錄因子等位效應之間的關聯(lián)。首先,HiCHap軟件利用了Hi-C讀段上所有序列的雜合單核苷酸多態(tài)性(SNP)來提高數(shù)據(jù)利用率。傳統(tǒng)Hi-C序列比對通常使用了切割連接位點或迭代切割方法,這個過程中丟棄了部分序列,本文對切割連接位點后的所有序列都進行序列比對,充分利用Hi-C讀段上所有序列的雜合SNPs來提高單倍型Hi-C的數(shù)據(jù)利用率。其次,HiCHap軟件使用兩步校正策略分別校正了SNP分布密度不均衡和Hi-C實驗引起的單倍型數(shù)據(jù)偏好,并構建了單倍型染色質互作矩陣。由于遺傳變異分布密度與單倍型數(shù)據(jù)利用率之間的關系復雜,HiCHap直接使用該區(qū)間單倍型數(shù)據(jù)利用率來間接衡量遺傳變異分布密度的影響,并結合非對稱陣策略來對遺傳變異分布密度不均衡引起的單倍型Hi-C數(shù)據(jù)偏好進行第一步校正。接著,將第一步校正后的非對稱陣對稱化,并使用矩陣平衡算法消除Hi-C實驗引起的數(shù)據(jù)噪聲,進行第二步數(shù)據(jù)偏好校正。經過與傳統(tǒng)方法比較,本文校正算法在多個評價指標上都表現(xiàn)良好。再次,以染色質環(huán)為例,本文通過調整傳統(tǒng)算法識別了單倍型染色質環(huán),并在整合單倍型染色質環(huán)和傳統(tǒng)非單倍型染色質環(huán)的基礎上使用二項分布檢驗了父本染色質環(huán)和母本染色質環(huán)的差異顯著性,識別和篩選等位特異性染色質環(huán)。最后,本文使用HiCHap軟件分析了等位特異性染色質環(huán)與關鍵轉錄因子(如CTCF和Cohesin)結合位點等位效應之間的關聯(lián),發(fā)現(xiàn)等位特異性染色質環(huán)上往往也存在著等位特異性轉錄因子結合位點,并且染色質環(huán)等位效應與轉錄因子的等位效應呈現(xiàn)出一定程度的正相關性,暗示著關鍵轉錄因子結合位點的等位效應可能是引起等位特異性染色質環(huán)的重要原因之一。
【學位授予單位】:華中農業(yè)大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:Q811.4;TP311.52
【圖文】:

技術原理


圖 1.1 Hi-C 技術原理圖 (Lieberman-Aiden et al 2009)Fig. 1.1 Principle and technology pipeline of Hi-C.(Lieberman-Aiden et al 2009)二代測序技術的興起,基因組學研究走向了高通量時代,染色體構象捕獲技術也獲得了長足發(fā)展。2009 年,Liberman-Aiden 等人和 Fullwood 等人分別開發(fā)了 Hi-C(Liberman-Aiden et al 2009)和 ChIA-PET(Fullwood et al 2009)技術,旨在使用高通量測序捕獲全基因組范圍內的染色質互作。以 Hi-C 技術為例(如圖 1.1),該技術試圖捕獲全基因組范圍內所有染色質互作,其主要實驗流程為:首先利用甲醛將染色質互作進行交聯(lián),然后利用限制性內切酶將染色質切成短片段,并利用有生物素標記的核苷酸將限制性酶切片段末端補平,接著在 DNA 濃度較低的環(huán)境中將交聯(lián)的 DNA 片段連接起來,然后將連接產物用超聲波打斷、生物素標記并且純化,最后利用雙端測序來測定互作片段。在 Hi-C 實驗流程基礎上,Rao 等人于 2014 年開發(fā)了原位 Hi-C(in situ Hi-C)技術,進一步捕獲了

染色質結構,拓撲,互作,結構域


3圖 1.2 染色質結構的層次化(Bonev and Cavalli 2016)A)圖展示了一個從高分辨率 Hi-C 數(shù)據(jù)觀察到的染色質環(huán)(loop)和 CTCF 的結合情況以及 motif 的。(B)左圖接近 8Mb 區(qū)域包含了數(shù)個拓撲關聯(lián)結構域(TADs),右圖展示了三種不同的拓撲關聯(lián)結構意圖;(C)不同拓撲關聯(lián)結構域都具有內部結構域強互作的特點,并一起組成區(qū)室;(D)左圖是以熱形式對染色質之間互作的一種展示,右圖展示了染色質疆域。Fig. 1.2 Hierarchical organization of chromatin structure (Bonev and Cavalli 2016)A) The figure is an example of an architectural loop as seen in high-resolution Hi C data, as well as CCCTinding factor (CTCF)-binding profile and CTCF motif orientation. (B) The left figure is an approximately 8 egion containing several topologically associating domains (TADs) as seen in the heat map. three different TAre shown on the right.(C) Different topological domains are characterized by stronger inter-domain interactions are organized into compartments.(D) Interaction matrix of the inter-chromosome is shown as heatmap on the lhromatin territory is shown on the right.

變化過程圖,單倍型,染色質結構,變化過程


通過模式小鼠進行雜交,研究者們使用 Hi-C 技術研究了早期胚胎發(fā)育過程(Du et al 2017, Ke et al 2017)。通過單倍型染色質高階結構分析,揭示了哺乳動物受精前后父本和母本染色質高階結構在早期發(fā)育過程中的變化。如圖1.3所示,研究者發(fā)現(xiàn)在精子和卵子結合之前,精細胞保留了拓撲關聯(lián)結構域和區(qū)室等染色質高階結構。相反,卵細胞染色質丟失了這些結構。受精后,盡管精子和卵子已經融合,但父本和母本單倍型染色質在染色質高階結構上仍然存在差異。這種差異一直從受精開始后延續(xù)到 8 細胞時期(Du et al 2017)。圖 1.3 小鼠胚胎細胞發(fā)育早期單倍型染色質結構變化過程(Du et al 2017)Fig. 1.3 The changes in haplotype chromatin structure during early development of mouseembryonic cell (Du et al 2017)隨著研究深入,研究者們發(fā)現(xiàn)等位基因特異性表達和單倍型染色質高階結構同樣有著密切關系,如圖 1.4 所示,在人類第 11 號染色體上存在著兩個印記基因 IGF2 和 H19

【相似文獻】

相關期刊論文 前10條

1 孫逸平;安家賓;戴澄清;江載芳;李馳;王忠仁;;結核病的發(fā)病與白細胞抗原單倍型關聯(lián)[J];中日友好醫(yī)院學報;1988年03期

2 李雙雙;張迎新;范成明;陳宇紅;鄧傳良;胡贊民;;單倍型分析技術研究進展[J];生物工程學報;2018年06期

3 劉平;任維賓;楊瑛;陳曉鳴;楊子祥;;角倍蚜細胞色素氧化酶(CO Ⅰ)基因的多樣性分析[J];生物資源;2018年01期

4 郭茂東;王群英;陳燕萍;滕衛(wèi)軍;馬擁軍;楊小云;韋煒;丁進;;IL-12B基因多態(tài)性及單倍型與克羅恩病的關系研究[J];浙江醫(yī)學;2018年09期

5 宣澤義;曹艷紅;吳柱月;黃明光;陳少梅;王凱悅;陳宏;雷初朝;;南寧市肉牛的Y染色體遺傳多樣性分析[J];中國牛業(yè)科學;2019年03期

6 張森;李輝;;單倍型在QTL檢測中的應用研究[J];中國農業(yè)科學;2007年04期

7 夏小婷;鄒勇;黨瑞華;黃永震;藍賢勇;陳宏;雷初朝;;關嶺牛Y染色體遺傳多樣性與父系起源研究[J];中國牛業(yè)科學;2017年06期

8 薛敏;潘芹芹;繆扣榮;周小玉;趙星;樊u&;唐燕;汪承亞;;127個家系的HLA-A、B、DR單倍型分析[J];中國輸血雜志;2006年01期

9 袁寶軍,頡玉欣,鄒吉敏,安新,李偉,張志欣;2型糖尿病家系人類白細胞抗原DRB1~*和DQB1~*單倍型分析[J];中華老年多器官疾病雜志;2004年03期

10 錢恩芳;吳文靜;王磊;王小娟;劉楊;馬泉;趙慧;李彩霞;黃江;江麗;;Y-STRs和Y-SNPs綜合分析方法在父系家系調查中的應用[J];南京醫(yī)科大學學報(自然科學版);2019年08期

相關會議論文 前5條

1 周在威;顏景斌;李華;任兆瑞;;利用高分辨率熔點曲線技術對牛線粒體DNA進行單倍型分析[A];遺傳學與社會可持續(xù)發(fā)展——2010中國青年遺傳學家論壇論文摘要匯編[C];2010年

2 李佳麗;陳陽;劉明;陳秋燃;周娟;吳信生;;MLPH基因多態(tài)性位點與獺兔毛色的關聯(lián)性分析[A];中國畜牧獸醫(yī)學會養(yǎng)兔學分會第二屆學術交流大會論文集[C];2018年

3 孟新展;王沈同;張猛;黨云飛;李立森;黃文吉;方圓;王豐;沈玉幫;李家樂;;草魚野生與選育群體線粒體DNA控制區(qū)(D-loop)遺傳變異分析[A];2018年中國水產學會學術年會論文摘要集[C];2018年

4 陳興;王超;王益;周永紅;;四倍體小麥NRAMP2、3、5和6轉運蛋白的單倍型分析[A];第十屆全國小麥基因組學及分子育種大會摘要集[C];2019年

5 李艷華;趙興波;王小花;李寧;吳常信;;豬UCP3基因多態(tài)的發(fā)現(xiàn)與單倍型分析[A];第十次全國畜禽遺傳標記研討會論文集[C];2006年

相關博士學位論文 前9條

1 王雅美;小麥胚乳ADP-葡萄糖轉運蛋白編碼基因TaBT1的遺傳效應和育種選擇研究[D];中國農業(yè)科學院;2018年

2 史素琴;LGR4基因多態(tài)性和單倍型與女性峰值骨密度及肥胖表型核心家系的關聯(lián)分析[D];鄭州大學;2018年

3 錢亞屏;中國云南5個民族的遺傳多樣性研究[D];中國協(xié)和醫(yī)科大學;1999年

4 朱文圣;基因型常有誤差時單倍型分析的統(tǒng)計方法[D];東北師范大學;2006年

5 于揚;染色體5q31區(qū)Graves病易感基因的研究和中國漢族人單倍型域的構建[D];中國醫(yī)科大學;2007年

6 苗麗麗;小麥蛋白激酶基因TaSnRK2.3/4單核苷酸多態(tài)性及其與農藝性狀的關聯(lián)分析[D];東北農業(yè)大學;2017年

7 樊慶燦;京海黃雞部分重要經濟性狀的全基因組關聯(lián)分析研究[D];揚州大學;2014年

8 林衡;玉米重要農藝性狀和抗病性狀的全基因組關聯(lián)分析[D];中國農業(yè)科學院;2015年

9 張杰;杜洛克×二花臉F_2資源群體免疫相關性狀全基因組關聯(lián)分析及候選基因功能初步研究[D];華中農業(yè)大學;2017年

相關碩士學位論文 前10條

1 羅瀚;單倍型Hi-C軟件的開發(fā)與應用[D];華中農業(yè)大學;2019年

2 吳亞江;線粒體基因組揭示中國家雞的母系歷史[D];云南大學;2018年

3 周晶;法醫(yī)個體識別微單倍型標記的篩選及NGS檢測體系的建立[D];河北醫(yī)科大學;2019年

4 李致偉;基于選擇信號和關聯(lián)分析鑒定溫帶和熱帶玉米中優(yōu)勢單倍型和關聯(lián)基因[D];中國農業(yè)科學院;2019年

5 鄭潔;通過靶向捕獲測序和HaCaT細胞實驗鑒定與AD相關的TMEM232基因[D];安徽醫(yī)科大學;2019年

6 王柳;引物限制合成測序分析PCR產物單倍型的研究[D];東南大學;2018年

7 潘榮芳;不同步合成焦測序分析單倍型的研究[D];東南大學;2017年

8 陳翠敏;應用微衛(wèi)星多態(tài)位點對X連鎖型視網膜色素變性疾病進行遺傳連鎖分析的研究[D];第三軍醫(yī)大學;2006年

9 高敏;全基因組掃描定位遺傳性對稱性色素異常癥易感區(qū)域[D];安徽醫(yī)科大學;2003年

10 黃毅;鵝黑素皮質素受體-4基因(MC4R)單核苷酸多態(tài)性分析與生產性狀相關研究[D];四川農業(yè)大學;2009年



本文編號:2751430

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2751430.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶cd35f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com