基于BioNano圖譜的基因組結構變異檢測方法研究和應用
發(fā)布時間:2017-11-12 20:28
本文關鍵詞:基于BioNano圖譜的基因組結構變異檢測方法研究和應用
更多相關文章: BioNano圖譜 基因組結構變異 隱馬爾科夫模型 拷貝數(shù)多態(tài)性
【摘要】:基因組結構變異(SVs)是遺傳多態(tài)性的重要組成部分,也是一些疾病發(fā)生的重要原因。隨著生物技術的提高,對于全基因組結構變異的檢測與分析成為可能,這對生物學和醫(yī)學產(chǎn)生了深遠的影響。在理想的情況下,人們希望在核苷酸水平上完整地記錄一個采樣基因組,再與參考序列進行比對從而更加精確地檢測結構變異。盡管我們現(xiàn)在完成了一些物種基因組的參考序列的檢測,但是由于實驗設備、實驗環(huán)境、項目經(jīng)費等各種原因,這一想法仍然不能實現(xiàn)。為了應對這些挑戰(zhàn),我們采用了高通量、高性價比的基因組BioNano光學圖譜技術,使用長單分子(大于150 KB)來全面揭示基因組的結構變異。對于小的生物(如微生物)的基因組,光學圖譜的使用已經(jīng)是非常普遍的了。而對于大型生物(如哺乳動物)的基因組,光學圖譜的使用也在飛速發(fā)展。然而,這一發(fā)展,提出了重要的新的計算問題和統(tǒng)計問題。參考基因組與取樣基因組相比較,兩者的不同可能就是變異,但也有可能是數(shù)據(jù)本身的問題。在本篇論文中,我們探討了在大基因組的背景下,利用光學圖譜數(shù)據(jù)所產(chǎn)生的統(tǒng)計問題。特別地,我們強調突出了在光學圖譜數(shù)據(jù)中的誤差并對其進行模型。同時,我們利用隱馬爾科夫模型對得到的拷貝數(shù)數(shù)據(jù)進行建模,來檢測基因組中拷貝數(shù)的多態(tài)性。這里描述的拷貝數(shù)分析方法是一個快速的簡單的工具,能夠有效地對光學圖譜的基于組裝的分析進行補充說明。本文選取人類基因組YH數(shù)據(jù)的BioNano光學圖譜數(shù)據(jù)作為樣本數(shù)據(jù),人類基因組參考版本hg19(Human Genome version 19)作為參考基因組數(shù)據(jù),對22條常染色體和兩條性染色體進行比對研究。通過將BioNano光學圖譜數(shù)據(jù)YH進行讀取和拼裝,與基因組參考序列進行比對,利用分子大小誤差統(tǒng)計模型和位點誤差模型,我們獲得了長度大于1 KB的698個插入/缺失和19個倒置。去除與參考序列hg19的N-base空缺重疊的62個結構變異,我們保留了636個非空缺的結構變異,并且有604個(約占95%)能得到公共數(shù)據(jù)庫中的歷史證據(jù)或者實驗正交方法的支持。同時,本文使用隱馬爾科夫模型對基因組中拷貝數(shù)的多態(tài)性進行檢測研究,擬合得到的狀態(tài)走向與基因組的拷貝數(shù)變化相一致,效果非常顯著。本文基于BioNano光學圖譜的基因組結構變異的檢測方法是一個比較全面的和具有成效的方法,希望能為后續(xù)的基因組結構變異的研究提供一些參考。
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:C81
【相似文獻】
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 李淑禎;基于BioNano圖譜的基因組結構變異檢測方法研究和應用[D];上海師范大學;2016年
,本文編號:1177488
本文鏈接:http://sikaile.net/shekelunwen/shgj/1177488.html
最近更新
教材專著