基于二代測序的目標(biāo)區(qū)段SNP識別數(shù)據(jù)流的建立與比較分析
發(fā)布時間:2017-07-07 05:05
本文關(guān)鍵詞:基于二代測序的目標(biāo)區(qū)段SNP識別數(shù)據(jù)流的建立與比較分析
更多相關(guān)文章: 臨床診斷 Ion二代測序技術(shù) BSFI 比對 SNP分型
【摘要】:隨著測序技術(shù)的不斷革新,高通量測序技術(shù)在個體化診療中的需求日益高漲。結(jié)合高通量測序,通過對基因組測序數(shù)據(jù)的分析,來明確病人DNA信息,并幫助醫(yī)生對疾病的診斷治療已經(jīng)成為當(dāng)前的一個醫(yī)療趨勢。目前,該領(lǐng)域存在的主要問題是現(xiàn)有的生物信息學(xué)分析流程仍然不能很好的滿足當(dāng)前大數(shù)據(jù)的分析需求。作者所在實習(xí)單位開發(fā)了基于二代測序平臺的SNP鑒定技術(shù),其所帶來的個體化數(shù)據(jù)解決方案亟待開發(fā)。本研究針對該測序方案建立了目標(biāo)區(qū)段SNP識別數(shù)據(jù)流,主要包括測序數(shù)據(jù)的質(zhì)控,測序數(shù)據(jù)接頭引物的去除,樣本的篩選與分類,barcode的切除,序列的比對,參考序列SNP位點處的突變鑒定,樣本基因型的判斷。在得到原始測序數(shù)據(jù)后,通過這套數(shù)據(jù)處理流程可以快速而準(zhǔn)確的獲得樣本SNP分型信息。在本工作流程中,先使用Cutadapt軟件以Q20指標(biāo)進行reads質(zhì)量過濾與引物接頭剪切,能夠去約四分之一質(zhì)量較差的數(shù)據(jù);然后使用Fastx或BSFI軟件進行樣本分類,可歸集到約64%的reads數(shù);待樣本分類完成之后,借助連在barcode上接頭序列使用Cutadapt將這些片段連同barcode一并切除;再通過自己編寫腳本從篩選好的數(shù)據(jù)中挑出不同項目的樣本數(shù)據(jù),并將這些數(shù)據(jù)比對到項目對應(yīng)的參考序列上,比對所選用軟件是BWA,在分類好的樣本序列中,超過90%的reads可以比對到參考基因上,隨后從比對結(jié)果中使用Samtools軟件鑒定SNP信息。在鑒定SNP信息之后,獲得了包含樣本比對結(jié)果的mpileup文件,再通過編寫腳本對mpileup文件中的數(shù)據(jù)進行簡化歸類并對分型結(jié)果進行判定,并將判定結(jié)果以更加簡潔的文本形式輸出。由于在樣本分類過程中使用Fastx所耗計算時間過多,因此在流程優(yōu)化時,重點編寫了全新的BSFI程序。在該程序中的barcode篩選中額外加入了允許一個堿基的缺失(Deletion),并采用了多線程來加快數(shù)據(jù)的篩選速度。與Fastx相比,在不損失準(zhǔn)確度的情況下,BSFI的樣本分類速度顯著提升,大約縮短至原先的六分之一,使得整體SNP數(shù)據(jù)流能在一個工作日能完成。本研究開發(fā)的基于二代測序數(shù)據(jù)的SNP識別數(shù)據(jù)流,從數(shù)據(jù)獲取到數(shù)據(jù)產(chǎn)生僅需6小時,能夠滿足基于二代測序平臺的SNP鑒定技術(shù)所帶來的個體化數(shù)據(jù)需求。
【關(guān)鍵詞】:臨床診斷 Ion二代測序技術(shù) BSFI 比對 SNP分型
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R440;Q811.4
【目錄】:
- 摘要5-7
- ABSTRACT7-10
- 第一章 緒論10-21
- 1.1 研究背景10-14
- 1.2 部分二代測序數(shù)據(jù)分析軟件的簡介14-19
- 1.3 研究目的與意義19-21
- 第二章 數(shù)據(jù)結(jié)構(gòu)與流程的初步實現(xiàn)21-46
- 2.1 數(shù)據(jù)信息的簡介21-33
- 2.2 處理流程的建立33-35
- 2.3 流程的初步實現(xiàn)35-46
- 第三章 整個流程的數(shù)據(jù)結(jié)果46-68
- 3.1 測序數(shù)據(jù)的質(zhì)控結(jié)果46-51
- 3.2 樣本barcdoe的篩選結(jié)果51-52
- 3.3 Alignment(比對)及SNP calling的結(jié)果52-68
- 第四章 流程優(yōu)化68-85
- 4.1 樣本篩選分類優(yōu)化68-84
- 4.2 序列切除軟件的比較84-85
- 總結(jié)與展望85-87
- 參考文獻87-91
- 致謝91
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 周曉龍;葛星;時巧梅;徐麗芳;徐莉春;;候選基因SNP位點與非綜合征性唇腭裂的相關(guān)性[J];江蘇預(yù)防醫(yī)學(xué);2016年01期
2 陳興健;徐百成;陳遲;朱一鳴;劉曉雯;楊小龍;王艷莉;邊盼盼;郭玉芬;;SNPscan法用于新疆主要少數(shù)民族非綜合征型聾患者GJB2基因突變篩查的研究[J];聽力學(xué)及言語疾病雜志;2014年06期
3 唐立群;肖層林;王偉平;;SNP分子標(biāo)記的研究及其應(yīng)用進展[J];中國農(nóng)學(xué)通報;2012年12期
4 黃代新;桂程;易少華;楊慶恩;楊榮芝;梅q;;Typing of 24 mtDNA SNPs in a Chinese Population Using SNaPshot Minisequencing[J];Journal of Huazhong University of Science and Technology(Medical Sciences);2010年03期
5 張素華;李莉;李成濤;趙書民;;TaqMan探針技術(shù)用于X-SNP位點的分型[J];法醫(yī)學(xué)雜志;2010年01期
,本文編號:528900
本文鏈接:http://sikaile.net/yixuelunwen/swyx/528900.html
最近更新
教材專著