天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于二代測(cè)序的目標(biāo)區(qū)段SNP識(shí)別數(shù)據(jù)流的建立與比較分析

發(fā)布時(shí)間:2017-07-07 05:05

  本文關(guān)鍵詞:基于二代測(cè)序的目標(biāo)區(qū)段SNP識(shí)別數(shù)據(jù)流的建立與比較分析


  更多相關(guān)文章: 臨床診斷 Ion二代測(cè)序技術(shù) BSFI 比對(duì) SNP分型


【摘要】:隨著測(cè)序技術(shù)的不斷革新,高通量測(cè)序技術(shù)在個(gè)體化診療中的需求日益高漲。結(jié)合高通量測(cè)序,通過(guò)對(duì)基因組測(cè)序數(shù)據(jù)的分析,來(lái)明確病人DNA信息,并幫助醫(yī)生對(duì)疾病的診斷治療已經(jīng)成為當(dāng)前的一個(gè)醫(yī)療趨勢(shì)。目前,該領(lǐng)域存在的主要問(wèn)題是現(xiàn)有的生物信息學(xué)分析流程仍然不能很好的滿足當(dāng)前大數(shù)據(jù)的分析需求。作者所在實(shí)習(xí)單位開(kāi)發(fā)了基于二代測(cè)序平臺(tái)的SNP鑒定技術(shù),其所帶來(lái)的個(gè)體化數(shù)據(jù)解決方案亟待開(kāi)發(fā)。本研究針對(duì)該測(cè)序方案建立了目標(biāo)區(qū)段SNP識(shí)別數(shù)據(jù)流,主要包括測(cè)序數(shù)據(jù)的質(zhì)控,測(cè)序數(shù)據(jù)接頭引物的去除,樣本的篩選與分類(lèi),barcode的切除,序列的比對(duì),參考序列SNP位點(diǎn)處的突變鑒定,樣本基因型的判斷。在得到原始測(cè)序數(shù)據(jù)后,通過(guò)這套數(shù)據(jù)處理流程可以快速而準(zhǔn)確的獲得樣本SNP分型信息。在本工作流程中,先使用Cutadapt軟件以Q20指標(biāo)進(jìn)行reads質(zhì)量過(guò)濾與引物接頭剪切,能夠去約四分之一質(zhì)量較差的數(shù)據(jù);然后使用Fastx或BSFI軟件進(jìn)行樣本分類(lèi),可歸集到約64%的reads數(shù);待樣本分類(lèi)完成之后,借助連在barcode上接頭序列使用Cutadapt將這些片段連同barcode一并切除;再通過(guò)自己編寫(xiě)腳本從篩選好的數(shù)據(jù)中挑出不同項(xiàng)目的樣本數(shù)據(jù),并將這些數(shù)據(jù)比對(duì)到項(xiàng)目對(duì)應(yīng)的參考序列上,比對(duì)所選用軟件是BWA,在分類(lèi)好的樣本序列中,超過(guò)90%的reads可以比對(duì)到參考基因上,隨后從比對(duì)結(jié)果中使用Samtools軟件鑒定SNP信息。在鑒定SNP信息之后,獲得了包含樣本比對(duì)結(jié)果的mpileup文件,再通過(guò)編寫(xiě)腳本對(duì)mpileup文件中的數(shù)據(jù)進(jìn)行簡(jiǎn)化歸類(lèi)并對(duì)分型結(jié)果進(jìn)行判定,并將判定結(jié)果以更加簡(jiǎn)潔的文本形式輸出。由于在樣本分類(lèi)過(guò)程中使用Fastx所耗計(jì)算時(shí)間過(guò)多,因此在流程優(yōu)化時(shí),重點(diǎn)編寫(xiě)了全新的BSFI程序。在該程序中的barcode篩選中額外加入了允許一個(gè)堿基的缺失(Deletion),并采用了多線程來(lái)加快數(shù)據(jù)的篩選速度。與Fastx相比,在不損失準(zhǔn)確度的情況下,BSFI的樣本分類(lèi)速度顯著提升,大約縮短至原先的六分之一,使得整體SNP數(shù)據(jù)流能在一個(gè)工作日能完成。本研究開(kāi)發(fā)的基于二代測(cè)序數(shù)據(jù)的SNP識(shí)別數(shù)據(jù)流,從數(shù)據(jù)獲取到數(shù)據(jù)產(chǎn)生僅需6小時(shí),能夠滿足基于二代測(cè)序平臺(tái)的SNP鑒定技術(shù)所帶來(lái)的個(gè)體化數(shù)據(jù)需求。
【關(guān)鍵詞】:臨床診斷 Ion二代測(cè)序技術(shù) BSFI 比對(duì) SNP分型
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:R440;Q811.4
【目錄】:
  • 摘要5-7
  • ABSTRACT7-10
  • 第一章 緒論10-21
  • 1.1 研究背景10-14
  • 1.2 部分二代測(cè)序數(shù)據(jù)分析軟件的簡(jiǎn)介14-19
  • 1.3 研究目的與意義19-21
  • 第二章 數(shù)據(jù)結(jié)構(gòu)與流程的初步實(shí)現(xiàn)21-46
  • 2.1 數(shù)據(jù)信息的簡(jiǎn)介21-33
  • 2.2 處理流程的建立33-35
  • 2.3 流程的初步實(shí)現(xiàn)35-46
  • 第三章 整個(gè)流程的數(shù)據(jù)結(jié)果46-68
  • 3.1 測(cè)序數(shù)據(jù)的質(zhì)控結(jié)果46-51
  • 3.2 樣本barcdoe的篩選結(jié)果51-52
  • 3.3 Alignment(比對(duì))及SNP calling的結(jié)果52-68
  • 第四章 流程優(yōu)化68-85
  • 4.1 樣本篩選分類(lèi)優(yōu)化68-84
  • 4.2 序列切除軟件的比較84-85
  • 總結(jié)與展望85-87
  • 參考文獻(xiàn)87-91
  • 致謝91

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條

1 周曉龍;葛星;時(shí)巧梅;徐麗芳;徐莉春;;候選基因SNP位點(diǎn)與非綜合征性唇腭裂的相關(guān)性[J];江蘇預(yù)防醫(yī)學(xué);2016年01期

2 陳興健;徐百成;陳遲;朱一鳴;劉曉雯;楊小龍;王艷莉;邊盼盼;郭玉芬;;SNPscan法用于新疆主要少數(shù)民族非綜合征型聾患者GJB2基因突變篩查的研究[J];聽(tīng)力學(xué)及言語(yǔ)疾病雜志;2014年06期

3 唐立群;肖層林;王偉平;;SNP分子標(biāo)記的研究及其應(yīng)用進(jìn)展[J];中國(guó)農(nóng)學(xué)通報(bào);2012年12期

4 黃代新;桂程;易少華;楊慶恩;楊榮芝;梅q;;Typing of 24 mtDNA SNPs in a Chinese Population Using SNaPshot Minisequencing[J];Journal of Huazhong University of Science and Technology(Medical Sciences);2010年03期

5 張素華;李莉;李成濤;趙書(shū)民;;TaqMan探針技術(shù)用于X-SNP位點(diǎn)的分型[J];法醫(yī)學(xué)雜志;2010年01期

,

本文編號(hào):528900

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/swyx/528900.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eda47***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com