DNA低頻突變檢測生信方法建立
發(fā)布時間:2021-09-04 00:16
過去的十幾年,得益于二代測序技術(shù)(next generation sequencing,NGS)的迅速發(fā)展,基于NGS的DNA突變檢測技術(shù)不斷發(fā)展成熟,但常規(guī)NGS的高錯誤率阻礙了其在檢測低頻突變中的應(yīng)用。目前低頻突變檢測技術(shù)主要應(yīng)用于檢測循環(huán)游離DNA(circulating cell-free DNA,cfDNA),然而血液中的cfDNA含量很少,以及包括DNA擴(kuò)增和測序在內(nèi)的實驗過程會引入背景噪音,導(dǎo)致檢測假陽性。循環(huán)腫瘤DNA(circulating tumor DNA,ctDNA)是由腫瘤細(xì)胞產(chǎn)生的一類cfDNA,基于ctDNA的突變檢測可用于癌癥篩查、基因分型、疾病實時監(jiān)測。但是,在大多數(shù)早期和部分中晚期實體瘤中,ctDNA的含量非常低,造成對ctDNA的檢測和生信分析變得極具挑戰(zhàn)性。為了克服這些限制因素,我們基于Duplex Sequencing策略,結(jié)合基于機(jī)器學(xué)習(xí)的背景拋光技術(shù)和改進(jìn)版分子條形碼技術(shù)(home-developed unique molecular identifiers,dUMI),開發(fā)了一種cfDNA低頻突變分析算法——Mutseek,可以將堿基總體...
【文章來源】:上海師范大學(xué)上海市
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1分子診斷主流技術(shù)平臺分子診斷技術(shù)在過去的近50年里發(fā)展迅猛,70年代末Kan[1]等人應(yīng)用DNA
上海師范大學(xué)碩士學(xué)位論文前言41.2.2DNA低頻突變檢測的瓶頸不同于DNA高頻突變,DNA低頻突變的鑒定一直是個難題,一方面,由于高通量測序的測序系統(tǒng)信號識別等環(huán)節(jié)不可避免地會引入錯誤,目前NGS中最常用的Illumina測序平臺的單堿基錯誤率在~0.1%水平[4];另一方面,文庫構(gòu)建即使用高保真的酶進(jìn)行PCR擴(kuò)增,也存在約10-6的擴(kuò)增錯誤率,隨著PCR循環(huán)數(shù)增加,錯誤率也隨著上升[5];另外DNA分子損傷和降解也會增加堿基錯誤率,這三方面的因素導(dǎo)致對DNA突變進(jìn)行分析時存在強(qiáng)烈的背景噪音,干擾檢測結(jié)果。當(dāng)DNA突變頻率小于1%時,分析人員很難將真實突變與系統(tǒng)錯誤區(qū)分開,導(dǎo)致檢測靈敏度較差。圖1-2外周血中的cfDNA來源循環(huán)游離DNA(circulatingcell-freeDNA,cfDNA)是血液循環(huán)或其它體液中游離于細(xì)胞外的DNA片段,目前普遍認(rèn)為cfDNA主要來源于凋亡、衰老的血細(xì)胞釋放的DNA碎片,在某些疾病和特殊狀態(tài)下,其它細(xì)胞也會釋放DNA到血液中,比如腫瘤細(xì)胞來源的循環(huán)腫瘤DNA(circulatingtumorDNA,ctDNA)[6]。Mandel和Metais[7]于1948年首次在外周血中發(fā)現(xiàn)了cfDNA,隨著對它的深入了解,cfDNA被應(yīng)用于產(chǎn)前診斷、免疫性疾病分析、癌癥篩查及診斷等領(lǐng)域,尤其是在腫瘤個性化治療領(lǐng)域具有巨大的應(yīng)用價值,現(xiàn)在cfDNA已經(jīng)成為液體活檢最重要的分子標(biāo)志物之一。然而,無論是腫瘤患者還是孕婦的外周血cfDNA樣本中,由于現(xiàn)階段我們無法單獨(dú)獲取ctDNA或者胎兒游離DNA片段,且這些目標(biāo)DNA在血漿總DNA
上海師范大學(xué)碩士學(xué)位論文前言100.003%(突變檢測靈敏度為53%)圖1-3DuplexSequencing技術(shù)原理除了基于PCR技術(shù),利用探針對目標(biāo)序列進(jìn)行雜交捕獲富集,是靶向測序的另外一種策略。所謂探針就是體外合成的一段寡核苷酸,其序列可以根據(jù)自身需求進(jìn)行合成,我們利用與靶標(biāo)DNA模板互補(bǔ)的探針,使之能特異性的結(jié)合靶標(biāo)DNA,然后通用beads的吸附作用來富集靶標(biāo)DNA。靶向測序中最具代表性的就是WES測序,它針對整個基因組上的所有外顯子區(qū)域設(shè)計探針,與WGS相比,WES將基因組上的非編碼區(qū)剔除,保留了最核心、關(guān)鍵的外顯子區(qū)域,編碼蛋白的大部分信息都存在于該區(qū)域,與人類表型相關(guān)的主要功能性突變也都在這些區(qū)域,這就在滿足大部分研究及臨床檢測的前提下,大大降低了測序和分析的費(fèi)用[44][45]。目前使用比較廣泛的商業(yè)捕獲探針包括安捷倫公司出品的AgilentSureSelectHumanAllExon以及羅氏出品的SeqCapEZHumanExomeLibraryv3.0等。2014年美國斯坦福大學(xué)Newman[46]等人研發(fā)了一種CAPP-Seq的技術(shù),其原理是首先利用腫瘤基因突變數(shù)據(jù)庫(CatalogueofSomaticMutationsinCancer,COSMIC)篩選與非小細(xì)胞肺癌(NSCLC)相關(guān)且重復(fù)出現(xiàn)的突變基因位點,以確定設(shè)計探針的區(qū)域,這一策略有效的縮小了測序范圍,這樣才能實現(xiàn)超高深度測序。然后針對這些靶區(qū)域設(shè)計并合成探針,達(dá)到捕獲靶標(biāo)DNA的目的。CAPP-Seq可以檢測到多種突變,包括單堿基突變,染色體重排和拷貝數(shù)變異等,它對ctDNA定量十分敏感,將其應(yīng)用到NSCLC樣品中,通過對ctDNA文庫進(jìn)行超深度測序(10000x),發(fā)現(xiàn)超過95%的腫瘤樣本能夠鑒定出突變,其中對Ⅰ期和Ⅱ~Ⅳ期NSCLC的檢測敏感性分別達(dá)到50%和100%[46];該技術(shù)能檢測
本文編號:3382159
【文章來源】:上海師范大學(xué)上海市
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1分子診斷主流技術(shù)平臺分子診斷技術(shù)在過去的近50年里發(fā)展迅猛,70年代末Kan[1]等人應(yīng)用DNA
上海師范大學(xué)碩士學(xué)位論文前言41.2.2DNA低頻突變檢測的瓶頸不同于DNA高頻突變,DNA低頻突變的鑒定一直是個難題,一方面,由于高通量測序的測序系統(tǒng)信號識別等環(huán)節(jié)不可避免地會引入錯誤,目前NGS中最常用的Illumina測序平臺的單堿基錯誤率在~0.1%水平[4];另一方面,文庫構(gòu)建即使用高保真的酶進(jìn)行PCR擴(kuò)增,也存在約10-6的擴(kuò)增錯誤率,隨著PCR循環(huán)數(shù)增加,錯誤率也隨著上升[5];另外DNA分子損傷和降解也會增加堿基錯誤率,這三方面的因素導(dǎo)致對DNA突變進(jìn)行分析時存在強(qiáng)烈的背景噪音,干擾檢測結(jié)果。當(dāng)DNA突變頻率小于1%時,分析人員很難將真實突變與系統(tǒng)錯誤區(qū)分開,導(dǎo)致檢測靈敏度較差。圖1-2外周血中的cfDNA來源循環(huán)游離DNA(circulatingcell-freeDNA,cfDNA)是血液循環(huán)或其它體液中游離于細(xì)胞外的DNA片段,目前普遍認(rèn)為cfDNA主要來源于凋亡、衰老的血細(xì)胞釋放的DNA碎片,在某些疾病和特殊狀態(tài)下,其它細(xì)胞也會釋放DNA到血液中,比如腫瘤細(xì)胞來源的循環(huán)腫瘤DNA(circulatingtumorDNA,ctDNA)[6]。Mandel和Metais[7]于1948年首次在外周血中發(fā)現(xiàn)了cfDNA,隨著對它的深入了解,cfDNA被應(yīng)用于產(chǎn)前診斷、免疫性疾病分析、癌癥篩查及診斷等領(lǐng)域,尤其是在腫瘤個性化治療領(lǐng)域具有巨大的應(yīng)用價值,現(xiàn)在cfDNA已經(jīng)成為液體活檢最重要的分子標(biāo)志物之一。然而,無論是腫瘤患者還是孕婦的外周血cfDNA樣本中,由于現(xiàn)階段我們無法單獨(dú)獲取ctDNA或者胎兒游離DNA片段,且這些目標(biāo)DNA在血漿總DNA
上海師范大學(xué)碩士學(xué)位論文前言100.003%(突變檢測靈敏度為53%)圖1-3DuplexSequencing技術(shù)原理除了基于PCR技術(shù),利用探針對目標(biāo)序列進(jìn)行雜交捕獲富集,是靶向測序的另外一種策略。所謂探針就是體外合成的一段寡核苷酸,其序列可以根據(jù)自身需求進(jìn)行合成,我們利用與靶標(biāo)DNA模板互補(bǔ)的探針,使之能特異性的結(jié)合靶標(biāo)DNA,然后通用beads的吸附作用來富集靶標(biāo)DNA。靶向測序中最具代表性的就是WES測序,它針對整個基因組上的所有外顯子區(qū)域設(shè)計探針,與WGS相比,WES將基因組上的非編碼區(qū)剔除,保留了最核心、關(guān)鍵的外顯子區(qū)域,編碼蛋白的大部分信息都存在于該區(qū)域,與人類表型相關(guān)的主要功能性突變也都在這些區(qū)域,這就在滿足大部分研究及臨床檢測的前提下,大大降低了測序和分析的費(fèi)用[44][45]。目前使用比較廣泛的商業(yè)捕獲探針包括安捷倫公司出品的AgilentSureSelectHumanAllExon以及羅氏出品的SeqCapEZHumanExomeLibraryv3.0等。2014年美國斯坦福大學(xué)Newman[46]等人研發(fā)了一種CAPP-Seq的技術(shù),其原理是首先利用腫瘤基因突變數(shù)據(jù)庫(CatalogueofSomaticMutationsinCancer,COSMIC)篩選與非小細(xì)胞肺癌(NSCLC)相關(guān)且重復(fù)出現(xiàn)的突變基因位點,以確定設(shè)計探針的區(qū)域,這一策略有效的縮小了測序范圍,這樣才能實現(xiàn)超高深度測序。然后針對這些靶區(qū)域設(shè)計并合成探針,達(dá)到捕獲靶標(biāo)DNA的目的。CAPP-Seq可以檢測到多種突變,包括單堿基突變,染色體重排和拷貝數(shù)變異等,它對ctDNA定量十分敏感,將其應(yīng)用到NSCLC樣品中,通過對ctDNA文庫進(jìn)行超深度測序(10000x),發(fā)現(xiàn)超過95%的腫瘤樣本能夠鑒定出突變,其中對Ⅰ期和Ⅱ~Ⅳ期NSCLC的檢測敏感性分別達(dá)到50%和100%[46];該技術(shù)能檢測
本文編號:3382159
本文鏈接:http://sikaile.net/projectlw/swxlw/3382159.html
最近更新
教材專著