DNA低頻突變檢測(cè)生信方法建立
發(fā)布時(shí)間:2021-09-04 00:16
過(guò)去的十幾年,得益于二代測(cè)序技術(shù)(next generation sequencing,NGS)的迅速發(fā)展,基于NGS的DNA突變檢測(cè)技術(shù)不斷發(fā)展成熟,但常規(guī)NGS的高錯(cuò)誤率阻礙了其在檢測(cè)低頻突變中的應(yīng)用。目前低頻突變檢測(cè)技術(shù)主要應(yīng)用于檢測(cè)循環(huán)游離DNA(circulating cell-free DNA,cfDNA),然而血液中的cfDNA含量很少,以及包括DNA擴(kuò)增和測(cè)序在內(nèi)的實(shí)驗(yàn)過(guò)程會(huì)引入背景噪音,導(dǎo)致檢測(cè)假陽(yáng)性。循環(huán)腫瘤DNA(circulating tumor DNA,ctDNA)是由腫瘤細(xì)胞產(chǎn)生的一類(lèi)cfDNA,基于ctDNA的突變檢測(cè)可用于癌癥篩查、基因分型、疾病實(shí)時(shí)監(jiān)測(cè)。但是,在大多數(shù)早期和部分中晚期實(shí)體瘤中,ctDNA的含量非常低,造成對(duì)ctDNA的檢測(cè)和生信分析變得極具挑戰(zhàn)性。為了克服這些限制因素,我們基于Duplex Sequencing策略,結(jié)合基于機(jī)器學(xué)習(xí)的背景拋光技術(shù)和改進(jìn)版分子條形碼技術(shù)(home-developed unique molecular identifiers,dUMI),開(kāi)發(fā)了一種cfDNA低頻突變分析算法——Mutseek,可以將堿基總體...
【文章來(lái)源】:上海師范大學(xué)上海市
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1分子診斷主流技術(shù)平臺(tái)分子診斷技術(shù)在過(guò)去的近50年里發(fā)展迅猛,70年代末Kan[1]等人應(yīng)用DNA
上海師范大學(xué)碩士學(xué)位論文前言41.2.2DNA低頻突變檢測(cè)的瓶頸不同于DNA高頻突變,DNA低頻突變的鑒定一直是個(gè)難題,一方面,由于高通量測(cè)序的測(cè)序系統(tǒng)信號(hào)識(shí)別等環(huán)節(jié)不可避免地會(huì)引入錯(cuò)誤,目前NGS中最常用的Illumina測(cè)序平臺(tái)的單堿基錯(cuò)誤率在~0.1%水平[4];另一方面,文庫(kù)構(gòu)建即使用高保真的酶進(jìn)行PCR擴(kuò)增,也存在約10-6的擴(kuò)增錯(cuò)誤率,隨著PCR循環(huán)數(shù)增加,錯(cuò)誤率也隨著上升[5];另外DNA分子損傷和降解也會(huì)增加堿基錯(cuò)誤率,這三方面的因素導(dǎo)致對(duì)DNA突變進(jìn)行分析時(shí)存在強(qiáng)烈的背景噪音,干擾檢測(cè)結(jié)果。當(dāng)DNA突變頻率小于1%時(shí),分析人員很難將真實(shí)突變與系統(tǒng)錯(cuò)誤區(qū)分開(kāi),導(dǎo)致檢測(cè)靈敏度較差。圖1-2外周血中的cfDNA來(lái)源循環(huán)游離DNA(circulatingcell-freeDNA,cfDNA)是血液循環(huán)或其它體液中游離于細(xì)胞外的DNA片段,目前普遍認(rèn)為cfDNA主要來(lái)源于凋亡、衰老的血細(xì)胞釋放的DNA碎片,在某些疾病和特殊狀態(tài)下,其它細(xì)胞也會(huì)釋放DNA到血液中,比如腫瘤細(xì)胞來(lái)源的循環(huán)腫瘤DNA(circulatingtumorDNA,ctDNA)[6]。Mandel和Metais[7]于1948年首次在外周血中發(fā)現(xiàn)了cfDNA,隨著對(duì)它的深入了解,cfDNA被應(yīng)用于產(chǎn)前診斷、免疫性疾病分析、癌癥篩查及診斷等領(lǐng)域,尤其是在腫瘤個(gè)性化治療領(lǐng)域具有巨大的應(yīng)用價(jià)值,現(xiàn)在cfDNA已經(jīng)成為液體活檢最重要的分子標(biāo)志物之一。然而,無(wú)論是腫瘤患者還是孕婦的外周血cfDNA樣本中,由于現(xiàn)階段我們無(wú)法單獨(dú)獲取ctDNA或者胎兒游離DNA片段,且這些目標(biāo)DNA在血漿總DNA
上海師范大學(xué)碩士學(xué)位論文前言100.003%(突變檢測(cè)靈敏度為53%)圖1-3DuplexSequencing技術(shù)原理除了基于PCR技術(shù),利用探針對(duì)目標(biāo)序列進(jìn)行雜交捕獲富集,是靶向測(cè)序的另外一種策略。所謂探針就是體外合成的一段寡核苷酸,其序列可以根據(jù)自身需求進(jìn)行合成,我們利用與靶標(biāo)DNA模板互補(bǔ)的探針,使之能特異性的結(jié)合靶標(biāo)DNA,然后通用beads的吸附作用來(lái)富集靶標(biāo)DNA。靶向測(cè)序中最具代表性的就是WES測(cè)序,它針對(duì)整個(gè)基因組上的所有外顯子區(qū)域設(shè)計(jì)探針,與WGS相比,WES將基因組上的非編碼區(qū)剔除,保留了最核心、關(guān)鍵的外顯子區(qū)域,編碼蛋白的大部分信息都存在于該區(qū)域,與人類(lèi)表型相關(guān)的主要功能性突變也都在這些區(qū)域,這就在滿(mǎn)足大部分研究及臨床檢測(cè)的前提下,大大降低了測(cè)序和分析的費(fèi)用[44][45]。目前使用比較廣泛的商業(yè)捕獲探針包括安捷倫公司出品的AgilentSureSelectHumanAllExon以及羅氏出品的SeqCapEZHumanExomeLibraryv3.0等。2014年美國(guó)斯坦福大學(xué)Newman[46]等人研發(fā)了一種CAPP-Seq的技術(shù),其原理是首先利用腫瘤基因突變數(shù)據(jù)庫(kù)(CatalogueofSomaticMutationsinCancer,COSMIC)篩選與非小細(xì)胞肺癌(NSCLC)相關(guān)且重復(fù)出現(xiàn)的突變基因位點(diǎn),以確定設(shè)計(jì)探針的區(qū)域,這一策略有效的縮小了測(cè)序范圍,這樣才能實(shí)現(xiàn)超高深度測(cè)序。然后針對(duì)這些靶區(qū)域設(shè)計(jì)并合成探針,達(dá)到捕獲靶標(biāo)DNA的目的。CAPP-Seq可以檢測(cè)到多種突變,包括單堿基突變,染色體重排和拷貝數(shù)變異等,它對(duì)ctDNA定量十分敏感,將其應(yīng)用到NSCLC樣品中,通過(guò)對(duì)ctDNA文庫(kù)進(jìn)行超深度測(cè)序(10000x),發(fā)現(xiàn)超過(guò)95%的腫瘤樣本能夠鑒定出突變,其中對(duì)Ⅰ期和Ⅱ~Ⅳ期NSCLC的檢測(cè)敏感性分別達(dá)到50%和100%[46];該技術(shù)能檢測(cè)
本文編號(hào):3382159
【文章來(lái)源】:上海師范大學(xué)上海市
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1分子診斷主流技術(shù)平臺(tái)分子診斷技術(shù)在過(guò)去的近50年里發(fā)展迅猛,70年代末Kan[1]等人應(yīng)用DNA
上海師范大學(xué)碩士學(xué)位論文前言41.2.2DNA低頻突變檢測(cè)的瓶頸不同于DNA高頻突變,DNA低頻突變的鑒定一直是個(gè)難題,一方面,由于高通量測(cè)序的測(cè)序系統(tǒng)信號(hào)識(shí)別等環(huán)節(jié)不可避免地會(huì)引入錯(cuò)誤,目前NGS中最常用的Illumina測(cè)序平臺(tái)的單堿基錯(cuò)誤率在~0.1%水平[4];另一方面,文庫(kù)構(gòu)建即使用高保真的酶進(jìn)行PCR擴(kuò)增,也存在約10-6的擴(kuò)增錯(cuò)誤率,隨著PCR循環(huán)數(shù)增加,錯(cuò)誤率也隨著上升[5];另外DNA分子損傷和降解也會(huì)增加堿基錯(cuò)誤率,這三方面的因素導(dǎo)致對(duì)DNA突變進(jìn)行分析時(shí)存在強(qiáng)烈的背景噪音,干擾檢測(cè)結(jié)果。當(dāng)DNA突變頻率小于1%時(shí),分析人員很難將真實(shí)突變與系統(tǒng)錯(cuò)誤區(qū)分開(kāi),導(dǎo)致檢測(cè)靈敏度較差。圖1-2外周血中的cfDNA來(lái)源循環(huán)游離DNA(circulatingcell-freeDNA,cfDNA)是血液循環(huán)或其它體液中游離于細(xì)胞外的DNA片段,目前普遍認(rèn)為cfDNA主要來(lái)源于凋亡、衰老的血細(xì)胞釋放的DNA碎片,在某些疾病和特殊狀態(tài)下,其它細(xì)胞也會(huì)釋放DNA到血液中,比如腫瘤細(xì)胞來(lái)源的循環(huán)腫瘤DNA(circulatingtumorDNA,ctDNA)[6]。Mandel和Metais[7]于1948年首次在外周血中發(fā)現(xiàn)了cfDNA,隨著對(duì)它的深入了解,cfDNA被應(yīng)用于產(chǎn)前診斷、免疫性疾病分析、癌癥篩查及診斷等領(lǐng)域,尤其是在腫瘤個(gè)性化治療領(lǐng)域具有巨大的應(yīng)用價(jià)值,現(xiàn)在cfDNA已經(jīng)成為液體活檢最重要的分子標(biāo)志物之一。然而,無(wú)論是腫瘤患者還是孕婦的外周血cfDNA樣本中,由于現(xiàn)階段我們無(wú)法單獨(dú)獲取ctDNA或者胎兒游離DNA片段,且這些目標(biāo)DNA在血漿總DNA
上海師范大學(xué)碩士學(xué)位論文前言100.003%(突變檢測(cè)靈敏度為53%)圖1-3DuplexSequencing技術(shù)原理除了基于PCR技術(shù),利用探針對(duì)目標(biāo)序列進(jìn)行雜交捕獲富集,是靶向測(cè)序的另外一種策略。所謂探針就是體外合成的一段寡核苷酸,其序列可以根據(jù)自身需求進(jìn)行合成,我們利用與靶標(biāo)DNA模板互補(bǔ)的探針,使之能特異性的結(jié)合靶標(biāo)DNA,然后通用beads的吸附作用來(lái)富集靶標(biāo)DNA。靶向測(cè)序中最具代表性的就是WES測(cè)序,它針對(duì)整個(gè)基因組上的所有外顯子區(qū)域設(shè)計(jì)探針,與WGS相比,WES將基因組上的非編碼區(qū)剔除,保留了最核心、關(guān)鍵的外顯子區(qū)域,編碼蛋白的大部分信息都存在于該區(qū)域,與人類(lèi)表型相關(guān)的主要功能性突變也都在這些區(qū)域,這就在滿(mǎn)足大部分研究及臨床檢測(cè)的前提下,大大降低了測(cè)序和分析的費(fèi)用[44][45]。目前使用比較廣泛的商業(yè)捕獲探針包括安捷倫公司出品的AgilentSureSelectHumanAllExon以及羅氏出品的SeqCapEZHumanExomeLibraryv3.0等。2014年美國(guó)斯坦福大學(xué)Newman[46]等人研發(fā)了一種CAPP-Seq的技術(shù),其原理是首先利用腫瘤基因突變數(shù)據(jù)庫(kù)(CatalogueofSomaticMutationsinCancer,COSMIC)篩選與非小細(xì)胞肺癌(NSCLC)相關(guān)且重復(fù)出現(xiàn)的突變基因位點(diǎn),以確定設(shè)計(jì)探針的區(qū)域,這一策略有效的縮小了測(cè)序范圍,這樣才能實(shí)現(xiàn)超高深度測(cè)序。然后針對(duì)這些靶區(qū)域設(shè)計(jì)并合成探針,達(dá)到捕獲靶標(biāo)DNA的目的。CAPP-Seq可以檢測(cè)到多種突變,包括單堿基突變,染色體重排和拷貝數(shù)變異等,它對(duì)ctDNA定量十分敏感,將其應(yīng)用到NSCLC樣品中,通過(guò)對(duì)ctDNA文庫(kù)進(jìn)行超深度測(cè)序(10000x),發(fā)現(xiàn)超過(guò)95%的腫瘤樣本能夠鑒定出突變,其中對(duì)Ⅰ期和Ⅱ~Ⅳ期NSCLC的檢測(cè)敏感性分別達(dá)到50%和100%[46];該技術(shù)能檢測(cè)
本文編號(hào):3382159
本文鏈接:http://sikaile.net/projectlw/swxlw/3382159.html
最近更新
教材專(zhuān)著