循環(huán)腫瘤DNA測(cè)序的數(shù)據(jù)分析方法
發(fā)布時(shí)間:2021-07-28 07:47
液體活檢是近些年來(lái)發(fā)展起來(lái)的新技術(shù),該技術(shù)能夠直接通過(guò)血液、尿液或其他體液樣本對(duì)疾病,特別是癌癥進(jìn)行檢測(cè)。由于樣本取自于身體的循環(huán)系統(tǒng),相比組織樣本可以獲得更加全面的疾病信息,因此可以較好地克服腫瘤異質(zhì)性問(wèn)題。液體活檢的對(duì)象主要包括循環(huán)腫瘤細(xì)胞、外泌體以及循環(huán)腫瘤核酸(主要是循環(huán)腫瘤DNA)。因?yàn)檠h(huán)腫瘤DNA取材方便,提取方法成熟可靠,可直接進(jìn)行DNA建庫(kù)并進(jìn)行高通量測(cè)序,所以成了目前這三者當(dāng)中研究最多的對(duì)象,在臨床中也得到了更多應(yīng)用。然而,雖然循環(huán)腫瘤DNA的實(shí)驗(yàn)技術(shù)較為成熟,但是其數(shù)據(jù)分析方法卻較為困難,其原因在于腫瘤患者血液中循環(huán)的DNA片段只有極少部分來(lái)自腫瘤,其它大部分來(lái)自于身體其他正常細(xì)胞或者白細(xì)胞,這導(dǎo)致循環(huán)腫瘤DNA在所有細(xì)胞外循環(huán)DNA中所占的比例非常低,絕大多數(shù)會(huì)低于2%,有的甚至可以低于千分之一,使得敏感地檢測(cè)這些突變并非易事。另一方面,樣本的實(shí)驗(yàn)處理和高通量測(cè)序帶來(lái)的錯(cuò)誤會(huì)對(duì)數(shù)據(jù)產(chǎn)生很大影響,使得測(cè)序的結(jié)果數(shù)據(jù)中產(chǎn)生大量假陽(yáng)性突變,而真實(shí)的突變很容易就淹沒在這樣的高背景噪聲當(dāng)中。所以,需要開發(fā)更好的數(shù)據(jù)分析方法,去除或降低循環(huán)腫瘤DNA測(cè)序中的系統(tǒng)噪聲,同時(shí)提...
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁(yè)數(shù)】:124 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
致謝
摘要
Abstract
第一章 液體活檢
1.1 液體活檢概述
1.1.1 CTC循環(huán)腫瘤細(xì)胞
1.1.2 Exosome外泌體
1.1.3 ctDNA循環(huán)腫瘤DNA
1.2 液體活檢的應(yīng)用
1.2.1 個(gè)性化用藥指導(dǎo)
1.2.2 癌癥監(jiān)測(cè)和耐藥預(yù)測(cè)
1.2.3 癌癥的輔助診斷和篩查
第二章 循環(huán)腫瘤DNA的高通量測(cè)序技術(shù)
2.1 ctDNA高通量測(cè)序的實(shí)驗(yàn)方法
2.1.1 捕獲的設(shè)計(jì)
2.2 ctDNA高通量測(cè)序數(shù)據(jù)的生物信息學(xué)分析
第三章 FastQ數(shù)據(jù)的自動(dòng)化過(guò)濾、剪裁、錯(cuò)誤校正以及質(zhì)量控制
3.1 背景
3.1.1 數(shù)據(jù)質(zhì)控
3.1.2 數(shù)據(jù)剪裁
3.1.3 接頭去除
3.1.4 自動(dòng)過(guò)濾
3.1.5 本軟件的其他創(chuàng)新
3.2 方法
3.2.1 汽泡的檢測(cè)和可視化
3.2.2 自動(dòng)化剪裁
3.2.3 read過(guò)濾
3.2.4 overlap分析和錯(cuò)誤校正
3.2.5 測(cè)序錯(cuò)誤的分析
3.2.6 自動(dòng)化去除接頭污染
3.2.7 數(shù)據(jù)質(zhì)量分析
3.2.8 軟件的實(shí)現(xiàn)
3.3 結(jié)果和討論
3.4 結(jié)論
第四章 MutScan:目標(biāo)變異的快速檢測(cè)和可視化
4.1 核心的技術(shù)問(wèn)題
4.2 方法
4.2.1 定長(zhǎng)levenstein automata
4.2.2 基于Rolling Hash的seq2int
4.2.3 Bloom Filter
4.2.4 局部搜索匹配定位
4.3 軟件實(shí)現(xiàn)
4.3.1 read pair的merge
4.3.2 可視化方法
4.4 結(jié)果評(píng)估
4.4.1 敏感度評(píng)估
4.4.2 性能評(píng)估
4.5 討論
4.5.1 MutScan進(jìn)行腫瘤耐藥分析
4.6 結(jié)論
第五章 FusionDirect / GeneFuse:高效檢測(cè)基因融合
5.1 背景
5.2 FusionDirect核心算法
5.2.1 建立索引
5.2.2 read掃描
5.2.3 生成融合位點(diǎn)
5.3 FusionDirect軟件實(shí)現(xiàn)
5.3.1 Julia語(yǔ)言
5.3.2 OpenGene.jl
5.3.3 FusionDirect的程序?qū)崿F(xiàn)
5.4 FusionDirect結(jié)果
5.4.1 FusionDirect討論
5.5 GeneFuse
5.5.1 GeneFuse算法和工作流程
5.5.2 GeneFuse的可視化結(jié)果
5.5.3 GeneFuse的討論
第六章 SeqMaker: 可模擬ctDNA測(cè)序數(shù)據(jù)的NGS仿真器
6.1 背景
6.2 方法
6.2.1 采樣過(guò)程以及CNV仿真
6.2.2 SNV仿真
6.2.3 基因融合仿真
6.2.4 測(cè)序錯(cuò)誤仿真
6.2.5 擴(kuò)增偏好性模擬
6.2.6 接頭的仿真
6.2.7 分子條形碼(UMI)的仿真
6.2.8 質(zhì)量的仿真
6.2.9 軟件的實(shí)現(xiàn)
6.3 結(jié)論
第七章 cell-free DNA的斷裂模式和模式識(shí)別
7.1 背景
7.2 方法
7.2.1 特征選擇
7.2.2 模型訓(xùn)練和驗(yàn)證
7.3 結(jié)論
第八章 結(jié)束語(yǔ)
8.1 論文總結(jié)
8.1.1 在FASTQ數(shù)據(jù)預(yù)處理中,對(duì)PE數(shù)據(jù)進(jìn)行overlap分析
8.1.2 從原始FASTQ檢測(cè)變異的方法
8.1.3 自動(dòng)化的adapter剪切
8.1.4 基因融合的檢測(cè)和可視化
8.2 未來(lái)的工作方向
8.2.1 結(jié)合人工智能與基因健康數(shù)據(jù)的深度挖掘
8.2.2 更準(zhǔn)確的ctDNA捕獲測(cè)序拷貝數(shù)分析方法
8.2.3 更好的基線分析技術(shù)和過(guò)濾方法
8.2.4 更準(zhǔn)確的ctDNA變異檢測(cè)軟件
8.2.5 ctDNA腫瘤突變負(fù)荷(TMB)分析
8.2.6 ctDNA中微衛(wèi)星不穩(wěn)定性(MSI)的分析
8.2.7 大樣本數(shù)據(jù)挖掘和可視化分析
8.3 展望
參考文獻(xiàn)
作者簡(jiǎn)介
【參考文獻(xiàn)】:
期刊論文
[1]Circulating micro RNAs and long non-coding RNAs in gastric cancer diagnosis:An update and review[J]. Ya-Kai Huang,Jian-Chun Yu. World Journal of Gastroenterology. 2015(34)
本文編號(hào):3307530
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁(yè)數(shù)】:124 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
致謝
摘要
Abstract
第一章 液體活檢
1.1 液體活檢概述
1.1.1 CTC循環(huán)腫瘤細(xì)胞
1.1.2 Exosome外泌體
1.1.3 ctDNA循環(huán)腫瘤DNA
1.2 液體活檢的應(yīng)用
1.2.1 個(gè)性化用藥指導(dǎo)
1.2.2 癌癥監(jiān)測(cè)和耐藥預(yù)測(cè)
1.2.3 癌癥的輔助診斷和篩查
第二章 循環(huán)腫瘤DNA的高通量測(cè)序技術(shù)
2.1 ctDNA高通量測(cè)序的實(shí)驗(yàn)方法
2.1.1 捕獲的設(shè)計(jì)
2.2 ctDNA高通量測(cè)序數(shù)據(jù)的生物信息學(xué)分析
第三章 FastQ數(shù)據(jù)的自動(dòng)化過(guò)濾、剪裁、錯(cuò)誤校正以及質(zhì)量控制
3.1 背景
3.1.1 數(shù)據(jù)質(zhì)控
3.1.2 數(shù)據(jù)剪裁
3.1.3 接頭去除
3.1.4 自動(dòng)過(guò)濾
3.1.5 本軟件的其他創(chuàng)新
3.2 方法
3.2.1 汽泡的檢測(cè)和可視化
3.2.2 自動(dòng)化剪裁
3.2.3 read過(guò)濾
3.2.4 overlap分析和錯(cuò)誤校正
3.2.5 測(cè)序錯(cuò)誤的分析
3.2.6 自動(dòng)化去除接頭污染
3.2.7 數(shù)據(jù)質(zhì)量分析
3.2.8 軟件的實(shí)現(xiàn)
3.3 結(jié)果和討論
3.4 結(jié)論
第四章 MutScan:目標(biāo)變異的快速檢測(cè)和可視化
4.1 核心的技術(shù)問(wèn)題
4.2 方法
4.2.1 定長(zhǎng)levenstein automata
4.2.2 基于Rolling Hash的seq2int
4.2.3 Bloom Filter
4.2.4 局部搜索匹配定位
4.3 軟件實(shí)現(xiàn)
4.3.1 read pair的merge
4.3.2 可視化方法
4.4 結(jié)果評(píng)估
4.4.1 敏感度評(píng)估
4.4.2 性能評(píng)估
4.5 討論
4.5.1 MutScan進(jìn)行腫瘤耐藥分析
4.6 結(jié)論
第五章 FusionDirect / GeneFuse:高效檢測(cè)基因融合
5.1 背景
5.2 FusionDirect核心算法
5.2.1 建立索引
5.2.2 read掃描
5.2.3 生成融合位點(diǎn)
5.3 FusionDirect軟件實(shí)現(xiàn)
5.3.1 Julia語(yǔ)言
5.3.2 OpenGene.jl
5.3.3 FusionDirect的程序?qū)崿F(xiàn)
5.4 FusionDirect結(jié)果
5.4.1 FusionDirect討論
5.5 GeneFuse
5.5.1 GeneFuse算法和工作流程
5.5.2 GeneFuse的可視化結(jié)果
5.5.3 GeneFuse的討論
第六章 SeqMaker: 可模擬ctDNA測(cè)序數(shù)據(jù)的NGS仿真器
6.1 背景
6.2 方法
6.2.1 采樣過(guò)程以及CNV仿真
6.2.2 SNV仿真
6.2.3 基因融合仿真
6.2.4 測(cè)序錯(cuò)誤仿真
6.2.5 擴(kuò)增偏好性模擬
6.2.6 接頭的仿真
6.2.7 分子條形碼(UMI)的仿真
6.2.8 質(zhì)量的仿真
6.2.9 軟件的實(shí)現(xiàn)
6.3 結(jié)論
第七章 cell-free DNA的斷裂模式和模式識(shí)別
7.1 背景
7.2 方法
7.2.1 特征選擇
7.2.2 模型訓(xùn)練和驗(yàn)證
7.3 結(jié)論
第八章 結(jié)束語(yǔ)
8.1 論文總結(jié)
8.1.1 在FASTQ數(shù)據(jù)預(yù)處理中,對(duì)PE數(shù)據(jù)進(jìn)行overlap分析
8.1.2 從原始FASTQ檢測(cè)變異的方法
8.1.3 自動(dòng)化的adapter剪切
8.1.4 基因融合的檢測(cè)和可視化
8.2 未來(lái)的工作方向
8.2.1 結(jié)合人工智能與基因健康數(shù)據(jù)的深度挖掘
8.2.2 更準(zhǔn)確的ctDNA捕獲測(cè)序拷貝數(shù)分析方法
8.2.3 更好的基線分析技術(shù)和過(guò)濾方法
8.2.4 更準(zhǔn)確的ctDNA變異檢測(cè)軟件
8.2.5 ctDNA腫瘤突變負(fù)荷(TMB)分析
8.2.6 ctDNA中微衛(wèi)星不穩(wěn)定性(MSI)的分析
8.2.7 大樣本數(shù)據(jù)挖掘和可視化分析
8.3 展望
參考文獻(xiàn)
作者簡(jiǎn)介
【參考文獻(xiàn)】:
期刊論文
[1]Circulating micro RNAs and long non-coding RNAs in gastric cancer diagnosis:An update and review[J]. Ya-Kai Huang,Jian-Chun Yu. World Journal of Gastroenterology. 2015(34)
本文編號(hào):3307530
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3307530.html
最近更新
教材專著