一種GATK基因分析軟件并行加速方案的設計與實現(xiàn)
發(fā)布時間:2023-06-05 02:43
基因組測序大數(shù)據(jù)分析是精準醫(yī)療臨床治療的基礎,精準醫(yī)療是一種通過基因數(shù)據(jù)分析,從而精確尋找到疾病的原因和治療方法的醫(yī)療模式。GATK(Genome Analysis Toolkit)是基因組測序大數(shù)據(jù)分析中最常用的軟件之一,是幾乎所有類型的基因數(shù)據(jù)分析的必備分析工具。然而,GATK的運行速度極為緩慢,極大地限制了其在臨床醫(yī)療實踐中的作用。本文主要針對GATK運行過慢的問題,對GATK進行加速研究,并基于Spark分布式框架和硬件加速技術提出了一個分布式硬件加速的GATK并行加速方案。本文的主要工作包括:第一,針對GATK單機運行模式效率低下的問題,設計并實現(xiàn)了一個可擴展的分布式GATK并行化加速方案,相比較同類分布式加速方案,本方案針對分布式應用中經(jīng)常出現(xiàn)數(shù)據(jù)傾斜問題進行了深入研究和探討。通過切分染色體解決了分布式計算框架中出現(xiàn)的負載均衡問題。第二,對GATK中耗時最長的MuTect2工具進行了研究和分析,提出了基于硬件加速的MuTect2加速方案。相比較其他MuTect2加速方案,本方案對不同類型的基因測序數(shù)據(jù)進行了適配,均達到了較好的加速效果。通過減少MuTect2耗時降低了整個G...
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 引言
1.2 課題研究背景以及意義
1.3 國內(nèi)外研究概況
1.4 課題主要研究內(nèi)容以及論文章節(jié)安排
2 論文相關技術研究
2.1 GATK相關研究
2.2 軟硬件異構計算研究
2.3 Spark分布式組件研究
3 基于Spark的 GATK并行化加速方案的設計與實現(xiàn)
3.1 系統(tǒng)設計需求與設計方案
3.2 輸入數(shù)據(jù)預處理
3.3 數(shù)據(jù)負載均衡處理
3.4 變異位點檢測
3.5 本章小結
4 基于FPGA的 MuTect2 加速方案的設計與實現(xiàn)
4.1 MuTect2 性能測試與耗時分析
4.2 Mutect2 加速設計思想
4.3 基于Xilinx PCIE IP核的數(shù)據(jù)交互實現(xiàn)
4.4 基于FPGA的 MuTect2 加速實現(xiàn)
4.5 本章小結
5 系統(tǒng)測試與性能分析
5.1 測試評估方法
5.2 系統(tǒng)測試數(shù)據(jù)以及測試環(huán)境
5.3 基于FPGA加速的MuTect2 加速方案性能測試
5.4 基于分布式和FPGA加速的GATK加速方案性能測試
5.5 本章小結
6 總結和展望
6.1 本文工作總結
6.2 未來展望
致謝
參考文獻
本文編號:3831528
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 引言
1.2 課題研究背景以及意義
1.3 國內(nèi)外研究概況
1.4 課題主要研究內(nèi)容以及論文章節(jié)安排
2 論文相關技術研究
2.1 GATK相關研究
2.2 軟硬件異構計算研究
2.3 Spark分布式組件研究
3 基于Spark的 GATK并行化加速方案的設計與實現(xiàn)
3.1 系統(tǒng)設計需求與設計方案
3.2 輸入數(shù)據(jù)預處理
3.3 數(shù)據(jù)負載均衡處理
3.4 變異位點檢測
3.5 本章小結
4 基于FPGA的 MuTect2 加速方案的設計與實現(xiàn)
4.1 MuTect2 性能測試與耗時分析
4.2 Mutect2 加速設計思想
4.3 基于Xilinx PCIE IP核的數(shù)據(jù)交互實現(xiàn)
4.4 基于FPGA的 MuTect2 加速實現(xiàn)
4.5 本章小結
5 系統(tǒng)測試與性能分析
5.1 測試評估方法
5.2 系統(tǒng)測試數(shù)據(jù)以及測試環(huán)境
5.3 基于FPGA加速的MuTect2 加速方案性能測試
5.4 基于分布式和FPGA加速的GATK加速方案性能測試
5.5 本章小結
6 總結和展望
6.1 本文工作總結
6.2 未來展望
致謝
參考文獻
本文編號:3831528
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3831528.html
最近更新
教材專著