基于de Bruijn圖模型的基因組序列映射算法研究
發(fā)布時間:2023-12-02 13:01
隨著高通量測序技術(shù)的快速發(fā)展和測序成本的逐漸降低,個體基因組測序已成為研究不同物種的基因型,變異情況和相關(guān)疾病的重要手段。生物信息學(xué)為人類探索生命體活動規(guī)律,疾病產(chǎn)生機制與治療提供了新思路,極大推動了分子生物學(xué),基因組學(xué),遺傳學(xué)和醫(yī)學(xué)的發(fā)展;蚪M序列映射(Mapping)作為基因組數(shù)據(jù)分析的基礎(chǔ)對變異識別(Variant Calling),基因表達量分析,選擇性剪切分析和生物網(wǎng)絡(luò)計算等研究方向有重要意義。還原測序數(shù)據(jù)在基因組上的真實位置是下游的生物信息計算的基礎(chǔ)。然而,由于基因組上的大量重復(fù)序列和高變異區(qū)域,日益增大的測序數(shù)據(jù)量以及測序技術(shù)的局限等因素,如何準(zhǔn)確且快速地將大量測序數(shù)據(jù)比對到參考基因組面臨巨大挑戰(zhàn)。本文圍繞著基因組序列映射與序列比對為重點展開研究。本文的研究目的是通過分析現(xiàn)有比對方法的特性和不足之處,提出了基因組非線性的圖模型組織表示方法。本文設(shè)計了基于de Bruijn圖模型的基因組索引模型來有效組織和表達基因組上的大量重復(fù)片段。同時,為提高圖模型的應(yīng)用價值,提出針對大規(guī)模數(shù)據(jù)集的de Bruijn圖模型構(gòu)建算法。另外,本文實現(xiàn)了基于圖模型的序列比對算法,達到了更高準(zhǔn)...
【文章頁數(shù)】:125 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究的目的和意義
1.1.1 研究背景
1.1.2 研究的目的和意義
1.2 基因組序列比對的背景知識
1.2.1 高通量測序技術(shù)
1.2.2 參考基因組
1.2.3 基因組序列映射
1.2.4 變異識別
1.2.5 基因組數(shù)據(jù)存儲格式
1.2.6 主要數(shù)據(jù)結(jié)構(gòu)
1.3 研究現(xiàn)狀
1.3.1 基于哈希表模型的序列比對方法
1.3.2 基于后綴樹的序列比對方法
1.3.3 de Bruijn圖模型構(gòu)建方法
1.3.4 基因組圖模型
1.4 本文的主要研究內(nèi)容
第2章 基于de Bruijn圖的索引模型研究
2.1 引言
2.2 基因組圖模型特性
2.3 基于哈希表的索引模型
2.3.1 基于哈希表的數(shù)據(jù)存儲方法
2.3.2 基于哈希表的序列比對方法
2.3.3 基于哈希表的索引存儲方法
2.4 基于de Bruijn圖的索引模型
2.4.1 圖索引的組織結(jié)構(gòu)
2.4.2 圖索引模型構(gòu)建方法
2.4.3 基于圖索引的相似種子識別方法
2.5 基因組索引模型種子獲取的實驗結(jié)果與分析
2.6 本章小結(jié)
第3章 可擴展的大規(guī)模de Bruijn圖模型構(gòu)建算法
3.1 引言
3.2 可擴展的圖模型構(gòu)建算法
3.2.1 基本原理與整體計算流程
3.2.2 圖模型節(jié)點排序方法
3.2.3 圖模型節(jié)點類型識別方法
3.2.4 圖模型路徑排列方法
3.2.5 圖模型路徑集合重構(gòu)方法
3.2.6 圖模型節(jié)點篩選方法
3.3 圖模型構(gòu)建方法的實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集描述
3.3.2 基因組數(shù)據(jù)集上建圖結(jié)果分析
3.3.3 測序數(shù)據(jù)集上建圖結(jié)果分析
3.4 本章小結(jié)
第4章 基于de Bruijn圖模型的序列映射算法
4.1 引言
4.2 基于圖模型的序列比對算法
4.2.1 整體計算流程
4.2.2 種子生成方法
4.2.3 相同路徑上的種子合并方法
4.2.4 不同路徑間的種子合并方法
4.2.5 局部序列比對方法
4.3 基因組序列比對實驗結(jié)果與分析
4.3.1 測序數(shù)據(jù)比對到多個基因組
4.3.2 測序數(shù)據(jù)比對到單基因組
4.4 本章小結(jié)
第5章 結(jié)合變異信息的序列比對算法
5.1 引言
5.2 結(jié)合變異信息的序列比對方法
5.2.1 整體計算流程
5.2.2 偽樹結(jié)構(gòu)基本概念與構(gòu)建方法
5.2.3 Landau-Vishkin序列比對算法
5.2.4 基于偽樹結(jié)構(gòu)的序列比對算法
5.2.5 比對結(jié)果信息重構(gòu)方法
5.3 結(jié)合變異信息的序列比對方法實驗結(jié)果與分析
5.3.1 模擬數(shù)據(jù)集上序列比對結(jié)果分析
5.3.2 測序數(shù)據(jù)集上序列比對結(jié)果分析
5.3.3 MHC區(qū)域上序列比對結(jié)果分析
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文
致謝
個人簡歷
本文編號:3869724
【文章頁數(shù)】:125 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究的目的和意義
1.1.1 研究背景
1.1.2 研究的目的和意義
1.2 基因組序列比對的背景知識
1.2.1 高通量測序技術(shù)
1.2.2 參考基因組
1.2.3 基因組序列映射
1.2.4 變異識別
1.2.5 基因組數(shù)據(jù)存儲格式
1.2.6 主要數(shù)據(jù)結(jié)構(gòu)
1.3 研究現(xiàn)狀
1.3.1 基于哈希表模型的序列比對方法
1.3.2 基于后綴樹的序列比對方法
1.3.3 de Bruijn圖模型構(gòu)建方法
1.3.4 基因組圖模型
1.4 本文的主要研究內(nèi)容
第2章 基于de Bruijn圖的索引模型研究
2.1 引言
2.2 基因組圖模型特性
2.3 基于哈希表的索引模型
2.3.1 基于哈希表的數(shù)據(jù)存儲方法
2.3.2 基于哈希表的序列比對方法
2.3.3 基于哈希表的索引存儲方法
2.4 基于de Bruijn圖的索引模型
2.4.1 圖索引的組織結(jié)構(gòu)
2.4.2 圖索引模型構(gòu)建方法
2.4.3 基于圖索引的相似種子識別方法
2.5 基因組索引模型種子獲取的實驗結(jié)果與分析
2.6 本章小結(jié)
第3章 可擴展的大規(guī)模de Bruijn圖模型構(gòu)建算法
3.1 引言
3.2 可擴展的圖模型構(gòu)建算法
3.2.1 基本原理與整體計算流程
3.2.2 圖模型節(jié)點排序方法
3.2.3 圖模型節(jié)點類型識別方法
3.2.4 圖模型路徑排列方法
3.2.5 圖模型路徑集合重構(gòu)方法
3.2.6 圖模型節(jié)點篩選方法
3.3 圖模型構(gòu)建方法的實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集描述
3.3.2 基因組數(shù)據(jù)集上建圖結(jié)果分析
3.3.3 測序數(shù)據(jù)集上建圖結(jié)果分析
3.4 本章小結(jié)
第4章 基于de Bruijn圖模型的序列映射算法
4.1 引言
4.2 基于圖模型的序列比對算法
4.2.1 整體計算流程
4.2.2 種子生成方法
4.2.3 相同路徑上的種子合并方法
4.2.4 不同路徑間的種子合并方法
4.2.5 局部序列比對方法
4.3 基因組序列比對實驗結(jié)果與分析
4.3.1 測序數(shù)據(jù)比對到多個基因組
4.3.2 測序數(shù)據(jù)比對到單基因組
4.4 本章小結(jié)
第5章 結(jié)合變異信息的序列比對算法
5.1 引言
5.2 結(jié)合變異信息的序列比對方法
5.2.1 整體計算流程
5.2.2 偽樹結(jié)構(gòu)基本概念與構(gòu)建方法
5.2.3 Landau-Vishkin序列比對算法
5.2.4 基于偽樹結(jié)構(gòu)的序列比對算法
5.2.5 比對結(jié)果信息重構(gòu)方法
5.3 結(jié)合變異信息的序列比對方法實驗結(jié)果與分析
5.3.1 模擬數(shù)據(jù)集上序列比對結(jié)果分析
5.3.2 測序數(shù)據(jù)集上序列比對結(jié)果分析
5.3.3 MHC區(qū)域上序列比對結(jié)果分析
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文
致謝
個人簡歷
本文編號:3869724
本文鏈接:http://sikaile.net/projectlw/swxlw/3869724.html
最近更新
教材專著