全基因組關聯(lián)分析中SNP數(shù)據(jù)補缺算法研究與實現(xiàn)
發(fā)布時間:2023-04-26 22:54
2005年全基因組關聯(lián)分析(GWAS)的成果首次發(fā)表,在過去的10年中隨著SNP(Single Nucleotide Polymorphism)測序技術的快速發(fā)展,全基因組關聯(lián)分析已逐步在物種重要經濟性狀、植物育種、基因改良以及人類復雜疾病等方面有所建樹,成為一種重要的研究手段。目前已有許多方法可用于SNP檢測,但是由于相關技術的約束,無論用哪種檢測方法所測出的SNP數(shù)據(jù)均是帶有缺失值的,重新檢測則會耗費大量的時間與成本,若對這些缺失值置之不理則會影響后面的GWAS工作。隱馬爾可夫模型(HMM)在生物信息學中應用的范圍越來越廣泛,和其它模型相比,HMM具有應用彈性大、適用范圍廣、參數(shù)往往具有現(xiàn)實意義的特點,本文中的算法所建立的模型就是應用上述特點所改進過的HMM,是一種非齊次的HMM,即狀態(tài)的轉移概率不僅和前一時刻的狀態(tài)有關還與具體的時刻有關,所以對相應算法,前向-后向算法,Viterbi算法進行了合理且必要的調整以適應改進后的模型。本文通過對HMM的研究以及對現(xiàn)有補缺算法的分析,提出了一種基于HMM的高效、快速的補缺方法。本算法的特點是補缺時所需的生物學信息少,運行速度快,適合對動、...
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內外研究現(xiàn)狀
1.2.1 高通量測序的研究現(xiàn)狀
1.2.2 基因芯片的研究現(xiàn)狀
1.2.3 補缺算法的研究現(xiàn)狀
1.3 本文主要工作
1.4 本文的組織結構
第2章 相關知識及技術
2.1 全基因組關聯(lián)分析(GWAS)
2.1.1 基于芯片的GWAS
2.1.2 基于高通量測序的GWAS
2.2 DNA與SNP
2.3 基因型和單體型
2.4 連鎖不平衡
2.5 隱馬爾可夫模型
2.5.1 HMM的定義
2.5.2 HMM的三個基本問題
2.6 本章小結
第3章 利用參考數(shù)據(jù)的補缺算法
3.1 補缺對象的確定
3.2 補缺問題的定義
3.3 算法的生物學依據(jù)
3.4 建立補缺問題與隱馬模型的映射
3.4.1 對傳統(tǒng)隱馬模型的改進
3.4.2 相應的算法的調整
3.5 確定隱馬模型參數(shù)
3.6 計算最佳狀態(tài)轉移序列(路徑)
3.7 實驗結果
3.8 本章小結
第4章 無參考數(shù)據(jù)的補缺算法
4.1 補缺問題的定義
4.2 算法的生物學依據(jù)
4.3 基于單體型頻率的無參考補缺算法
4.4 實驗結果
4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3802348
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內外研究現(xiàn)狀
1.2.1 高通量測序的研究現(xiàn)狀
1.2.2 基因芯片的研究現(xiàn)狀
1.2.3 補缺算法的研究現(xiàn)狀
1.3 本文主要工作
1.4 本文的組織結構
第2章 相關知識及技術
2.1 全基因組關聯(lián)分析(GWAS)
2.1.1 基于芯片的GWAS
2.1.2 基于高通量測序的GWAS
2.2 DNA與SNP
2.3 基因型和單體型
2.4 連鎖不平衡
2.5 隱馬爾可夫模型
2.5.1 HMM的定義
2.5.2 HMM的三個基本問題
2.6 本章小結
第3章 利用參考數(shù)據(jù)的補缺算法
3.1 補缺對象的確定
3.2 補缺問題的定義
3.3 算法的生物學依據(jù)
3.4 建立補缺問題與隱馬模型的映射
3.4.1 對傳統(tǒng)隱馬模型的改進
3.4.2 相應的算法的調整
3.5 確定隱馬模型參數(shù)
3.6 計算最佳狀態(tài)轉移序列(路徑)
3.7 實驗結果
3.8 本章小結
第4章 無參考數(shù)據(jù)的補缺算法
4.1 補缺問題的定義
4.2 算法的生物學依據(jù)
4.3 基于單體型頻率的無參考補缺算法
4.4 實驗結果
4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3802348
本文鏈接:http://sikaile.net/kejilunwen/yysx/3802348.html
最近更新
教材專著