基于后綴樹的DNA序列進化樹構建研究
發(fā)布時間:2021-12-18 06:38
生物序列比較是近年來迅速發(fā)展起來的一門學科,主要用來應對由分子生物學飛速發(fā)展所產生的巨大數(shù)據(jù)等問題。生物序列比較的常見方法有2種:序列的比對方法和序列的非比對方法。然而由于生物的全基因組序列比較長,比對方法計算量較大,我們利用序列的比對方法來直接分析序列間相似性在一些情況下是不可行的。序列的非比對方法不是具體的比較基對,而是將序列看成是一個整體并將其轉化為數(shù)學對象,最終借助于數(shù)學工具對其進行分析比較。在本文中,我們使用序列的非比對方法來進行生物序列相似性的研究。后綴樹模型是用來存儲生物序列中每個位置處的后綴標識,它的提出為多方面的研究提供了高效率的保證。很多領域的國內外學者都從事過有關后綴樹模型在實際應用方面的研究。后綴樹模型在生物序列比較方面也有著重要的應用,例如Leimeister CA等人利用后綴樹模型查找最長公共子串的位置來近似求取k個錯配下最長公共子串的長度。本文基于后綴樹模型提出了2種新的相異度量。第一種相異度量是基于每個后綴標識集在序列中對應的位置集。取兩條生物序列后綴標識集的交集,對交集中所有后綴對應的位置集取并集,并求每條序列的并集中含有位置個數(shù)與序列長度的比值,最后...
【文章來源】:遼寧師范大學遼寧省
【文章頁數(shù)】:40 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
引言
1 物種進化分析簡介
1.1 研究背景與意義
1.2 非比對方法介紹
2 后綴樹模型定義及建立
2.1 后綴樹模型
2.2 后綴樹算法
2.3 后綴樹在生物信息方面的應用
3 本文的相異度量模型
3.1 相異度量1
3.2 相異度量2
3.3 在生物序列進化分析中的應用
3.3.1 數(shù)據(jù)集1 的進化分析
3.3.2 數(shù)據(jù)集2 的進化分析
3.3.3 數(shù)據(jù)集3 的進化分析
結論
參考文獻
致謝
【參考文獻】:
博士論文
[1]DNA序列比較的K-詞非頻率模型研究及應用[D]. 楊希武.大連理工大學 2013
[2]無參考基因組的比較基因組學研究[D]. 易會廣.復旦大學 2013
[3]生物信息學中多序列比對等算法的研究[D]. 張敏.大連理工大學 2005
本文編號:3541837
【文章來源】:遼寧師范大學遼寧省
【文章頁數(shù)】:40 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
引言
1 物種進化分析簡介
1.1 研究背景與意義
1.2 非比對方法介紹
2 后綴樹模型定義及建立
2.1 后綴樹模型
2.2 后綴樹算法
2.3 后綴樹在生物信息方面的應用
3 本文的相異度量模型
3.1 相異度量1
3.2 相異度量2
3.3 在生物序列進化分析中的應用
3.3.1 數(shù)據(jù)集1 的進化分析
3.3.2 數(shù)據(jù)集2 的進化分析
3.3.3 數(shù)據(jù)集3 的進化分析
結論
參考文獻
致謝
【參考文獻】:
博士論文
[1]DNA序列比較的K-詞非頻率模型研究及應用[D]. 楊希武.大連理工大學 2013
[2]無參考基因組的比較基因組學研究[D]. 易會廣.復旦大學 2013
[3]生物信息學中多序列比對等算法的研究[D]. 張敏.大連理工大學 2005
本文編號:3541837
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3541837.html
最近更新
教材專著