基于k-mer的統(tǒng)計量在生物序列分析中的應(yīng)用
發(fā)布時間:2023-04-01 12:38
生物序列分析中的基于k-mer的非比對統(tǒng)計算法作為對傳統(tǒng)比對方法的補充和發(fā)展已逐漸成為生物信息學(xué)研究中的一個熱點領(lǐng)域。非比對統(tǒng)計算法是將DNA或蛋白質(zhì)的分子序列作為字(word)經(jīng)過不同的組合形成集合,然后對字在不同序列中出現(xiàn)的頻率進(jìn)行統(tǒng)計,通過統(tǒng)計不同序列中k-mer的頻率分布進(jìn)而揭示生物序列之間的關(guān)聯(lián)性。但是使用基于k-mer的統(tǒng)計量研究生物序列的準(zhǔn)確性及計算速度成為當(dāng)前研究的一個熱點。我們首先研究了基于k-mer統(tǒng)計量的統(tǒng)計功效。k-mer統(tǒng)計主要特點是計算的時間復(fù)雜度和空間復(fù)雜度較低,特別適合于比較基因組學(xué)的研究,序列非比對統(tǒng)計法中基于k-mer統(tǒng)計的的算法有很多,D2S和D2*統(tǒng)計量在尋找順式調(diào)控模塊中的效果比較好,但其在尋找水平基因轉(zhuǎn)移位點的效果則比較差,通過前人改進(jìn)后的基于D2S和D2*的統(tǒng)計量TsumS與Tsum*被發(fā)現(xiàn)在尋找水平基因轉(zhuǎn)移時有非常好的效果。我們通過對Tsum模型的進(jìn)一步改進(jìn),加入覆蓋率和碎片長度兩個可調(diào)參數(shù)調(diào)整統(tǒng)計模型,探究各個參數(shù)和TsumS與Tsum*的統(tǒng)計功效之間的關(guān)系,并發(fā)現(xiàn)了TsumS與Tsum*的參數(shù)的有效調(diào)整范圍,擴展了 TsumS與Tsu...
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 系統(tǒng)進(jìn)化分析中序列比對的局限性和序列非比對的優(yōu)越性
1.3 基于k-mer的序列非比對統(tǒng)計法中的幾種統(tǒng)計量
1.4 基于k-mer 統(tǒng)計的軟件 SeqDistK 的引入
1.5 本章小結(jié)
第二章 基于k-mer的統(tǒng)計量的介紹
2.1 D2統(tǒng)計量介紹
2.2 D2系列統(tǒng)計量的介紹
2.3 d2系列相異度介紹
2.4 研究思路與本文結(jié)構(gòu)
2.5 本章小結(jié)
第三章 基于k-mer的統(tǒng)計模型Tsum在序列分析中的應(yīng)用
3.1 D2系列統(tǒng)計量及新統(tǒng)計模型Tsum的研究
3.2 統(tǒng)計量Tsum
S和Tsum
*的介紹
3.3 模型構(gòu)建及統(tǒng)計功效(Power)
3.4 基于k-mer統(tǒng)計的SeqPowerK軟件
3.5 模擬結(jié)果
3.5.1 參數(shù)Tsum覆蓋率對Power的影響
3.5.2 參數(shù)k對Power的影響
3.5.3 參數(shù)T對Power的影響
3.6 本章小結(jié)
第四章 基于k-mer統(tǒng)計的SeqDistK軟件開發(fā)
4.1 當(dāng)代序列非比對統(tǒng)計工具的應(yīng)用
4.2 k-mer頻次統(tǒng)計流程
4.3 SeqDistK在Windows操作系統(tǒng)中的界面與用法
4.4 基于k-mer統(tǒng)計的軟件SeqDistK在序列分析中的優(yōu)勢
4.5 本章小結(jié)
第五章 SeqDistK在序列分析中的應(yīng)用及驗證
5.1 16S rRNA基因
5.2 系統(tǒng)進(jìn)化樹的構(gòu)建方法
5.3 Silva數(shù)據(jù)庫及標(biāo)準(zhǔn)樹的選擇
5.4 樹的差異參數(shù)——對稱差
5.5 SeqDistK構(gòu)建系統(tǒng)進(jìn)化樹的精度驗證
5.6 幾種序列比對工具的介紹
5.7 Linux系統(tǒng)下的SeqDistK
5.8 SeqDistK的速度驗證
5.9 本章小結(jié)
結(jié)論
總結(jié)
展望
參考文獻(xiàn)
附錄
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號:3777158
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 系統(tǒng)進(jìn)化分析中序列比對的局限性和序列非比對的優(yōu)越性
1.3 基于k-mer的序列非比對統(tǒng)計法中的幾種統(tǒng)計量
1.4 基于k-mer 統(tǒng)計的軟件 SeqDistK 的引入
1.5 本章小結(jié)
第二章 基于k-mer的統(tǒng)計量的介紹
2.1 D2統(tǒng)計量介紹
2.2 D2系列統(tǒng)計量的介紹
2.3 d2系列相異度介紹
2.4 研究思路與本文結(jié)構(gòu)
2.5 本章小結(jié)
第三章 基于k-mer的統(tǒng)計模型Tsum在序列分析中的應(yīng)用
3.1 D2系列統(tǒng)計量及新統(tǒng)計模型Tsum的研究
3.2 統(tǒng)計量Tsum
S和Tsum
*的介紹
3.3 模型構(gòu)建及統(tǒng)計功效(Power)
3.4 基于k-mer統(tǒng)計的SeqPowerK軟件
3.5 模擬結(jié)果
3.5.1 參數(shù)Tsum覆蓋率對Power的影響
3.5.2 參數(shù)k對Power的影響
3.5.3 參數(shù)T對Power的影響
3.6 本章小結(jié)
第四章 基于k-mer統(tǒng)計的SeqDistK軟件開發(fā)
4.1 當(dāng)代序列非比對統(tǒng)計工具的應(yīng)用
4.2 k-mer頻次統(tǒng)計流程
4.3 SeqDistK在Windows操作系統(tǒng)中的界面與用法
4.4 基于k-mer統(tǒng)計的軟件SeqDistK在序列分析中的優(yōu)勢
4.5 本章小結(jié)
第五章 SeqDistK在序列分析中的應(yīng)用及驗證
5.1 16S rRNA基因
5.2 系統(tǒng)進(jìn)化樹的構(gòu)建方法
5.3 Silva數(shù)據(jù)庫及標(biāo)準(zhǔn)樹的選擇
5.4 樹的差異參數(shù)——對稱差
5.5 SeqDistK構(gòu)建系統(tǒng)進(jìn)化樹的精度驗證
5.6 幾種序列比對工具的介紹
5.7 Linux系統(tǒng)下的SeqDistK
5.8 SeqDistK的速度驗證
5.9 本章小結(jié)
結(jié)論
總結(jié)
展望
參考文獻(xiàn)
附錄
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號:3777158
本文鏈接:http://sikaile.net/projectlw/swxlw/3777158.html
最近更新
教材專著