基于k-mer的統(tǒng)計(jì)量在生物序列分析中的應(yīng)用
發(fā)布時(shí)間:2023-04-01 12:38
生物序列分析中的基于k-mer的非比對(duì)統(tǒng)計(jì)算法作為對(duì)傳統(tǒng)比對(duì)方法的補(bǔ)充和發(fā)展已逐漸成為生物信息學(xué)研究中的一個(gè)熱點(diǎn)領(lǐng)域。非比對(duì)統(tǒng)計(jì)算法是將DNA或蛋白質(zhì)的分子序列作為字(word)經(jīng)過(guò)不同的組合形成集合,然后對(duì)字在不同序列中出現(xiàn)的頻率進(jìn)行統(tǒng)計(jì),通過(guò)統(tǒng)計(jì)不同序列中k-mer的頻率分布進(jìn)而揭示生物序列之間的關(guān)聯(lián)性。但是使用基于k-mer的統(tǒng)計(jì)量研究生物序列的準(zhǔn)確性及計(jì)算速度成為當(dāng)前研究的一個(gè)熱點(diǎn)。我們首先研究了基于k-mer統(tǒng)計(jì)量的統(tǒng)計(jì)功效。k-mer統(tǒng)計(jì)主要特點(diǎn)是計(jì)算的時(shí)間復(fù)雜度和空間復(fù)雜度較低,特別適合于比較基因組學(xué)的研究,序列非比對(duì)統(tǒng)計(jì)法中基于k-mer統(tǒng)計(jì)的的算法有很多,D2S和D2*統(tǒng)計(jì)量在尋找順式調(diào)控模塊中的效果比較好,但其在尋找水平基因轉(zhuǎn)移位點(diǎn)的效果則比較差,通過(guò)前人改進(jìn)后的基于D2S和D2*的統(tǒng)計(jì)量TsumS與Tsum*被發(fā)現(xiàn)在尋找水平基因轉(zhuǎn)移時(shí)有非常好的效果。我們通過(guò)對(duì)Tsum模型的進(jìn)一步改進(jìn),加入覆蓋率和碎片長(zhǎng)度兩個(gè)可調(diào)參數(shù)調(diào)整統(tǒng)計(jì)模型,探究各個(gè)參數(shù)和TsumS與Tsum*的統(tǒng)計(jì)功效之間的關(guān)系,并發(fā)現(xiàn)了TsumS與Tsum*的參數(shù)的有效調(diào)整范圍,擴(kuò)展了 TsumS與Tsu...
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 系統(tǒng)進(jìn)化分析中序列比對(duì)的局限性和序列非比對(duì)的優(yōu)越性
1.3 基于k-mer的序列非比對(duì)統(tǒng)計(jì)法中的幾種統(tǒng)計(jì)量
1.4 基于k-mer 統(tǒng)計(jì)的軟件 SeqDistK 的引入
1.5 本章小結(jié)
第二章 基于k-mer的統(tǒng)計(jì)量的介紹
2.1 D2統(tǒng)計(jì)量介紹
2.2 D2系列統(tǒng)計(jì)量的介紹
2.3 d2系列相異度介紹
2.4 研究思路與本文結(jié)構(gòu)
2.5 本章小結(jié)
第三章 基于k-mer的統(tǒng)計(jì)模型Tsum在序列分析中的應(yīng)用
3.1 D2系列統(tǒng)計(jì)量及新統(tǒng)計(jì)模型Tsum的研究
3.2 統(tǒng)計(jì)量Tsum
S和Tsum
*的介紹
3.3 模型構(gòu)建及統(tǒng)計(jì)功效(Power)
3.4 基于k-mer統(tǒng)計(jì)的SeqPowerK軟件
3.5 模擬結(jié)果
3.5.1 參數(shù)Tsum覆蓋率對(duì)Power的影響
3.5.2 參數(shù)k對(duì)Power的影響
3.5.3 參數(shù)T對(duì)Power的影響
3.6 本章小結(jié)
第四章 基于k-mer統(tǒng)計(jì)的SeqDistK軟件開(kāi)發(fā)
4.1 當(dāng)代序列非比對(duì)統(tǒng)計(jì)工具的應(yīng)用
4.2 k-mer頻次統(tǒng)計(jì)流程
4.3 SeqDistK在Windows操作系統(tǒng)中的界面與用法
4.4 基于k-mer統(tǒng)計(jì)的軟件SeqDistK在序列分析中的優(yōu)勢(shì)
4.5 本章小結(jié)
第五章 SeqDistK在序列分析中的應(yīng)用及驗(yàn)證
5.1 16S rRNA基因
5.2 系統(tǒng)進(jìn)化樹(shù)的構(gòu)建方法
5.3 Silva數(shù)據(jù)庫(kù)及標(biāo)準(zhǔn)樹(shù)的選擇
5.4 樹(shù)的差異參數(shù)——對(duì)稱差
5.5 SeqDistK構(gòu)建系統(tǒng)進(jìn)化樹(shù)的精度驗(yàn)證
5.6 幾種序列比對(duì)工具的介紹
5.7 Linux系統(tǒng)下的SeqDistK
5.8 SeqDistK的速度驗(yàn)證
5.9 本章小結(jié)
結(jié)論
總結(jié)
展望
參考文獻(xiàn)
附錄
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號(hào):3777158
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 系統(tǒng)進(jìn)化分析中序列比對(duì)的局限性和序列非比對(duì)的優(yōu)越性
1.3 基于k-mer的序列非比對(duì)統(tǒng)計(jì)法中的幾種統(tǒng)計(jì)量
1.4 基于k-mer 統(tǒng)計(jì)的軟件 SeqDistK 的引入
1.5 本章小結(jié)
第二章 基于k-mer的統(tǒng)計(jì)量的介紹
2.1 D2統(tǒng)計(jì)量介紹
2.2 D2系列統(tǒng)計(jì)量的介紹
2.3 d2系列相異度介紹
2.4 研究思路與本文結(jié)構(gòu)
2.5 本章小結(jié)
第三章 基于k-mer的統(tǒng)計(jì)模型Tsum在序列分析中的應(yīng)用
3.1 D2系列統(tǒng)計(jì)量及新統(tǒng)計(jì)模型Tsum的研究
3.2 統(tǒng)計(jì)量Tsum
S和Tsum
*的介紹
3.3 模型構(gòu)建及統(tǒng)計(jì)功效(Power)
3.4 基于k-mer統(tǒng)計(jì)的SeqPowerK軟件
3.5 模擬結(jié)果
3.5.1 參數(shù)Tsum覆蓋率對(duì)Power的影響
3.5.2 參數(shù)k對(duì)Power的影響
3.5.3 參數(shù)T對(duì)Power的影響
3.6 本章小結(jié)
第四章 基于k-mer統(tǒng)計(jì)的SeqDistK軟件開(kāi)發(fā)
4.1 當(dāng)代序列非比對(duì)統(tǒng)計(jì)工具的應(yīng)用
4.2 k-mer頻次統(tǒng)計(jì)流程
4.3 SeqDistK在Windows操作系統(tǒng)中的界面與用法
4.4 基于k-mer統(tǒng)計(jì)的軟件SeqDistK在序列分析中的優(yōu)勢(shì)
4.5 本章小結(jié)
第五章 SeqDistK在序列分析中的應(yīng)用及驗(yàn)證
5.1 16S rRNA基因
5.2 系統(tǒng)進(jìn)化樹(shù)的構(gòu)建方法
5.3 Silva數(shù)據(jù)庫(kù)及標(biāo)準(zhǔn)樹(shù)的選擇
5.4 樹(shù)的差異參數(shù)——對(duì)稱差
5.5 SeqDistK構(gòu)建系統(tǒng)進(jìn)化樹(shù)的精度驗(yàn)證
5.6 幾種序列比對(duì)工具的介紹
5.7 Linux系統(tǒng)下的SeqDistK
5.8 SeqDistK的速度驗(yàn)證
5.9 本章小結(jié)
結(jié)論
總結(jié)
展望
參考文獻(xiàn)
附錄
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號(hào):3777158
本文鏈接:http://sikaile.net/projectlw/swxlw/3777158.html
最近更新
教材專著