兩核苷酸實(shí)時(shí)合成測(cè)序信息分析
發(fā)布時(shí)間:2021-07-06 22:16
現(xiàn)有的基于實(shí)時(shí)合成測(cè)序技術(shù)是利用天然核苷酸合成,通過(guò)檢測(cè)合成副產(chǎn)物來(lái)實(shí)現(xiàn)序列測(cè)定的,其測(cè)序過(guò)程快,具有高度的可重復(fù)性、并行性和容易自動(dòng)化等特點(diǎn)。然而,對(duì)任一DNA測(cè)序模板而言,這類(lèi)測(cè)序方法不是每個(gè)測(cè)序反應(yīng)都能測(cè)定具體的堿基信息,將影響到單個(gè)測(cè)序反應(yīng)的效率,繼而影響測(cè)序閱讀長(zhǎng)度。最近,我們提出一種兩核苷酸實(shí)時(shí)合成測(cè)序的新方法,該方法基于不同核苷酸參與的合成反應(yīng)、產(chǎn)生檢測(cè)分子均相同的原理,對(duì)DNA模板通過(guò)實(shí)施兩次不同兩核苷酸的循環(huán)合成測(cè)序,最后解碼組裝出待測(cè)DNA模板的準(zhǔn)確堿基信息。本論文對(duì)兩核苷酸實(shí)時(shí)合成測(cè)序伴生的生物信息學(xué)問(wèn)題進(jìn)行研究,為兩核苷酸實(shí)時(shí)合成測(cè)序提供軟件支撐。本論文的主要內(nèi)容如下:[1]編碼及解碼算法研究基于兩核甘酸實(shí)時(shí)合成測(cè)序原理,設(shè)計(jì)了三種編碼解碼算法,即:字符編碼解碼算法、一階模式編碼解碼算法、按位編碼解碼算法。實(shí)現(xiàn)的三種編碼解碼算法在模擬數(shù)據(jù)集中測(cè)試通過(guò)。在這個(gè)模擬數(shù)據(jù)集中,首先模擬出1000條隨機(jī)生成的長(zhǎng)度為1000bp的DNA序列,并生成三組測(cè)序編碼信息。對(duì)于每條DNA序列,隨機(jī)抽取兩條編碼序列按照相對(duì)應(yīng)的解碼算法進(jìn)行解碼,然后將解碼出來(lái)的DNA序列與原先模擬的...
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 實(shí)時(shí)合成測(cè)序技術(shù)
1.1.1 焦磷酸測(cè)序技術(shù)
1.1.2 離子半導(dǎo)體DNA測(cè)序技術(shù)
1.1.3 熒光焦磷酸測(cè)序技術(shù)
1.1.4 單分子實(shí)時(shí)測(cè)序(SMRT)技術(shù)
1.2 實(shí)時(shí)合成測(cè)序相關(guān)生物信息學(xué)
1.2.1 同聚物問(wèn)題
1.2.2 基因組重測(cè)序序列比對(duì)
1.2.3 特征分析
1.3 本論文研究的目的及內(nèi)容
1.3.1 研究目的
1.3.2 研究?jī)?nèi)容
1.4 本章小結(jié)
第二章 兩核苷酸實(shí)時(shí)合成測(cè)序相關(guān)算法
2.1 兩核苷酸實(shí)時(shí)合成測(cè)序編碼解碼原理
2.1.1 字符編碼解碼算法
2.1.2 一階模式編碼解碼算法
2.1.3 按位編碼解碼算法
2.1.4 顏色編碼及解碼
2.2 兩核苷酸實(shí)時(shí)合成測(cè)序模擬算法
2.3 兩核苷酸實(shí)時(shí)合成測(cè)序數(shù)據(jù)處理
2.3.1 兩核苷酸實(shí)時(shí)合成測(cè)序序列比對(duì)算法
2.3.2 兩核苷酸實(shí)時(shí)合成測(cè)序反向互補(bǔ)序列的轉(zhuǎn)化
2.4 本章小結(jié)
第三章 兩核苷酸實(shí)時(shí)合成測(cè)序特征分析
3.1 測(cè)序錯(cuò)誤
3.2 SNP突變、“缺失”/“插入”位點(diǎn)的識(shí)別
3.3 特征分析算法
3.3.1 識(shí)別序列兩兩比對(duì)中的所有非匹配點(diǎn)
3.3.2 限制參數(shù)的設(shè)置
3.3.3 運(yùn)用兩核甘酸實(shí)時(shí)合成測(cè)序特征
3.4 本章小結(jié)
第四章 兩核苷酸實(shí)時(shí)合成測(cè)序信息分析系統(tǒng)實(shí)現(xiàn)
4.1 編碼及解碼
4.1.1 編碼
4.1.2 解碼
4.2 序列比對(duì)
4.2.1 基于Homopolymer-Aware-Smith-Waterman-Gotoh序列比對(duì)
4.2.2 基于Peaks-Aware-Smith-Waterman-Gotoh序列比對(duì)
4.3 特征分析
4.3.1 識(shí)別序列兩兩比對(duì)中的所有非匹配點(diǎn)
4.3.2 限制參數(shù)的設(shè)置
4.3.3 運(yùn)用兩核苷酸實(shí)時(shí)合成測(cè)序特征分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)介
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于GPU運(yùn)算的宏基因組第二代測(cè)序模擬軟件[J]. 宣黎明,韋朝春,李亦學(xué). 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
本文編號(hào):3269073
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 實(shí)時(shí)合成測(cè)序技術(shù)
1.1.1 焦磷酸測(cè)序技術(shù)
1.1.2 離子半導(dǎo)體DNA測(cè)序技術(shù)
1.1.3 熒光焦磷酸測(cè)序技術(shù)
1.1.4 單分子實(shí)時(shí)測(cè)序(SMRT)技術(shù)
1.2 實(shí)時(shí)合成測(cè)序相關(guān)生物信息學(xué)
1.2.1 同聚物問(wèn)題
1.2.2 基因組重測(cè)序序列比對(duì)
1.2.3 特征分析
1.3 本論文研究的目的及內(nèi)容
1.3.1 研究目的
1.3.2 研究?jī)?nèi)容
1.4 本章小結(jié)
第二章 兩核苷酸實(shí)時(shí)合成測(cè)序相關(guān)算法
2.1 兩核苷酸實(shí)時(shí)合成測(cè)序編碼解碼原理
2.1.1 字符編碼解碼算法
2.1.2 一階模式編碼解碼算法
2.1.3 按位編碼解碼算法
2.1.4 顏色編碼及解碼
2.2 兩核苷酸實(shí)時(shí)合成測(cè)序模擬算法
2.3 兩核苷酸實(shí)時(shí)合成測(cè)序數(shù)據(jù)處理
2.3.1 兩核苷酸實(shí)時(shí)合成測(cè)序序列比對(duì)算法
2.3.2 兩核苷酸實(shí)時(shí)合成測(cè)序反向互補(bǔ)序列的轉(zhuǎn)化
2.4 本章小結(jié)
第三章 兩核苷酸實(shí)時(shí)合成測(cè)序特征分析
3.1 測(cè)序錯(cuò)誤
3.2 SNP突變、“缺失”/“插入”位點(diǎn)的識(shí)別
3.3 特征分析算法
3.3.1 識(shí)別序列兩兩比對(duì)中的所有非匹配點(diǎn)
3.3.2 限制參數(shù)的設(shè)置
3.3.3 運(yùn)用兩核甘酸實(shí)時(shí)合成測(cè)序特征
3.4 本章小結(jié)
第四章 兩核苷酸實(shí)時(shí)合成測(cè)序信息分析系統(tǒng)實(shí)現(xiàn)
4.1 編碼及解碼
4.1.1 編碼
4.1.2 解碼
4.2 序列比對(duì)
4.2.1 基于Homopolymer-Aware-Smith-Waterman-Gotoh序列比對(duì)
4.2.2 基于Peaks-Aware-Smith-Waterman-Gotoh序列比對(duì)
4.3 特征分析
4.3.1 識(shí)別序列兩兩比對(duì)中的所有非匹配點(diǎn)
4.3.2 限制參數(shù)的設(shè)置
4.3.3 運(yùn)用兩核苷酸實(shí)時(shí)合成測(cè)序特征分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)介
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于GPU運(yùn)算的宏基因組第二代測(cè)序模擬軟件[J]. 宣黎明,韋朝春,李亦學(xué). 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
本文編號(hào):3269073
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3269073.html
最近更新
教材專(zhuān)著