兩核苷酸實(shí)時(shí)合成測序信息分析
發(fā)布時(shí)間:2021-07-06 22:16
現(xiàn)有的基于實(shí)時(shí)合成測序技術(shù)是利用天然核苷酸合成,通過檢測合成副產(chǎn)物來實(shí)現(xiàn)序列測定的,其測序過程快,具有高度的可重復(fù)性、并行性和容易自動(dòng)化等特點(diǎn)。然而,對任一DNA測序模板而言,這類測序方法不是每個(gè)測序反應(yīng)都能測定具體的堿基信息,將影響到單個(gè)測序反應(yīng)的效率,繼而影響測序閱讀長度。最近,我們提出一種兩核苷酸實(shí)時(shí)合成測序的新方法,該方法基于不同核苷酸參與的合成反應(yīng)、產(chǎn)生檢測分子均相同的原理,對DNA模板通過實(shí)施兩次不同兩核苷酸的循環(huán)合成測序,最后解碼組裝出待測DNA模板的準(zhǔn)確堿基信息。本論文對兩核苷酸實(shí)時(shí)合成測序伴生的生物信息學(xué)問題進(jìn)行研究,為兩核苷酸實(shí)時(shí)合成測序提供軟件支撐。本論文的主要內(nèi)容如下:[1]編碼及解碼算法研究基于兩核甘酸實(shí)時(shí)合成測序原理,設(shè)計(jì)了三種編碼解碼算法,即:字符編碼解碼算法、一階模式編碼解碼算法、按位編碼解碼算法。實(shí)現(xiàn)的三種編碼解碼算法在模擬數(shù)據(jù)集中測試通過。在這個(gè)模擬數(shù)據(jù)集中,首先模擬出1000條隨機(jī)生成的長度為1000bp的DNA序列,并生成三組測序編碼信息。對于每條DNA序列,隨機(jī)抽取兩條編碼序列按照相對應(yīng)的解碼算法進(jìn)行解碼,然后將解碼出來的DNA序列與原先模擬的...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:90 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 實(shí)時(shí)合成測序技術(shù)
1.1.1 焦磷酸測序技術(shù)
1.1.2 離子半導(dǎo)體DNA測序技術(shù)
1.1.3 熒光焦磷酸測序技術(shù)
1.1.4 單分子實(shí)時(shí)測序(SMRT)技術(shù)
1.2 實(shí)時(shí)合成測序相關(guān)生物信息學(xué)
1.2.1 同聚物問題
1.2.2 基因組重測序序列比對
1.2.3 特征分析
1.3 本論文研究的目的及內(nèi)容
1.3.1 研究目的
1.3.2 研究內(nèi)容
1.4 本章小結(jié)
第二章 兩核苷酸實(shí)時(shí)合成測序相關(guān)算法
2.1 兩核苷酸實(shí)時(shí)合成測序編碼解碼原理
2.1.1 字符編碼解碼算法
2.1.2 一階模式編碼解碼算法
2.1.3 按位編碼解碼算法
2.1.4 顏色編碼及解碼
2.2 兩核苷酸實(shí)時(shí)合成測序模擬算法
2.3 兩核苷酸實(shí)時(shí)合成測序數(shù)據(jù)處理
2.3.1 兩核苷酸實(shí)時(shí)合成測序序列比對算法
2.3.2 兩核苷酸實(shí)時(shí)合成測序反向互補(bǔ)序列的轉(zhuǎn)化
2.4 本章小結(jié)
第三章 兩核苷酸實(shí)時(shí)合成測序特征分析
3.1 測序錯(cuò)誤
3.2 SNP突變、“缺失”/“插入”位點(diǎn)的識(shí)別
3.3 特征分析算法
3.3.1 識(shí)別序列兩兩比對中的所有非匹配點(diǎn)
3.3.2 限制參數(shù)的設(shè)置
3.3.3 運(yùn)用兩核甘酸實(shí)時(shí)合成測序特征
3.4 本章小結(jié)
第四章 兩核苷酸實(shí)時(shí)合成測序信息分析系統(tǒng)實(shí)現(xiàn)
4.1 編碼及解碼
4.1.1 編碼
4.1.2 解碼
4.2 序列比對
4.2.1 基于Homopolymer-Aware-Smith-Waterman-Gotoh序列比對
4.2.2 基于Peaks-Aware-Smith-Waterman-Gotoh序列比對
4.3 特征分析
4.3.1 識(shí)別序列兩兩比對中的所有非匹配點(diǎn)
4.3.2 限制參數(shù)的設(shè)置
4.3.3 運(yùn)用兩核苷酸實(shí)時(shí)合成測序特征分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡介
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于GPU運(yùn)算的宏基因組第二代測序模擬軟件[J]. 宣黎明,韋朝春,李亦學(xué). 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
本文編號(hào):3269073
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:90 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 實(shí)時(shí)合成測序技術(shù)
1.1.1 焦磷酸測序技術(shù)
1.1.2 離子半導(dǎo)體DNA測序技術(shù)
1.1.3 熒光焦磷酸測序技術(shù)
1.1.4 單分子實(shí)時(shí)測序(SMRT)技術(shù)
1.2 實(shí)時(shí)合成測序相關(guān)生物信息學(xué)
1.2.1 同聚物問題
1.2.2 基因組重測序序列比對
1.2.3 特征分析
1.3 本論文研究的目的及內(nèi)容
1.3.1 研究目的
1.3.2 研究內(nèi)容
1.4 本章小結(jié)
第二章 兩核苷酸實(shí)時(shí)合成測序相關(guān)算法
2.1 兩核苷酸實(shí)時(shí)合成測序編碼解碼原理
2.1.1 字符編碼解碼算法
2.1.2 一階模式編碼解碼算法
2.1.3 按位編碼解碼算法
2.1.4 顏色編碼及解碼
2.2 兩核苷酸實(shí)時(shí)合成測序模擬算法
2.3 兩核苷酸實(shí)時(shí)合成測序數(shù)據(jù)處理
2.3.1 兩核苷酸實(shí)時(shí)合成測序序列比對算法
2.3.2 兩核苷酸實(shí)時(shí)合成測序反向互補(bǔ)序列的轉(zhuǎn)化
2.4 本章小結(jié)
第三章 兩核苷酸實(shí)時(shí)合成測序特征分析
3.1 測序錯(cuò)誤
3.2 SNP突變、“缺失”/“插入”位點(diǎn)的識(shí)別
3.3 特征分析算法
3.3.1 識(shí)別序列兩兩比對中的所有非匹配點(diǎn)
3.3.2 限制參數(shù)的設(shè)置
3.3.3 運(yùn)用兩核甘酸實(shí)時(shí)合成測序特征
3.4 本章小結(jié)
第四章 兩核苷酸實(shí)時(shí)合成測序信息分析系統(tǒng)實(shí)現(xiàn)
4.1 編碼及解碼
4.1.1 編碼
4.1.2 解碼
4.2 序列比對
4.2.1 基于Homopolymer-Aware-Smith-Waterman-Gotoh序列比對
4.2.2 基于Peaks-Aware-Smith-Waterman-Gotoh序列比對
4.3 特征分析
4.3.1 識(shí)別序列兩兩比對中的所有非匹配點(diǎn)
4.3.2 限制參數(shù)的設(shè)置
4.3.3 運(yùn)用兩核苷酸實(shí)時(shí)合成測序特征分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡介
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于GPU運(yùn)算的宏基因組第二代測序模擬軟件[J]. 宣黎明,韋朝春,李亦學(xué). 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
本文編號(hào):3269073
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3269073.html
最近更新
教材專著