天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

高通量測(cè)序誤差模型分析及解碼方案設(shè)計(jì)

發(fā)布時(shí)間:2017-07-31 17:21

  本文關(guān)鍵詞:高通量測(cè)序誤差模型分析及解碼方案設(shè)計(jì)


  更多相關(guān)文章: 高通量測(cè)序 熒光光譜串?dāng)_ 相位偏移 兩核苷酸同時(shí)測(cè)序 解碼


【摘要】:高通量DNA測(cè)序技術(shù)是目前生命科學(xué)領(lǐng)域的一種重要的研究手段。經(jīng)過(guò)十幾年的發(fā)展,高通量測(cè)序技術(shù)無(wú)論在測(cè)序通量還是測(cè)序速度上都有了很大的提升,測(cè)序成本也有了大幅度的降低。然而高通量測(cè)序錯(cuò)誤率高等難題仍未得到有效解決。另外,目前市場(chǎng)上所有的商用測(cè)序儀器及其配套試劑都被國(guó)外測(cè)序儀公司所壟斷,要打破這種局面必須發(fā)展具有自主知識(shí)產(chǎn)權(quán)的國(guó)產(chǎn)測(cè)序儀。本課題針對(duì)東南大學(xué)生物電子學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室自主研制的AG系列測(cè)序儀,研究系統(tǒng)誤差的來(lái)源及其糾錯(cuò)模型,以期提高現(xiàn)有AG-100測(cè)序平臺(tái)數(shù)據(jù)產(chǎn)生的準(zhǔn)確率,在此基礎(chǔ)上,建立堿基識(shí)別算法并開(kāi)發(fā)軟件系統(tǒng),并同時(shí)為雙堿基編碼測(cè)序技術(shù)的AG-200平臺(tái)提供解碼方案。本論文首先分析了高通量測(cè)序平臺(tái)中常見(jiàn)的測(cè)序誤差,介紹并比較了一些比較流行的誤差模型及校正的工具。在此基礎(chǔ)上,對(duì)自主研發(fā)的基于連接法測(cè)序的AG-100高通量測(cè)序平臺(tái),我們分析了該平臺(tái)的誤差來(lái)源,建立了相應(yīng)的誤差校正模型,主要包括熒光光譜串?dāng)_校正和相位偏移校正。對(duì)于光譜串?dāng)_,我們將其視作一個(gè)線(xiàn)性轉(zhuǎn)換問(wèn)題,建立相應(yīng)的數(shù)學(xué)模型,明確了求解串?dāng)_矩陣是校正流程中的關(guān)鍵步驟。我們采取了逐步迭代的方法對(duì)串?dāng)_矩陣進(jìn)行估算,并在迭代的過(guò)程中對(duì)熒光強(qiáng)度數(shù)據(jù)進(jìn)行不斷地校正。在相位偏移的校正步驟中,我們將測(cè)序片段按照連接法測(cè)序時(shí)的順序分割成更小的片段,對(duì)分割后的片段分別建立相位偏移矩陣,然后逐一校正,再將其合成。最后我們?yōu)锳G-100平臺(tái)的堿基識(shí)別流程開(kāi)發(fā)了軟件,該軟件接收熒光強(qiáng)度數(shù)據(jù)作為輸入,輸出fastq格式的包含序列和及其質(zhì)量的文件。通過(guò)模擬試驗(yàn)證明該軟件能有效地校正光譜串?dāng)_偏差。為提高測(cè)序效率,在連接測(cè)序的基礎(chǔ)上,我們實(shí)驗(yàn)室還提出了兩核苷酸同時(shí)合成DNA測(cè)序方案。相比較單核苷酸測(cè)序,兩核苷酸測(cè)序具有較高的精度,但同時(shí)也造成每一輪測(cè)序結(jié)果不直觀,我們需要對(duì)其進(jìn)行解碼。為此我們提出了相應(yīng)的解碼方案,并采用模擬數(shù)據(jù)集進(jìn)行了測(cè)試,取得了完全正確的解碼結(jié)果。然后將這個(gè)方案推廣到包含測(cè)序錯(cuò)誤的情況下,我們?cè)敿?xì)分析了三組編碼序列的全部誤差模式,并分別為其可能出現(xiàn)的測(cè)序錯(cuò)誤提出了相應(yīng)的糾正方案。通過(guò)模擬數(shù)據(jù)集的測(cè)試,初步驗(yàn)證了該解碼方案的正確性。
【關(guān)鍵詞】:高通量測(cè)序 熒光光譜串?dāng)_ 相位偏移 兩核苷酸同時(shí)測(cè)序 解碼
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:Q78
【目錄】:
  • 摘要4-5
  • Abstract5-8
  • 第一章 緒論8-18
  • 1.1 引言8
  • 1.2 測(cè)序技術(shù)的誕生與“人類(lèi)基因組計(jì)劃”8-9
  • 1.3 高通量測(cè)序技術(shù)問(wèn)世9-13
  • 1.3.1 高通量測(cè)序技術(shù)的誕生10-11
  • 1.3.2 第三代測(cè)序技術(shù)11
  • 1.3.3 各類(lèi)測(cè)序技術(shù)間的比較11-13
  • 1.4 高通量測(cè)序技術(shù)的應(yīng)用與千人基因組計(jì)劃13-15
  • 1.4.1 全基因組測(cè)序13-14
  • 1.4.2 宏基因組測(cè)序14
  • 1.4.3 研究DNA和蛋白質(zhì)的相互作用14
  • 1.4.4 “千人基因組計(jì)劃”14-15
  • 1.5 高通量測(cè)序目前存在的問(wèn)題15
  • 1.6 課題的研究的意義與內(nèi)容15-16
  • 1.6.1 課題背景及意義15-16
  • 1.6.2 課題研究?jī)?nèi)容16
  • 1.7 論文章節(jié)安排16-17
  • 1.8 本章小結(jié)17-18
  • 第二章 高通量測(cè)序的偏差及現(xiàn)行解決方案18-24
  • 2.1 高通量測(cè)序的偏差分類(lèi)18-22
  • 2.1.1 不完善的化學(xué)反應(yīng)引入的偏差18-20
  • 2.1.2 采用光學(xué)檢測(cè)而帶來(lái)的偏差20-22
  • 2.2 現(xiàn)行的堿基識(shí)別工具22-23
  • 2.3 本章小結(jié)23-24
  • 第三章 AG-100測(cè)序平臺(tái)的誤差模型分析及堿基識(shí)別方案研究24-35
  • 3.1 引言24
  • 3.2 熒光光譜串?dāng)_的校正思想24-29
  • 3.2.1 串?dāng)_模型24-25
  • 3.2.2 串?dāng)_矩陣分析25-28
  • 3.2.3 串?dāng)_校正流程28-29
  • 3.3 相位偏移校正29-31
  • 3.3.1 基于連接法測(cè)序的相位偏移處理29-30
  • 3.3.2 相位偏移處理的基本過(guò)程30-31
  • 3.4 AGNGS堿基識(shí)別軟件31-34
  • 3.5 本章小結(jié)34-35
  • 第四章 兩核苷酸同時(shí)合成DNA測(cè)序的解碼方案研究35-52
  • 4.1 引言35
  • 4.2 兩核苷酸同時(shí)合成DNA測(cè)序技術(shù)35-40
  • 4.2.1 兩核苷酸同時(shí)合成DNA測(cè)序原理35-36
  • 4.2.2 兩核苷酸同時(shí)合成DNA測(cè)序技術(shù)特點(diǎn)分析36-40
  • 4.2.3 解碼方案相關(guān)術(shù)語(yǔ)40
  • 4.3 基于兩組編碼序列信息的解碼方案40-42
  • 4.4 基于三組編碼序列信息的解碼方案的初步研究42-50
  • 4.4.1 無(wú)測(cè)序錯(cuò)誤下基于三組編碼序列信息的解碼方案42-43
  • 4.4.2 存在測(cè)序錯(cuò)誤下基于三組編碼序列信息的解碼方案43-50
  • 4.5 本章小結(jié)50-52
  • 第五章 總結(jié)與展望52-54
  • 5.1 工作總結(jié)52-53
  • 5.2 展望53-54
  • 參考文獻(xiàn)54-58
  • 附錄A AGNGS軟件說(shuō)明58-60
  • 附錄B 解碼測(cè)序、454、Illumina三大平臺(tái)每序列平均拍照次數(shù)模擬試驗(yàn)60-62
  • 致謝62-63
  • 作者簡(jiǎn)介63

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 劉清萍,劉中華,唐新科,陳平,梁宋平;串聯(lián)質(zhì)譜在多肽測(cè)序中的應(yīng)用[J];生命科學(xué)研究;2004年02期

2 張文力;;高通量測(cè)序數(shù)據(jù)分析現(xiàn)狀與挑戰(zhàn)[J];集成技術(shù);2012年03期

3 李黎;;一種簡(jiǎn)化的質(zhì)粒DNA快速測(cè)序法[J];國(guó)外醫(yī)學(xué)(分子生物學(xué)分冊(cè));1991年03期

4 盧春,陳溥言,蔡寶祥,,王俊;一種純化雙鏈DNA測(cè)序模板的有效方法[J];生物技術(shù);1996年04期

5 童大躍,伍新堯,蔡貴慶,李建金,劉秋玲;線(xiàn)粒體DNA高變區(qū)hν1快速測(cè)序方法及應(yīng)用[J];生物技術(shù)通訊;2003年04期

6 許艷,衛(wèi)紅飛,胡小平,包木勝,王愛(ài)麗,程巖,王麗穎;DNA自動(dòng)測(cè)序中的常見(jiàn)影響因素及測(cè)序反應(yīng)體系的優(yōu)化[J];吉林大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2004年06期

7 劉力,莊志雄,陳雯,楊杏芬,凌文華,魏青,鄧麗霞;應(yīng)用連接介導(dǎo)PCR法于線(xiàn)粒體DNA的測(cè)序[J];中國(guó)職業(yè)醫(yī)學(xué);2000年03期

8 肖翠英,張思,仲武輝,夏慶杰;DNA自動(dòng)測(cè)序中幾種影響因素的研究[J];中華醫(yī)學(xué)遺傳學(xué)雜志;1998年04期

9 甄志成,姚志建;毛細(xì)管陣列電泳與規(guī)模化DNA測(cè)序[J];色譜;2001年04期

10 余才林;大規(guī)模DNA測(cè)序進(jìn)展[J];國(guó)外醫(yī)學(xué).遺傳學(xué)分冊(cè);1996年02期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條

1 陸祖宏;呂華;肖鵬峰;白云飛;葛芹月;周東蕊;;基于生物芯片的高通量低成本DNA快速測(cè)序及其在系統(tǒng)生物學(xué)研究中的應(yīng)用[A];2007年全國(guó)生化與生物技術(shù)藥物學(xué)術(shù)年會(huì)論文集[C];2007年

2 顧潔梅;柯耀華;岳華;劉玉娟;張?jiān)?張浩;胡偉偉;汪純;何進(jìn)衛(wèi);胡云秋;李淼;傅文貞;章振林;;全外顯子組測(cè)序法鑒定一個(gè)導(dǎo)致不典型IBMPFD綜合征的新的VCP基因突變[A];中華醫(yī)學(xué)會(huì)第十一次全國(guó)內(nèi)分泌學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2012年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條

1 王春宇;生物高通量測(cè)序片段拼接與分子標(biāo)記識(shí)別算法研究[D];哈爾濱工業(yè)大學(xué);2015年

2 盧戌;基于第二代測(cè)序的轉(zhuǎn)錄組組裝軟件比較研究[D];蘭州大學(xué);2013年

3 安小平;利用高通量測(cè)序篩查未知病毒的相關(guān)技術(shù)研究[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2014年

4 呂鳴;人類(lèi)基因組復(fù)雜序列區(qū)域的擴(kuò)增與測(cè)序策略研究[D];上海交通大學(xué);2009年

5 趙琛;基于高通量RNA測(cè)序的大鼠轉(zhuǎn)錄組注釋研究[D];華東師范大學(xué);2013年

6 楊松;慢性乙型肝炎患者阿德福韋酯耐藥的檢測(cè)與分析[D];山東大學(xué);2009年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 裴金瑞;靶向捕獲二代測(cè)序檢測(cè)不明原因智力障礙/發(fā)育遲緩結(jié)果分析[D];山西醫(yī)科大學(xué);2015年

2 歐佳佳;楊樹(shù)干旱響應(yīng)轉(zhuǎn)錄組測(cè)序分析[D];南京林業(yè)大學(xué);2015年

3 朱忠旭;基于表型測(cè)序的功能基因識(shí)別[D];浙江大學(xué);2015年

4 姚劉慧;桑樹(shù)轉(zhuǎn)錄組測(cè)序及SSR標(biāo)記的開(kāi)發(fā)與鑒定[D];江蘇科技大學(xué);2015年

5 夏忠奎;基于454與Ion Torrent平臺(tái)的16S rRNA測(cè)序數(shù)據(jù)的比較分析與研究[D];電子科技大學(xué);2014年

6 張森浩;秋眠及非秋眠紫花苜蓿轉(zhuǎn)錄組測(cè)序及秋眠相關(guān)差異基因的篩選[D];河南農(nóng)業(yè)大學(xué);2013年

7 李巧玲;雙重測(cè)序法結(jié)合芯片捕獲檢測(cè)低頻突變的方法的建立[D];華南理工大學(xué);2015年

8 穆淑媛;煙草轉(zhuǎn)錄組測(cè)序及NtTTG2調(diào)控ARF同源基因表達(dá)的研究[D];南京農(nóng)業(yè)大學(xué);2014年

9 閆q

本文編號(hào):600263


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/600263.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)e6e99***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com