單細(xì)胞DNA測(cè)序數(shù)據(jù)的基因型和SNP檢測(cè)
發(fā)布時(shí)間:2020-10-20 16:28
單核苷酸多態(tài)性主要是指在基因組水平上由單個(gè)核苷酸的變異引起的DNA序列多態(tài)性,在人類(lèi)可遺傳的變異中扮演了重要的角色。傳統(tǒng)的高通量測(cè)序技術(shù)是同時(shí)對(duì)多個(gè)細(xì)胞進(jìn)行測(cè)序,該測(cè)序技術(shù)忽略了細(xì)胞與細(xì)胞之間的異質(zhì)性,最終的測(cè)序結(jié)果反映的是多個(gè)細(xì)胞的平均值。隨著單細(xì)胞測(cè)序技術(shù)的引入,檢測(cè)單個(gè)細(xì)胞內(nèi)部的單核苷酸變異成為可能,然而由于單細(xì)胞測(cè)序數(shù)據(jù)中的噪音以及低覆蓋率等因素,使得精確地識(shí)別基因型和單核苷酸多態(tài)性仍具有挑戰(zhàn)性;诖,本文主要以單細(xì)胞測(cè)序數(shù)據(jù)為研究對(duì)象,建立了基因型和單核苷酸多態(tài)性的檢測(cè)模型。首先,本文詳細(xì)地介紹了單核苷酸多態(tài)性的分析流程。該分析流程由數(shù)據(jù)預(yù)處理、基因型和單核苷酸多態(tài)性識(shí)別兩個(gè)大模塊組成。單核苷酸多態(tài)性檢測(cè)的精確度與測(cè)序誤差有著密切的聯(lián)系,此誤差是由于測(cè)序過(guò)程中需要對(duì)單細(xì)胞測(cè)序數(shù)據(jù)進(jìn)行擴(kuò)增而引入的。為了提高單核苷酸多態(tài)性檢測(cè)的精確度,還需要對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)控。然后,本文對(duì)單細(xì)胞測(cè)序數(shù)據(jù)的測(cè)序誤差進(jìn)行了分析,并基于單細(xì)胞測(cè)序數(shù)據(jù)的特性,提出了基因型和單核苷酸多態(tài)性的檢測(cè)模型。該模型使用了高斯分布對(duì)測(cè)序誤差進(jìn)行建模,同時(shí)在該模型中引入堿基被測(cè)錯(cuò)的概率和短序列比對(duì)錯(cuò)誤的概率,并使用動(dòng)態(tài)規(guī)劃方法對(duì)模型求解。綜上所述,本文的主要?jiǎng)?chuàng)新點(diǎn)在:1)整個(gè)分析流程中誤差來(lái)源于兩點(diǎn),即堿基被測(cè)錯(cuò)的概率和短序列比對(duì)錯(cuò)誤的概率,常見(jiàn)的方法中只考慮了堿基被測(cè)錯(cuò)的概率,本文將這兩種錯(cuò)誤率同時(shí)融入模型之中;2)對(duì)單細(xì)胞測(cè)序數(shù)據(jù)的測(cè)序誤差進(jìn)行了分析,并基于此提出識(shí)別基因型和單核苷酸多態(tài)性的模型。為了驗(yàn)證本文方法檢測(cè)效果,本文首先基于組織測(cè)序數(shù)據(jù)構(gòu)建了驗(yàn)證數(shù)據(jù)集,然后以該驗(yàn)證數(shù)據(jù)集作為標(biāo)準(zhǔn)檢測(cè)結(jié)果,將本文方法和其他方法對(duì)檢測(cè)到的真實(shí)單核苷酸變異數(shù)、準(zhǔn)確度、轉(zhuǎn)換變異偏向性進(jìn)行比較。結(jié)果表明,在不同質(zhì)量分?jǐn)?shù)的情況下,本文方法檢測(cè)到的真實(shí)單核苷酸變異數(shù)和準(zhǔn)確度相對(duì)于其他方法有一定的提升,且轉(zhuǎn)換變異偏向性略微地變好。實(shí)驗(yàn)研究表明,本文方法能夠檢測(cè)出更多發(fā)生變異的核苷酸位點(diǎn),有著一定的研究成效。
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:Q811.4
【部分圖文】:
SNP的示意圖
給定參考基因r和變異基因a的三種可能基因型
圖 2-4 pair-end 測(cè)序示意圖示的是一個(gè) PE 測(cè)序的過(guò)程,其中灰色條狀部分表示箭頭分別表示是被測(cè)出來(lái)的Read1和Read2序列,它的方向是相反的,它們之間的距離是這個(gè) DNA 的長(zhǎng)
【參考文獻(xiàn)】
本文編號(hào):2848901
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:Q811.4
【部分圖文】:
SNP的示意圖
給定參考基因r和變異基因a的三種可能基因型
圖 2-4 pair-end 測(cè)序示意圖示的是一個(gè) PE 測(cè)序的過(guò)程,其中灰色條狀部分表示箭頭分別表示是被測(cè)出來(lái)的Read1和Read2序列,它的方向是相反的,它們之間的距離是這個(gè) DNA 的長(zhǎng)
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 李婉;馬榮;;單核苷酸多態(tài)性在惡性腫瘤精準(zhǔn)醫(yī)學(xué)研究中的意義[J];腫瘤學(xué)雜志;2017年02期
2 朱忠旭;陳新;;單細(xì)胞測(cè)序技術(shù)及應(yīng)用進(jìn)展[J];基因組學(xué)與應(yīng)用生物學(xué);2015年05期
3 梁愛(ài)斌;梁智宇;汪俊幫;;單細(xì)胞測(cè)序技術(shù)及其在腫瘤研究中的應(yīng)用[J];內(nèi)科理論與實(shí)踐;2015年01期
4 董燕;宋程程;黃鶴;;單細(xì)胞測(cè)序技術(shù)研究進(jìn)展[J];化學(xué)工業(yè)與工程;2015年01期
5 康靜婷;梁前進(jìn);;單核苷酸多態(tài)性的研究及其生物學(xué)意義[J];生物學(xué)通報(bào);2012年03期
本文編號(hào):2848901
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2848901.html
最近更新
教材專(zhuān)著