天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于新一代測序數(shù)據(jù)的Indel檢測方法研究

發(fā)布時(shí)間:2020-04-07 07:05
【摘要】:插入缺失變異是人類基因組中一種比較常見的變異形式,準(zhǔn)確地檢測插入缺失變異發(fā)生的位置及大小對(duì)疾病的預(yù)測有著至關(guān)重要的作用。隨著新一代測序技術(shù)的發(fā)展,越來越多檢測插入缺失變異的算法也在逐漸被提出。盡管這些算法融合了大量短讀段中的信號(hào)來提升算法性能,但是大多數(shù)算法還是只能檢測長度小于50bp的插入缺失變異。新一代測序數(shù)據(jù)自身的特點(diǎn)以及插入片段中存在的重復(fù)區(qū)域?qū)е轮械乳L度以及較大長度(50bp-10000bp)的插入缺失變異檢測仍然具有相當(dāng)大的挑戰(zhàn)。由于新一代測序數(shù)據(jù)是大量的100bp-300bp的短序列,序列中插入變異與缺失變異的存在會(huì)導(dǎo)致測序片段難以比對(duì),同時(shí),當(dāng)所插入的變異片段中存在重復(fù)區(qū)域時(shí),在序列拼接的過程中會(huì)導(dǎo)致拼接錯(cuò)誤。本文主要的工作就是研究如何準(zhǔn)確檢測中等長度以及較大長度的插入變異與缺失變異。針對(duì)于中等長度及較大長度的插入缺失變異檢測問題,我們提出了一種新的方法VRindel,VRindel可以檢測任意長度的插入缺失變異,并且對(duì)于插入變異的基因型也有較好的檢測性能。在檢測插入變異時(shí),VRindel基于分裂讀段的比對(duì)狀態(tài)可以準(zhǔn)確地確定插入變異的發(fā)生位點(diǎn)。在此基礎(chǔ)上,VRindel利用未匹配讀段與分裂讀段在每個(gè)變異位點(diǎn)依照左邊最大匹配策略動(dòng)態(tài)擴(kuò)展形成一條虛擬參考序列,通過比較虛擬參考序列與原始參考序列的異同可以檢測出任意大小的插入變異。同時(shí),VRindel將插入變異基因型的檢測轉(zhuǎn)化為拷貝數(shù)狀態(tài)的檢測,基于一個(gè)統(tǒng)計(jì)模型對(duì)虛擬參考序列各位點(diǎn)的覆蓋度信息進(jìn)行分析可以檢測出各區(qū)域的拷貝數(shù)狀態(tài),繼而達(dá)到檢測插入變異基因型的目的。在檢測缺失變異時(shí),VRindel基于層次聚類算法可以確定缺失變異發(fā)生區(qū)間,提取出各區(qū)間內(nèi)的分裂讀段并進(jìn)行分裂比對(duì)即可確定缺失變異發(fā)生的精確位置及大小。為了驗(yàn)證VRindel的插入缺失變異檢測性能,我們分別在仿真數(shù)據(jù)與真實(shí)數(shù)據(jù)上做了實(shí)驗(yàn),并且與其他八種不同方法在相同數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果進(jìn)行了比較。仿真實(shí)驗(yàn)結(jié)果顯示,相比于其他八種方法,VRindel具有更好的檢測靈敏度與準(zhǔn)確度。真實(shí)數(shù)據(jù)得到的結(jié)果與其他方法的檢測結(jié)果也有較高的一致性。同時(shí),為了驗(yàn)證VRindel對(duì)于插入變異基因型的檢測性能,我們將其實(shí)驗(yàn)結(jié)果與其他四種方法做了比較,結(jié)果顯示VRindel具有相對(duì)較好的識(shí)別性能。
【圖文】:

流程圖,檢測算法,流程圖,位點(diǎn)


圖3.1 VRindel 插入變異檢測算法流程圖3.1.2 變異發(fā)生位點(diǎn)的過濾與確認(rèn)確定插入變異發(fā)生的位點(diǎn)是 VRindel 檢測插入變異非常重要的一個(gè)步驟。在確定變異發(fā)生位點(diǎn)時(shí),分裂讀段(Split Read)可以提供非常重要的信息,有插入變異發(fā)生的區(qū)域一定會(huì)產(chǎn)生分裂讀段,但是這也只是一個(gè)必要條件,并不是一個(gè)充分條件,因?yàn)榇嬖谄渌芏喾N變異也會(huì)產(chǎn)生分裂讀段,比如缺失變異(deletion mutation)、換位變異(translocation mutation)、倒置變異(inversion mutation)、拷貝數(shù)插入變異(copynumber insertion),,所以在檢測插入變異之前,我們需要了解其他幾種變異的變異形式并且在檢測的過程中將其排除。

基于新一代測序數(shù)據(jù)的Indel檢測方法研究


倒置變異
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:Q811.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 賈國慶;司鵬搏;陳善繼;吳國慶;陳超;;CoMP下行傳輸系統(tǒng)的聯(lián)合最優(yōu)參考序列設(shè)計(jì)[J];北京工業(yè)大學(xué)學(xué)報(bào);2014年10期

2 黎滿香;林榮高;薛立群;蔣偉;陳滔;;湖南豬源糞腸球菌的分離鑒定及16S rDNA系統(tǒng)進(jìn)化分析[J];中國獸醫(yī)學(xué)報(bào);2011年09期

3 官正本;;基于灰色關(guān)聯(lián)的多目標(biāo)施工方案評(píng)價(jià)[J];鐵道建筑技術(shù);2011年S1期

4 陶篤純;噪聲過程的計(jì)算機(jī)模擬[J];聲學(xué)學(xué)報(bào);1986年06期

5 張德禮,李衍達(dá),季梁;用電子克隆新基因C17orf32和ZNF362對(duì)NCBI人類基因數(shù)據(jù)庫模式參考序列5種錯(cuò)誤類型的分析與糾正[J];遺傳學(xué)報(bào);2004年04期

6 張德禮,季梁,李衍達(dá);通過新基因計(jì)算機(jī)識(shí)別與實(shí)驗(yàn)確認(rèn)對(duì)NCBI人類基因數(shù)據(jù)庫一些模式參考序列錯(cuò)誤的分析與糾正[J];遺傳學(xué)報(bào);2004年05期

7 楊溯;李慶祥;;中國降水量序列均一性分析方法及數(shù)據(jù)集更新完善[J];氣候變化研究進(jìn)展;2014年04期

8 李冬,劉在新,王超英,謝慶閣;口蹄疫病毒誘導(dǎo)的牛α-干擾素基因cDNA的克隆及序列分析[J];中國獸醫(yī)科技;2003年10期

9 魏鐵錚;劉鐵志;;赤峰市大興安嶺南部地區(qū)大型擔(dān)子菌資源調(diào)查[J];聊城大學(xué)學(xué)報(bào)(自然科學(xué)版);2019年06期

10 弓曉敏;耿秀麗;;基于二元語義的純語義多屬性群決策方法[J];數(shù)學(xué)理論與應(yīng)用;2015年03期

相關(guān)會(huì)議論文 前3條

1 王旭東;劉克利;孫紅斌;馮震;金柏青;;呼和浩特可吸入微粒物的多因素灰色關(guān)聯(lián)分析[A];中國氣象學(xué)會(huì)2008年年會(huì)大氣環(huán)境監(jiān)測、預(yù)報(bào)與污染物控制分會(huì)場論文集[C];2008年

2 彭放;;估計(jì)礦體中心埋深的灰色關(guān)聯(lián)濾波法[A];1993年中國地球物理學(xué)會(huì)第九屆學(xué)術(shù)年會(huì)論文集[C];1993年

3 王福祥;黃超群;;哈爾濱地區(qū)丙型肝炎病毒基因分型研究[A];第九屆全國疑難及重癥肝病大會(huì)論文集[C];2017年

相關(guān)博士學(xué)位論文 前5條

1 鄧穎;水稻日本晴和93-11基因組參考序列的質(zhì)量分析[D];華中農(nóng)業(yè)大學(xué);2013年

2 趙文亮;乙型肝炎病毒基因突變檢測與分析平臺(tái)研發(fā)[D];第四軍醫(yī)大學(xué);2014年

3 齊海燕;廣西地區(qū)HIV-1流行亞型、基因變異性分析及耐藥突變的實(shí)驗(yàn)研究[D];浙江大學(xué);2012年

4 崇澤臣;插入缺失在模式生物中的演化研究與非模式生物中檢測技術(shù)的開發(fā)[D];中國科學(xué)院北京基因組研究所;2013年

5 劉琳;睪丸酮叢毛單胞菌和溶桿菌的比較基因組學(xué)研究及玉米BIBAC克隆的參考序列定位[D];華中農(nóng)業(yè)大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 許向彥;基于新一代測序數(shù)據(jù)的Indel檢測方法研究[D];西安電子科技大學(xué);2019年

2 郭旭;高度相似基因組序列數(shù)據(jù)集的壓縮算法研究[D];西安電子科技大學(xué);2018年

3 趙睿醒;模體發(fā)現(xiàn)中的參考序列選擇問題研究[D];西安電子科技大學(xué);2015年

4 劉云;一個(gè)基于轉(zhuǎn)錄組測序和無參考序列的多倍體作物SNP檢測方法[D];浙江大學(xué);2012年

5 曹猛;單核苷酸多態(tài)性識(shí)別軟件設(shè)計(jì)與實(shí)現(xiàn)[D];天津理工大學(xué);2016年

6 汪曉丹;基于短序列比對(duì)的InDel檢測算法研究[D];哈爾濱工業(yè)大學(xué);2015年

7 李平好;基于可壓縮結(jié)構(gòu)化數(shù)據(jù)的信息壓縮理論研究與算法實(shí)現(xiàn)[D];上海交通大學(xué);2014年

8 林偉森;桉樹基因測序數(shù)據(jù)SNP的模式識(shí)別方法的研究[D];華南農(nóng)業(yè)大學(xué);2016年

9 周濤;基于FPGA的線性干擾對(duì)齊通信系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年

10 喬歌;基于灰色關(guān)聯(lián)度模型的動(dòng)物藥材質(zhì)量評(píng)價(jià)模式研究(Ⅱ)[D];遼寧中醫(yī)藥大學(xué);2009年



本文編號(hào):2617602

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2617602.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3995b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com