天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 理工論文 > 生物學論文 >

基于新一代測序數(shù)據(jù)的Indel檢測方法研究

發(fā)布時間:2020-04-07 07:05
【摘要】:插入缺失變異是人類基因組中一種比較常見的變異形式,準確地檢測插入缺失變異發(fā)生的位置及大小對疾病的預測有著至關(guān)重要的作用。隨著新一代測序技術(shù)的發(fā)展,越來越多檢測插入缺失變異的算法也在逐漸被提出。盡管這些算法融合了大量短讀段中的信號來提升算法性能,但是大多數(shù)算法還是只能檢測長度小于50bp的插入缺失變異。新一代測序數(shù)據(jù)自身的特點以及插入片段中存在的重復區(qū)域?qū)е轮械乳L度以及較大長度(50bp-10000bp)的插入缺失變異檢測仍然具有相當大的挑戰(zhàn)。由于新一代測序數(shù)據(jù)是大量的100bp-300bp的短序列,序列中插入變異與缺失變異的存在會導致測序片段難以比對,同時,當所插入的變異片段中存在重復區(qū)域時,在序列拼接的過程中會導致拼接錯誤。本文主要的工作就是研究如何準確檢測中等長度以及較大長度的插入變異與缺失變異。針對于中等長度及較大長度的插入缺失變異檢測問題,我們提出了一種新的方法VRindel,VRindel可以檢測任意長度的插入缺失變異,并且對于插入變異的基因型也有較好的檢測性能。在檢測插入變異時,VRindel基于分裂讀段的比對狀態(tài)可以準確地確定插入變異的發(fā)生位點。在此基礎(chǔ)上,VRindel利用未匹配讀段與分裂讀段在每個變異位點依照左邊最大匹配策略動態(tài)擴展形成一條虛擬參考序列,通過比較虛擬參考序列與原始參考序列的異同可以檢測出任意大小的插入變異。同時,VRindel將插入變異基因型的檢測轉(zhuǎn)化為拷貝數(shù)狀態(tài)的檢測,基于一個統(tǒng)計模型對虛擬參考序列各位點的覆蓋度信息進行分析可以檢測出各區(qū)域的拷貝數(shù)狀態(tài),繼而達到檢測插入變異基因型的目的。在檢測缺失變異時,VRindel基于層次聚類算法可以確定缺失變異發(fā)生區(qū)間,提取出各區(qū)間內(nèi)的分裂讀段并進行分裂比對即可確定缺失變異發(fā)生的精確位置及大小。為了驗證VRindel的插入缺失變異檢測性能,我們分別在仿真數(shù)據(jù)與真實數(shù)據(jù)上做了實驗,并且與其他八種不同方法在相同數(shù)據(jù)上的實驗結(jié)果進行了比較。仿真實驗結(jié)果顯示,相比于其他八種方法,VRindel具有更好的檢測靈敏度與準確度。真實數(shù)據(jù)得到的結(jié)果與其他方法的檢測結(jié)果也有較高的一致性。同時,為了驗證VRindel對于插入變異基因型的檢測性能,我們將其實驗結(jié)果與其他四種方法做了比較,結(jié)果顯示VRindel具有相對較好的識別性能。
【圖文】:

流程圖,檢測算法,流程圖,位點


圖3.1 VRindel 插入變異檢測算法流程圖3.1.2 變異發(fā)生位點的過濾與確認確定插入變異發(fā)生的位點是 VRindel 檢測插入變異非常重要的一個步驟。在確定變異發(fā)生位點時,分裂讀段(Split Read)可以提供非常重要的信息,有插入變異發(fā)生的區(qū)域一定會產(chǎn)生分裂讀段,但是這也只是一個必要條件,并不是一個充分條件,因為存在其他很多種變異也會產(chǎn)生分裂讀段,比如缺失變異(deletion mutation)、換位變異(translocation mutation)、倒置變異(inversion mutation)、拷貝數(shù)插入變異(copynumber insertion),,所以在檢測插入變異之前,我們需要了解其他幾種變異的變異形式并且在檢測的過程中將其排除。

基于新一代測序數(shù)據(jù)的Indel檢測方法研究


倒置變異
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:Q811.4

【相似文獻】

相關(guān)期刊論文 前10條

1 賈國慶;司鵬搏;陳善繼;吳國慶;陳超;;CoMP下行傳輸系統(tǒng)的聯(lián)合最優(yōu)參考序列設(shè)計[J];北京工業(yè)大學學報;2014年10期

2 黎滿香;林榮高;薛立群;蔣偉;陳滔;;湖南豬源糞腸球菌的分離鑒定及16S rDNA系統(tǒng)進化分析[J];中國獸醫(yī)學報;2011年09期

3 官正本;;基于灰色關(guān)聯(lián)的多目標施工方案評價[J];鐵道建筑技術(shù);2011年S1期

4 陶篤純;噪聲過程的計算機模擬[J];聲學學報;1986年06期

5 張德禮,李衍達,季梁;用電子克隆新基因C17orf32和ZNF362對NCBI人類基因數(shù)據(jù)庫模式參考序列5種錯誤類型的分析與糾正[J];遺傳學報;2004年04期

6 張德禮,季梁,李衍達;通過新基因計算機識別與實驗確認對NCBI人類基因數(shù)據(jù)庫一些模式參考序列錯誤的分析與糾正[J];遺傳學報;2004年05期

7 楊溯;李慶祥;;中國降水量序列均一性分析方法及數(shù)據(jù)集更新完善[J];氣候變化研究進展;2014年04期

8 李冬,劉在新,王超英,謝慶閣;口蹄疫病毒誘導的牛α-干擾素基因cDNA的克隆及序列分析[J];中國獸醫(yī)科技;2003年10期

9 魏鐵錚;劉鐵志;;赤峰市大興安嶺南部地區(qū)大型擔子菌資源調(diào)查[J];聊城大學學報(自然科學版);2019年06期

10 弓曉敏;耿秀麗;;基于二元語義的純語義多屬性群決策方法[J];數(shù)學理論與應用;2015年03期

相關(guān)會議論文 前3條

1 王旭東;劉克利;孫紅斌;馮震;金柏青;;呼和浩特可吸入微粒物的多因素灰色關(guān)聯(lián)分析[A];中國氣象學會2008年年會大氣環(huán)境監(jiān)測、預報與污染物控制分會場論文集[C];2008年

2 彭放;;估計礦體中心埋深的灰色關(guān)聯(lián)濾波法[A];1993年中國地球物理學會第九屆學術(shù)年會論文集[C];1993年

3 王福祥;黃超群;;哈爾濱地區(qū)丙型肝炎病毒基因分型研究[A];第九屆全國疑難及重癥肝病大會論文集[C];2017年

相關(guān)博士學位論文 前5條

1 鄧穎;水稻日本晴和93-11基因組參考序列的質(zhì)量分析[D];華中農(nóng)業(yè)大學;2013年

2 趙文亮;乙型肝炎病毒基因突變檢測與分析平臺研發(fā)[D];第四軍醫(yī)大學;2014年

3 齊海燕;廣西地區(qū)HIV-1流行亞型、基因變異性分析及耐藥突變的實驗研究[D];浙江大學;2012年

4 崇澤臣;插入缺失在模式生物中的演化研究與非模式生物中檢測技術(shù)的開發(fā)[D];中國科學院北京基因組研究所;2013年

5 劉琳;睪丸酮叢毛單胞菌和溶桿菌的比較基因組學研究及玉米BIBAC克隆的參考序列定位[D];華中農(nóng)業(yè)大學;2015年

相關(guān)碩士學位論文 前10條

1 許向彥;基于新一代測序數(shù)據(jù)的Indel檢測方法研究[D];西安電子科技大學;2019年

2 郭旭;高度相似基因組序列數(shù)據(jù)集的壓縮算法研究[D];西安電子科技大學;2018年

3 趙睿醒;模體發(fā)現(xiàn)中的參考序列選擇問題研究[D];西安電子科技大學;2015年

4 劉云;一個基于轉(zhuǎn)錄組測序和無參考序列的多倍體作物SNP檢測方法[D];浙江大學;2012年

5 曹猛;單核苷酸多態(tài)性識別軟件設(shè)計與實現(xiàn)[D];天津理工大學;2016年

6 汪曉丹;基于短序列比對的InDel檢測算法研究[D];哈爾濱工業(yè)大學;2015年

7 李平好;基于可壓縮結(jié)構(gòu)化數(shù)據(jù)的信息壓縮理論研究與算法實現(xiàn)[D];上海交通大學;2014年

8 林偉森;桉樹基因測序數(shù)據(jù)SNP的模式識別方法的研究[D];華南農(nóng)業(yè)大學;2016年

9 周濤;基于FPGA的線性干擾對齊通信系統(tǒng)的設(shè)計與實現(xiàn)[D];西安電子科技大學;2014年

10 喬歌;基于灰色關(guān)聯(lián)度模型的動物藥材質(zhì)量評價模式研究(Ⅱ)[D];遼寧中醫(yī)藥大學;2009年



本文編號:2617602

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2617602.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3995b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com