天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基因組結(jié)構(gòu)變異預(yù)測算法研究

發(fā)布時間:2020-10-08 15:43
   結(jié)構(gòu)變異(Structural Variation,SV)通常是指規(guī)模介于單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)和染色體變異之間的基因組變異形式,是生物遺傳多樣性的重要組成部分,不僅能夠?qū)е聜體之間的表型差異,而且也與多種疾病的發(fā)生存在密切的聯(lián)系。高通量測序技術(shù)的不斷發(fā)展和廣泛應(yīng)用,為結(jié)構(gòu)變異的預(yù)測和研究提供了技術(shù)支持。然而,數(shù)量規(guī)模龐大的短讀長測序數(shù)據(jù)給結(jié)構(gòu)變異預(yù)測帶來了困難和挑戰(zhàn);诟咄繙y序的基因組結(jié)構(gòu)變異預(yù)測問題已經(jīng)成為生物信息學(xué)領(lǐng)域的研究熱點(diǎn)。由于包括人類在內(nèi)的大部分動物和一半以上的高等植物,都是屬于二倍體基因組。因此,重點(diǎn)圍繞二倍體基因組展開研究,設(shè)計(jì)有效的結(jié)構(gòu)變異預(yù)測分析算法,不僅能夠提高預(yù)測結(jié)果的精確度和敏感度,有利于探索結(jié)構(gòu)變異與重大疾病的內(nèi)在關(guān)聯(lián),更能為多倍體基因組結(jié)構(gòu)變異預(yù)測研究奠定基礎(chǔ)。本文重點(diǎn)面向雙序列比對問題和不同類型的結(jié)構(gòu)變異預(yù)測問題進(jìn)行研究,提出了一種雙序列比對改進(jìn)算法,以及基因組結(jié)構(gòu)變異預(yù)測算法,以提高不同類型結(jié)構(gòu)變異預(yù)測結(jié)果的精確度和敏感度。本文的主要內(nèi)容和創(chuàng)新點(diǎn)如下:1.現(xiàn)有的雙序列比對算法的回溯過程是嚴(yán)格按照最優(yōu)解的來源方向執(zhí)行的,容易造成比對結(jié)果中堿基過早匹配而不利于發(fā)現(xiàn)更長的空位片段,導(dǎo)致比對結(jié)果與InDel變異的實(shí)際情況產(chǎn)生偏差。另外,相對固定的空位罰分也不利于比對結(jié)果中增加空位和減少堿基錯配。本文從動態(tài)空位罰分調(diào)整策略、算法逆推策略和得分矩陣單元格計(jì)算方法三個方面對Needleman-Wunsch算法進(jìn)行了優(yōu)化和改進(jìn),提出了一種DNA雙序列全局比對改進(jìn)算法(DNA-NW)。由于改進(jìn)算法的逆推策略不再嚴(yán)格按照最優(yōu)解的來源方向執(zhí)行,因此不再使用名詞“回溯”,而稱之為逆推策略。該算法分為預(yù)處理階段和比對執(zhí)行階段,預(yù)處理是通過基于萊溫斯坦距離的動態(tài)空位罰分策略(DGPS-LD)實(shí)現(xiàn),根據(jù)計(jì)算出的兩條序列的萊溫斯坦距離動態(tài)調(diào)整空位罰分的分值,使得比對結(jié)果更加傾向于增加空位;比對執(zhí)行階段是利用Needleman-Wunsch改進(jìn)算法(INW)實(shí)現(xiàn)。尤其是Needleman-Wunsch改進(jìn)算法(INW)不僅執(zhí)行效率高于原有的Needleman-Wunsch算法,而且采用新的逆推策略能夠在保證最優(yōu)比對得分不變的前提下找到更長的空位片段,減少錯配個數(shù),在降低假陽性SNP可能性的同時,能夠預(yù)測出更長的InDel變異,使得DNA序列比對結(jié)果較好的符合了 InDel變異的實(shí)際情況,更加有利于InDel變異的預(yù)測。2.對InDel及其預(yù)測方法現(xiàn)狀進(jìn)行了綜述,介紹了高通量測序原始數(shù)據(jù)的質(zhì)控與預(yù)處理方法。針對長度小于50 bp的InDel預(yù)測問題展開研究,提出了一種基于拆分讀片段(split read)的InDel預(yù)測與分析方法(SRInDel)。該算法首先劃定拆分讀片段在參考基因組上的比對目標(biāo)區(qū)域,再利用基于k-mer短序列的比對目標(biāo)區(qū)域修正算法進(jìn)一步縮小參考基因組參與比對的區(qū)域長度,使得序列比對結(jié)果中更容易出現(xiàn)插入變異。序列比對過程是使用本文第2章提出的DNA雙序列全局比對改進(jìn)算法(DNA-NW)實(shí)現(xiàn)的,根據(jù)比對結(jié)果可以有效預(yù)測出InDel變異的類型、長度和斷點(diǎn)位置。針對均聚物序列中可能出現(xiàn)的測序錯誤問題,提出了 InDel預(yù)測結(jié)果的修正方法,設(shè)計(jì)了編碼區(qū)InDel及移碼突變的預(yù)測方法,還提出了InDel純合性和雜合性的判別方法。此外,針對短串聯(lián)重復(fù)序列的預(yù)測問題,提出了一種基于k-mer短序列的預(yù)測方法(kmer-STR)。與常用的短串聯(lián)重復(fù)預(yù)測算法SSRIT相比,kmer-STR算法在保證結(jié)果正確性的前提下,顯著提高了算法的執(zhí)行效率,并能適用于大規(guī);蛐蛄兄卸檀(lián)重復(fù)的預(yù)測過程。3.介紹了結(jié)構(gòu)變異的主要類型及其預(yù)測方法的發(fā)展;針對50bp以上的結(jié)構(gòu)變異預(yù)測問題展開研究,重點(diǎn)研究插入變異、缺失變異、倒位變異、染色體內(nèi)易位和染色體間易位等類型的結(jié)構(gòu)變異特征,提出了一種基于不一致讀片段對和split read的結(jié)構(gòu)變異預(yù)測方法SVDS。該預(yù)測方法能夠預(yù)測插入變異、缺失變異、倒位變異、染色體內(nèi)易位和染色體間易位五種主要的結(jié)構(gòu)變異類型。該結(jié)構(gòu)變異預(yù)測算法的一個顯著特點(diǎn)是在序列比對時保留每條paired-end read的多個可能的比對結(jié)果,從而增加結(jié)構(gòu)變異預(yù)測的敏感度。同時,計(jì)算每個候選結(jié)構(gòu)變異的發(fā)生概率,并利用集合覆蓋問題過濾候選結(jié)果中的假陽性結(jié)構(gòu)變異,從而使算法在敏感度和精確度兩個方面都獲得了較大的提升。4.針對長度在lkb以上的拷貝數(shù)變異預(yù)測問題,本文提出了一種基于隱馬爾科夫模型的拷貝數(shù)變異預(yù)測算法(CNV-HMM)。為了提高預(yù)測結(jié)果的精確度,本文分別對read深度信號的統(tǒng)計(jì)和概率建模問題、測序數(shù)據(jù)的GC偏好性及其校正、比對率及其對read深度的影響等方面進(jìn)行了研究,并提出相應(yīng)的解決方法。為了進(jìn)一步提高拷貝數(shù)變異預(yù)測結(jié)果的敏感度和精確度,CNV-HMM算法還使用了基于split read的結(jié)果優(yōu)化方法,不僅能夠過濾部分假陽性拷貝數(shù)變異,還能夠通過合并相同的變異從而得到更長的拷貝數(shù)變異預(yù)測結(jié)果。
【學(xué)位單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TP301.6;Q811.4
【部分圖文】:

測序技術(shù),第二代,歷程,測序


主流的二代測序技術(shù)主要有羅氏公司的Roche邋454焦磷酸測序、逡逑Illumina公司的Solexa合成測序分析平臺以及ABI公司白勺Solid連接法測序。逡逑二代主流測序技術(shù)平臺的發(fā)展歷程如圖1.2所示。其中,Roche454焦磷酸測序逡逑的讀長較長,但成本較高、準(zhǔn)確度較低,因此市場占有率不高;Solid連接法測逡逑序主要采用雙色編碼技術(shù),目前也幾乎被市場淘汰。逡逑邐?邐aW邋?邐■逡逑Roche邋454邐ABI邋Solid邐Illumina邋HiSeq邋X邋Ten逡逑Illumina邋Solexa邐Illumina邋HiSeq邋2000逡逑圖1.2第二代測序技術(shù)平臺發(fā)展歷程逡逑二代測序技術(shù)主要分為單端測序和雙末端測序兩種,主要區(qū)別在于DNA逡逑或RNA樣本的制備方法和數(shù)據(jù)分析方法的不同。逡逑單端測序(Single-end邋Sequencing)是將供體樣本基因序列隨機(jī)打碎后形成逡逑200-500bp的片段,并在片段的…端加引物,末端加接頭,上機(jī)對每個片段進(jìn)逡逑行測序,如圖1.3所示。單端測序操作步驟較少,建庫方式簡單,經(jīng)常用于小逡逑基因組、轉(zhuǎn)錄組、宏基因組測序。逡逑7逡逑

路徑圖,矩陣,路徑,算法


需要注意的是,這三個值中并不是只有一個是最大值,有可能出現(xiàn)兩個最大值。逡逑例如:供體樣本基因序列與參考基因組相比存在一個5邋bp的deletion變異,逡逑如圖2.3所示:逡逑Ref:邋ATGTGCCCGTC逡逑1邐I邐I邐I邋I邋I邐I邐I邐I邐I邐I逡逑Donor:邐ATG邐一-邋一一邐-邐G邐T邐C逡逑圖2.3樣本DNA序列中一個5邋bp的deletion變異逡逑如果設(shè)定評分規(guī)則為堿基匹配成功+10,堿基錯配-3,空位&ap=-5,艮P:逡逑(10邐=邋Tj)逡逑s(dj>rj)邋=邋)邋3邐(dWj)逡逑卜5⑷⑴刃二丨丨-丨丨)逡逑利用Needlcman-Wimsch算法計(jì)算得分矩陣后,從最右下角單元格開始Q嬪義纖藎繽跡玻村澹ǎ幔┧荊疑塵暗ピ癖硎鏡木褪峭暾幕廝萋肪。辶x希粒裕牽裕牽緬澹茫茫牽裕緬義希板危靛危保板危保靛危玻板危玻靛危常板危常靛危矗板危矗靛危擔(dān)板危擔(dān)靛義希鈴澹靛危保板危靛危靛危保板危保靛危玻板危玻靛危常板危常靛危矗板義、T邋-10逦5逦20逦1(dān)蓿保埃麇危靛危板危靛危保板危保靛危玻板危玻靛義希清危保靛危板危保靛危常板危玻擔(dān)蓿蓿掊危保靛危保板危靛危板危靛危保板義希清危玻板危靛危保板危玻靛危玻峰;'邋35邋'、30逦25逦20逦15逦10逦5辶x希藻危玻靛危保板危靛危玻板危常靛危常板,逦32逦27逦22逦17逦25逦20辶x希緬危常板危保靛危板危保靛危常板危常插危矗板危矗插危常峰危常插危玻峰危常靛義希蟈

本文編號:2832423

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2832423.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2382***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
久草国产精品一区二区| 日本乱论一区二区三区| 大香蕉网国产在线观看av| 国产又大又黄又粗又免费| 色婷婷激情五月天丁香| 国产中文字幕一二三区| 欧美乱视频一区二区三区| 精品日韩国产高清毛片| 日韩在线视频精品视频| 国产精品一级香蕉一区| 亚洲欧洲成人精品香蕉网| 国产欧美韩日一区二区三区| 国产伦精品一区二区三区高清版| 91人妻人人澡人人人人精品| 亚洲国产精品久久综合网| 国产又猛又黄又粗又爽无遮挡| 欧美欧美日韩综合一区| 深夜少妇一区二区三区| 亚洲日本加勒比在线播放| 国产一区二区精品丝袜| 手机在线观看亚洲中文字幕| 国产精品欧美一级免费| 激情国产白嫩美女在线观看| 国产又粗又猛又爽色噜噜| 九九视频通过这里有精品| 五月婷婷综合激情啪啪| 免费黄色一区二区三区| 99久久精品国产麻豆| 欧美成人一区二区三区在线| 亚洲中文字幕在线观看黑人| 粗暴蹂躏中文一区二区三区| 99久久无色码中文字幕免费| 97人妻精品一区二区三区免| 成年女人下边潮喷毛片免费| 国产女同精品一区二区| 国产又大又黄又粗又免费| 国产福利一区二区久久| 91人妻人澡人人爽人人精品| 日本国产欧美精品视频| 国产成人午夜在线视频| 在线观看视频日韩精品 |