天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于讀分割最優(yōu)匹配的indels識(shí)別算法

發(fā)布時(shí)間:2018-06-27 16:51

  本文選題:結(jié)構(gòu)變異 + 拷貝數(shù)變異 ; 參考:《軟件學(xué)報(bào)》2017年10期


【摘要】:高通量測(cè)序技術(shù)的發(fā)展,極大地推動(dòng)了基因組結(jié)構(gòu)變異識(shí)別的研究.當(dāng)前,該領(lǐng)域主要使用覆蓋度、讀分割或片段組裝方法來(lái)識(shí)別變異,但目前的方法識(shí)別結(jié)果不夠準(zhǔn)確,敏感度高,對(duì)基因組結(jié)構(gòu)變異的信息(如變異序列、變異坐標(biāo)等)挖掘不充分.插入和刪除類型的結(jié)構(gòu)變異統(tǒng)稱為indels,在基因組結(jié)構(gòu)變異中最為常見(jiàn).為此,針對(duì)indels的精確識(shí)別,提出了基于讀分割和動(dòng)態(tài)規(guī)劃的最優(yōu)序列匹配算法(optimal split-read matching algorithm,簡(jiǎn)稱OSRM).OSRM算法能將異常讀片段以最少的空位打斷比對(duì)到參考序列上.首先,建立異常讀片段與特定參考序列的匹配得分矩陣;然后,建立回溯路徑矩陣;最后,用以變異特點(diǎn)設(shè)計(jì)的得分公式對(duì)每條路徑進(jìn)行最優(yōu)匹配篩選,輸出精確識(shí)別的indels坐標(biāo)及序列.實(shí)驗(yàn)結(jié)果顯示,該方法對(duì)小中型的indels有很高的識(shí)別性能.此外,與讀分割法的經(jīng)典算法Pindel進(jìn)行了比較,證實(shí)OSRM算法在小中型的indels識(shí)別方面有更好的效果,可識(shí)別更復(fù)雜的情況.
[Abstract]:The development of high throughput sequencing technology has greatly promoted the study of the identification of genomic structural variation. At present, the domain mainly uses coverage, read segmentation or fragment assembly methods to identify variations, but the current method is not accurate and sensitive, and the information of genome structure variation, such as mutation sequences, variation coordinates, etc., is excavated. Not enough. The structural variation of insert and delete types is called indels, which is the most common in genomic structural variation. For this purpose, an optimal sequence matching algorithm based on read segmentation and dynamic programming (optimal split-read matching algorithm, simply called OSRM).OSRM algorithm is proposed for the precise identification of indels. First, the matching score matrix of the abnormal read fragment and the specific reference sequence is set up; then, the backtracking path matrix is established; finally, the score formula designed with the characteristic of variation is optimized for each path, and the output is accurately identified with the other indels coordinates and sequences. The experimental results show that this method is used. It has high recognition performance for small and medium indels. In addition, compared with the classical algorithm Pindel of read segmentation method, it is proved that the OSRM algorithm has a better effect on small and medium indels recognition and can identify more complex situations.
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;北京建筑大學(xué)電氣與信息工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61402132,61571163,61532014)~~
【分類號(hào)】:Q811.4;TP301.6

【相似文獻(xiàn)】

相關(guān)期刊論文 前6條

1 馬雅楠;孫平平;魏雅卓;陸林英;崔穎;馬志強(qiáng);;改進(jìn)的系統(tǒng)發(fā)育譜算法在蛋白質(zhì)功能注釋中的應(yīng)用[J];生物信息學(xué);2009年01期

2 連帥彬;郭東亮;戴憲華;;基因結(jié)構(gòu)變異檢測(cè)方法綜述[J];現(xiàn)代生物醫(yī)學(xué)進(jìn)展;2012年18期

3 姜雷;;關(guān)于在人類基因組中檢測(cè)結(jié)構(gòu)變異計(jì)算方法的綜述[J];電子世界;2014年06期

4 張雨豪;王亞?wèn)|;;基于高通量測(cè)序數(shù)據(jù)的結(jié)構(gòu)變異檢測(cè)方法的研究[J];智能計(jì)算機(jī)與應(yīng)用;2013年05期

5 劉琪,朱貽盛,王保華,李亦學(xué);基于動(dòng)態(tài)規(guī)劃的跨膜蛋白疏水圖比對(duì)研究[J];高技術(shù)通訊;2001年11期

6 李洪杰,賈旭,楚成才;組織培養(yǎng)誘導(dǎo)外源染色體發(fā)生結(jié)構(gòu)變異及其在小麥易位系創(chuàng)制中的利用[J];遺傳;2001年01期

相關(guān)重要報(bào)紙文章 前1條

1 通訊員 梁淡麗 記者 劉傳書;為人類基因組結(jié)構(gòu)變異檢測(cè)提供新方法[N];科技日?qǐng)?bào);2011年

相關(guān)博士學(xué)位論文 前2條

1 魏哲學(xué);樣本斷點(diǎn)距離問(wèn)題的算法與復(fù)雜性研究[D];山東大學(xué);2015年

2 姜s,

本文編號(hào):2074580


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2074580.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b84d7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com