天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

增強(qiáng)型稀疏后綴數(shù)組索引的高錯(cuò)誤率reads比對(duì)

發(fā)布時(shí)間:2021-08-20 15:54
  生物序列比對(duì)有助于定位序列之間的相似區(qū)域.測(cè)序技術(shù)的快速發(fā)展需要序列比對(duì)算法能夠靈活地處理更長(zhǎng)且錯(cuò)誤率更高的reads序列.通過(guò)增強(qiáng)型稀疏后綴數(shù)組對(duì)參考序列建立索引,自適應(yīng)地調(diào)整種子的最小長(zhǎng)度,尋找參考序列與reads序列之間的最大精確匹配和超大精確匹配,以此進(jìn)行種子擴(kuò)展,提出一種改進(jìn)的long-read比對(duì)算法.與已有代表性的算法相比,模擬和真實(shí)數(shù)據(jù)實(shí)驗(yàn)結(jié)果表明,本文算法在獲得基本相同精確度的前提下,召回率明顯提升,敏感度總體上更高,且能夠識(shí)別更多的reads序列. 

【文章來(lái)源】:小型微型計(jì)算機(jī)系統(tǒng). 2019,40(08)北大核心CSCD

【文章頁(yè)數(shù)】:5 頁(yè)

【部分圖文】:

增強(qiáng)型稀疏后綴數(shù)組索引的高錯(cuò)誤率reads比對(duì)


不同錯(cuò)誤率的模擬數(shù)據(jù)上算法的精確度Fig.1Accuracyofalgorithmsforsimulatedreadswith

召回率,錯(cuò)誤率,模擬數(shù)據(jù),突變率


和10%(錯(cuò)誤率取Wgsim的默認(rèn)值)時(shí),圖3和圖4分別給出了Kart與sufKart算法的精確度和召回率.圖2不同錯(cuò)誤率的模擬數(shù)據(jù)上算法的召回率Fig.2Recallrateofalgorithmsforsimulatedreadswithdifferenterrorrates由圖3和圖4可知:當(dāng)突變率高達(dá)8%以上時(shí),不論是精確度還是召回率,sufKart算法幾乎均高于Kart算法.圖3不同突變率的模擬數(shù)據(jù)上算法的精確度Fig.3Accuracyofalgorithmsforsimulatedreadswithdifferentmutationrates在實(shí)際應(yīng)用中,各類測(cè)序平臺(tái)產(chǎn)生的reads不僅僅只包含簡(jiǎn)單的插入刪除錯(cuò)誤而且還包括比較復(fù)雜的結(jié)構(gòu)變異.因此,本文生成不同錯(cuò)誤率和突變率的模擬reads數(shù)據(jù)集進(jìn)行實(shí)驗(yàn).圖4不同突變率的模擬數(shù)據(jù)上算法的召回率Fig.4Recallrateofalgorithmsforsimulatedreadswithdifferentmutationrates表1給出了長(zhǎng)度1000bp,錯(cuò)誤率分別為2%、5%、10%和15%,突變率為2%、5%、8%和10%時(shí),Kart和sufKart算法對(duì)模擬數(shù)據(jù)reads進(jìn)行實(shí)驗(yàn)獲得的精確度和召回率,其中“E02-R02”表示錯(cuò)誤率為2%,突變率為2%的reads數(shù)據(jù)集,其他類推.從表1可以看出:當(dāng)每組模擬數(shù)據(jù)reads的(錯(cuò)誤率,突變率)分別為(2%,5%)、(2%,8%)、(5%,2%)和(5%,5%)時(shí),sufKart算法的精確度高于Kart算法,且召回率幾乎表1不同錯(cuò)誤率和突變率的模擬數(shù)據(jù)上算法的精確度和召回率Table1Accuracyandrecallrateofalgorithmswithdifferenterrorratesandmutationratesonsimulationdata數(shù)據(jù)集KartsufKart精確度(%)召回率(%)精確度(%)召回率(%)E02-

突變率,模擬數(shù)據(jù),精確度,召回率


和10%(錯(cuò)誤率取Wgsim的默認(rèn)值)時(shí),圖3和圖4分別給出了Kart與sufKart算法的精確度和召回率.圖2不同錯(cuò)誤率的模擬數(shù)據(jù)上算法的召回率Fig.2Recallrateofalgorithmsforsimulatedreadswithdifferenterrorrates由圖3和圖4可知:當(dāng)突變率高達(dá)8%以上時(shí),不論是精確度還是召回率,sufKart算法幾乎均高于Kart算法.圖3不同突變率的模擬數(shù)據(jù)上算法的精確度Fig.3Accuracyofalgorithmsforsimulatedreadswithdifferentmutationrates在實(shí)際應(yīng)用中,各類測(cè)序平臺(tái)產(chǎn)生的reads不僅僅只包含簡(jiǎn)單的插入刪除錯(cuò)誤而且還包括比較復(fù)雜的結(jié)構(gòu)變異.因此,本文生成不同錯(cuò)誤率和突變率的模擬reads數(shù)據(jù)集進(jìn)行實(shí)驗(yàn).圖4不同突變率的模擬數(shù)據(jù)上算法的召回率Fig.4Recallrateofalgorithmsforsimulatedreadswithdifferentmutationrates表1給出了長(zhǎng)度1000bp,錯(cuò)誤率分別為2%、5%、10%和15%,突變率為2%、5%、8%和10%時(shí),Kart和sufKart算法對(duì)模擬數(shù)據(jù)reads進(jìn)行實(shí)驗(yàn)獲得的精確度和召回率,其中“E02-R02”表示錯(cuò)誤率為2%,突變率為2%的reads數(shù)據(jù)集,其他類推.從表1可以看出:當(dāng)每組模擬數(shù)據(jù)reads的(錯(cuò)誤率,突變率)分別為(2%,5%)、(2%,8%)、(5%,2%)和(5%,5%)時(shí),sufKart算法的精確度高于Kart算法,且召回率幾乎表1不同錯(cuò)誤率和突變率的模擬數(shù)據(jù)上算法的精確度和召回率Table1Accuracyandrecallrateofalgorithmswithdifferenterrorratesandmutationratesonsimulationdata數(shù)據(jù)集KartsufKart精確度(%)召回率(%)精確度(%)召回率(%)E02-

【參考文獻(xiàn)】:
期刊論文
[1]CPU和GPU協(xié)同并行加速多生物序列比對(duì)[J]. 楊春燕,鐘誠(chéng).  小型微型計(jì)算機(jī)系統(tǒng). 2016(12)



本文編號(hào):3353788

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3353788.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e202a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com