天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基因數(shù)據(jù)分析處理軟件BQSR的運行加速方案的設(shè)計與實現(xiàn)

發(fā)布時間:2020-04-14 12:42
【摘要】:精準(zhǔn)醫(yī)療是一種可以從基因?qū)用嬖\斷病因的新興疾病診斷方法,它的興起離不開基因數(shù)據(jù)分析處理技術(shù)的發(fā)展。基因數(shù)據(jù)分析處理軟件BQSR是基因數(shù)據(jù)分析處理中的重要一環(huán),用于修正堿基質(zhì)量分?jǐn)?shù),對檢測變異位點的準(zhǔn)確性有著至關(guān)重要的影響。由于基因數(shù)據(jù)規(guī)模較大,目前業(yè)界通用的BQSR軟件在對全基因組數(shù)據(jù)進(jìn)行堿基質(zhì)量分?jǐn)?shù)修正需要幾十甚至上百個小時,這極大的影響了疾病診斷的時效性,因此,本文旨在針對BQSR的耗時瓶頸設(shè)計實現(xiàn)一套運行加速方案。BQSR的運行加速方案主要涉及IO和計算兩個方面,在IO方面,實現(xiàn)了IO線程與計算線程并行化工作;減少了程序每批次處理的序列數(shù)量以減小內(nèi)存壓力;縮短了輸出數(shù)據(jù)壓縮編碼耗時。在計算方面,消除同步鎖提高了多線程的并發(fā)度;重構(gòu)代碼加速了BAQ算法模塊;加速了程序的數(shù)據(jù)緩存機(jī)制和索引機(jī)制;利用相鄰堿基上下文重疊信息提高了堿基上下文編碼計算速度。在實現(xiàn)加速方案后,本文通過三種不同類型的數(shù)據(jù)集對各個加速模塊進(jìn)行單元測試,測試優(yōu)化單元帶來的性能提升,以及優(yōu)化前后輸出的一致性,然后測試BQSR加速后的總體性能提升,測試結(jié)果為:在保證輸出結(jié)果與原程序100%一致的前提下,本文提出的BQSR運行加速方案在TS、WES、WGS三種數(shù)據(jù)集上分別可以加速3.91倍、4.04倍和4.72倍。
【圖文】:

序列,狀態(tài)轉(zhuǎn)移圖,概率,狀態(tài)


圖 2.2 BAQ狀態(tài)轉(zhuǎn)移圖解在 BAQ 實際應(yīng)用中,,增加了 S(start)和 E(end)狀態(tài),如果將 M、I、D、S、E 編號為 0、1、2、3、4,狀態(tài)轉(zhuǎn)移概率矩陣如下所示:(1 2 )(1 ) (1 ) (1 ) 0(1 )(1 ) (1 ) 0 0( ) 1 0 0 0(1 ) / / 0 0 00 0 0 0 0ijaL L = (2-6)這里 代表間隙開啟概率(就是上一個狀態(tài)是M 或 S,下一個狀態(tài)為 I 或 D的概率), 代表間隙擴(kuò)大概率(就是上一個狀態(tài)為 I或 D,下一個仍然為 I或D 的概率), 、 是人為設(shè)定的經(jīng)驗值,r 是樣本序列長度的倒數(shù)的二分之一,代表樣本序列終止的概率,也就是狀態(tài)鏈轉(zhuǎn)移到 E 狀態(tài)的概率。在隱馬爾科夫模型中,除了隱含狀態(tài)之間的轉(zhuǎn)移概率,還有從隱含狀態(tài)到可觀測狀態(tài)的發(fā)射
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP311.13;Q811.4

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 杭渤;束永前;劉平;魏光偉;金健;郝文山;王培俊;李斌;毛建華;;腫瘤的精準(zhǔn)醫(yī)療腫瘤的精準(zhǔn)醫(yī)療:概念、技術(shù)和展望[J];科技導(dǎo)報;2015年15期



本文編號:2627309

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2627309.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e6e5c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com