天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

混合異構(gòu)架構(gòu)上的生物大數(shù)據(jù)并行計(jì)算研究

發(fā)布時(shí)間:2020-12-16 18:47
  本文主要的研究?jī)?nèi)容是生物大數(shù)據(jù)在多種高性能異構(gòu)計(jì)算架構(gòu)下的并行計(jì)算方法,主要解決了三方面的挑戰(zhàn):(。┰谟邢薜膬(nèi)存空間中對(duì)大規(guī)模數(shù)據(jù)集執(zhí)行計(jì)算的方法,(ⅱ)基于異構(gòu)計(jì)算的多層級(jí)的算法并行化設(shè)計(jì)方法和(ⅲ)對(duì)不同架構(gòu)計(jì)算設(shè)備的硬件抽象建模方法。在這三方面的研究中,抽象硬件模型是最重要的貢獻(xiàn),提供了一個(gè)良好的抽象硬件底層,將框架設(shè)計(jì)和具體硬件分離,簡(jiǎn)化了軟件框架,可以使軟件框架快速擴(kuò)展覆蓋多種硬件架構(gòu),并能夠以簡(jiǎn)便抽象的方式控制內(nèi)存布局。同時(shí)提供了一個(gè)簡(jiǎn)化的硬件視角,抽象出影響性能的關(guān)鍵因素,進(jìn)而在此基礎(chǔ)上設(shè)計(jì)效率更高的并行方法。由于高通量測(cè)序技術(shù)的快速進(jìn)展,在過(guò)去的十年中,生物序列數(shù)據(jù)的數(shù)量出現(xiàn)了爆炸性增長(zhǎng)。生物學(xué)家存在分析和理解這些數(shù)據(jù)的強(qiáng)烈需求,因?yàn)榛蛐蛄袥Q定了蛋白質(zhì)的生物結(jié)構(gòu)以及功能。但是,生物數(shù)據(jù)的可用性并不隨著數(shù)據(jù)庫(kù)的膨脹而增加。事實(shí)上,目前生物數(shù)據(jù)庫(kù)的數(shù)據(jù)量如此之大以至于傳統(tǒng)的數(shù)據(jù)分析方法已不足以快速執(zhí)行涉及多種數(shù)據(jù)類(lèi)型的生命科學(xué)查詢(xún)。另一方面,近年來(lái)的計(jì)算力增長(zhǎng)主要體現(xiàn)在新興體系結(jié)構(gòu)上,如GPU,Xeon Phi和基于Alpha指令集的國(guó)產(chǎn)申威眾核處理器上。新興體系結(jié)構(gòu)呈... 

【文章來(lái)源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:134 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

混合異構(gòu)架構(gòu)上的生物大數(shù)據(jù)并行計(jì)算研究


圖3.1比對(duì)沿著一組序列推進(jìn)的示愆閣

框架圖,數(shù)據(jù)并行,框架,序列


??圖3.1比對(duì)沿著一組序列推進(jìn)的示愆閣。坫兩個(gè)序列之問(wèn)的斷點(diǎn)空14殘祜填充,川紅??色農(nóng)示。??據(jù)庫(kù)序列組的方式。在圖3.1中,我們首先對(duì)數(shù)據(jù)庫(kù)序列填充,使其填充后的長(zhǎng)度??為4的倍數(shù),這樣可以減少底層代碼中的執(zhí)行路徑分支,從而提升計(jì)算效率。將??填充后的序列16條為一組,寫(xiě)人到二維的16通道的內(nèi)存緩沖區(qū)中,以適應(yīng)Xeon??Phi上512位VPU的16個(gè)通道。在將二維緩沖區(qū)序列化寫(xiě)入內(nèi)存的過(guò)程中,來(lái)??自不同序列的字符被寫(xiě)人相鄰的內(nèi)存地址,使得計(jì)算設(shè)備在并行讀取多條序列的??過(guò)程中能夠提高高速緩存命中率。另外,考慮到主機(jī)端的CPU所使用的SSE指??令集同樣能夠?qū)⒚恳粋(gè)向量劃分成16個(gè)通道執(zhí)行計(jì)算,該二維緩存對(duì)于CPU和??Xeon?Phi而言是通用的。值得注意的是

序列,構(gòu)造方法,分?jǐn)?shù),序列


這里私叫是查詢(xún)序列,它的長(zhǎng)度為g/e?。dZw叫是數(shù)據(jù)庫(kù)主序列,辦/en是它的長(zhǎng)??度。其中的■B/ocfe&ad方法即為塊搜索方法,見(jiàn)算法3.2。Shuffle方法被用來(lái)高??效地構(gòu)建分?jǐn)?shù)譜,以便于計(jì)算函數(shù)高效訪(fǎng)問(wèn)得分矩陣[94],它的工作過(guò)程如圖3.3。??圖3.4展示了組搜索方法的整體計(jì)算過(guò)程,我們?cè)诒菊轮蟹Q(chēng)之為單遍方法。??由于Xeon?Phi上的寄存器/緩存資源有限,我們將分配給Xeon?Phi的序列組??進(jìn)一步劃分為一組連續(xù)的區(qū)塊(見(jiàn)圖3.1)。在比對(duì)計(jì)算過(guò)程中,沿著該區(qū)塊的同??一行的]6個(gè)殘基將以細(xì)粒度并行方式與查詢(xún)序列進(jìn)行比對(duì)計(jì)算。這個(gè)過(guò)程一直??持續(xù)到序列組內(nèi)的所有區(qū)塊均掃描完畢。圖3.1示意了沿著二維16通道序列組的??推進(jìn)計(jì)算的方式。我們還發(fā)現(xiàn),在移動(dòng)到下一個(gè)查詢(xún)殘基之前,計(jì)算數(shù)據(jù)庫(kù)序列??緩沖區(qū)中的四個(gè)連續(xù)殘基可以提高捜索效率。所以我們已經(jīng)使每個(gè)區(qū)塊由64個(gè)??(16x4)殘基組成。特別的,當(dāng)二維緩存中的某一條序列結(jié)束時(shí),當(dāng)前通道中會(huì)??出現(xiàn)一個(gè)斷點(diǎn)。在這種情況下,首先序列記錄當(dāng)前序列中的分?jǐn)?shù),然后重置該通??道對(duì)應(yīng)的迅

【參考文獻(xiàn)】:
期刊論文
[1]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG.  Science China(Information Sciences). 2016(07)



本文編號(hào):2920613

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2920613.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)31113***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com