基于ROCm并行探測(cè)部分子級(jí)聯(lián)中的首次碰撞
發(fā)布時(shí)間:2022-02-15 23:46
在超相對(duì)論重離子碰撞過程中的部分子級(jí)聯(lián)過程,可以認(rèn)為是由一系列的兩夸克膠子碰撞所組成,但僅利用CPU串行仿真該過程用時(shí)較長(zhǎng)。本次仿真創(chuàng)新性地首次采用ROCm并行技術(shù)在AMD Vega10上對(duì)首次兩夸克膠子碰撞的探測(cè)實(shí)現(xiàn)了并行化處理,計(jì)算出并行程序探測(cè)到的首次兩夸克膠子碰撞所需的時(shí)間,及其對(duì)應(yīng)的夸克膠子對(duì)序號(hào)。另外分別采用CUDA平臺(tái)的NVIDIA的P100和OpenMP平臺(tái)的Intel Xeon CPU E5-2690進(jìn)行驗(yàn)證。關(guān)于第一次碰撞的探測(cè),在上述三個(gè)平臺(tái)上得到相同的結(jié)果。相對(duì)于基于CPU串行探測(cè)首次碰撞而言,采用ROCm并行探測(cè)超相對(duì)論重離子中部分子級(jí)聯(lián)中的首次碰撞,可獲得最高加速比,可達(dá)18600倍。
【文章來源】:計(jì)算機(jī)仿真. 2020,37(03)北大核心
【文章頁數(shù)】:4 頁
【部分圖文】:
并行算法流程圖
圖2 串行算法流程圖
從圖3不同線程數(shù)的程序用時(shí)不難看出,在OpenMP平臺(tái)下隨著使用線程數(shù)的增加,算法用時(shí)線性減少,但在使用12個(gè)以上的線程時(shí),加速的幅度下降,并趨于穩(wěn)定,不隨使用線程數(shù)的增加而線性下降。即使運(yùn)用了CPU的所有線程,也無法趕上ROCm平臺(tái)和CUDA平臺(tái)的計(jì)算處理能力。5 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]CUDA并行計(jì)算的應(yīng)用研究[J]. 董犖,葛萬成,陳康力. 信息技術(shù). 2010(04)
[2]CUDA高性能計(jì)算并行編程[J]. 李波,趙華成,張敏芳. 微型電腦應(yīng)用. 2009(09)
碩士論文
[1]OpenMP并行編程模型與性能優(yōu)化方法的研究及應(yīng)用[D]. 游佐勇.成都理工大學(xué) 2011
本文編號(hào):3627497
【文章來源】:計(jì)算機(jī)仿真. 2020,37(03)北大核心
【文章頁數(shù)】:4 頁
【部分圖文】:
并行算法流程圖
圖2 串行算法流程圖
從圖3不同線程數(shù)的程序用時(shí)不難看出,在OpenMP平臺(tái)下隨著使用線程數(shù)的增加,算法用時(shí)線性減少,但在使用12個(gè)以上的線程時(shí),加速的幅度下降,并趨于穩(wěn)定,不隨使用線程數(shù)的增加而線性下降。即使運(yùn)用了CPU的所有線程,也無法趕上ROCm平臺(tái)和CUDA平臺(tái)的計(jì)算處理能力。5 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]CUDA并行計(jì)算的應(yīng)用研究[J]. 董犖,葛萬成,陳康力. 信息技術(shù). 2010(04)
[2]CUDA高性能計(jì)算并行編程[J]. 李波,趙華成,張敏芳. 微型電腦應(yīng)用. 2009(09)
碩士論文
[1]OpenMP并行編程模型與性能優(yōu)化方法的研究及應(yīng)用[D]. 游佐勇.成都理工大學(xué) 2011
本文編號(hào):3627497
本文鏈接:http://sikaile.net/kejilunwen/wulilw/3627497.html
最近更新
教材專著