基于神威太湖之光的宇宙學(xué)多體模擬
發(fā)布時間:2021-12-23 00:34
宇宙學(xué)模擬對于科學(xué)家研究非線性結(jié)構(gòu)的形成以及暗物質(zhì)、暗能量等假想形式具有重要作用,而高精度宇宙學(xué)模擬包含數(shù)千億甚至數(shù)萬億個粒子,因此超級計算機強大的計算能力使其成為解決宇宙學(xué)模擬問題的理想平臺。為在國產(chǎn)神威太湖之光超級計算機上實現(xiàn)宇宙學(xué)N體模擬,分析PHoToNs軟件中使用的粒子網(wǎng)格算法和快速多極子方法,并結(jié)合眾核處理器架構(gòu)提出多層次分解和負(fù)載均衡方案、執(zhí)行樹遍歷和引力計算的流水線策略以及向量化引力計算算法等多種性能優(yōu)化技術(shù),從而實現(xiàn)能充分發(fā)揮神威太湖之光架構(gòu)優(yōu)勢的N體模擬軟件SwPHoToNs。實驗結(jié)果表明,在神威太湖之光超級計算系統(tǒng)的5 200 000個計算核心上進行包含6 400億個粒子的宇宙學(xué)模擬,SwPHoToNs獲得了29.44 PFLOPS的持續(xù)計算速度,且并行和計算效率分別為84.6%和48.3%。
【文章來源】:計算機工程. 2020,46(09)北大核心CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
SW26010體系結(jié)構(gòu)
PHoToNs是針對大規(guī)模并行宇宙模擬[1]而設(shè)計,SwPHoToNs在此基礎(chǔ)上針對Sunway平臺進行設(shè)計和優(yōu)化。PHoToNs軟件將PM和FMM兩種常用算法相結(jié)合,如圖2所示。本文使用PM算法用于遠程引力計算,FMM算法用于短程引力計算,因此將P2P的方程修改為式(1):
如圖3所示,計算框由K-D樹分解。每一個計算節(jié)點作為頂層樹的一個節(jié)點,對應(yīng)一個連續(xù)的空間區(qū)域和一個長方體,也是由局部粒子構(gòu)成的局部樹的根節(jié)點。因此,所有粒子都鏈接到一個完整的全局K-D樹中。在圖3(c)中,點劃線圈內(nèi)粒子間的相互作用由P2P處理,虛線圈內(nèi)粒子間的相互作用由M2L處理。在所有進程中記錄頂層樹,邊界信息需要在進程之間進行通信,在此使用一個額外的遍歷根據(jù)打開角度估計需要發(fā)送給其他進程的本地樹節(jié)點數(shù)量。實際上,引力的長-短分裂保證了邊界交換只發(fā)生在截止半徑內(nèi)。
【參考文獻】:
期刊論文
[1]多體問題在GPU上實現(xiàn)的討論[J]. 徐磊,徐瑩. 計算機應(yīng)用與軟件. 2012(01)
本文編號:3547417
【文章來源】:計算機工程. 2020,46(09)北大核心CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
SW26010體系結(jié)構(gòu)
PHoToNs是針對大規(guī)模并行宇宙模擬[1]而設(shè)計,SwPHoToNs在此基礎(chǔ)上針對Sunway平臺進行設(shè)計和優(yōu)化。PHoToNs軟件將PM和FMM兩種常用算法相結(jié)合,如圖2所示。本文使用PM算法用于遠程引力計算,FMM算法用于短程引力計算,因此將P2P的方程修改為式(1):
如圖3所示,計算框由K-D樹分解。每一個計算節(jié)點作為頂層樹的一個節(jié)點,對應(yīng)一個連續(xù)的空間區(qū)域和一個長方體,也是由局部粒子構(gòu)成的局部樹的根節(jié)點。因此,所有粒子都鏈接到一個完整的全局K-D樹中。在圖3(c)中,點劃線圈內(nèi)粒子間的相互作用由P2P處理,虛線圈內(nèi)粒子間的相互作用由M2L處理。在所有進程中記錄頂層樹,邊界信息需要在進程之間進行通信,在此使用一個額外的遍歷根據(jù)打開角度估計需要發(fā)送給其他進程的本地樹節(jié)點數(shù)量。實際上,引力的長-短分裂保證了邊界交換只發(fā)生在截止半徑內(nèi)。
【參考文獻】:
期刊論文
[1]多體問題在GPU上實現(xiàn)的討論[J]. 徐磊,徐瑩. 計算機應(yīng)用與軟件. 2012(01)
本文編號:3547417
本文鏈接:http://sikaile.net/kejilunwen/tianwen/3547417.html
教材專著