天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 天文學(xué)論文 >

面向一種眾核架構(gòu)的宇宙學(xué)多體模擬

發(fā)布時(shí)間:2022-01-08 13:12
  宇宙學(xué)模擬對(duì)于天文學(xué)家了解非線性結(jié)構(gòu)的形成和諸如暗物質(zhì)、暗能量等物質(zhì)的假想形式是必不可少的。普遍使用的純暗物質(zhì)無(wú)碰撞粒子系統(tǒng)是經(jīng)典的N體問(wèn)題模擬。高精度的模擬需要包含數(shù)千億甚至數(shù)萬(wàn)億粒子,因此需要極強(qiáng)的計(jì)算能力和高效的算法。宇宙學(xué)N體模擬一直是高性能計(jì)算領(lǐng)域的一個(gè)重要分支,國(guó)外相關(guān)研究團(tuán)隊(duì)多次憑借超大規(guī)模宇宙N體模擬項(xiàng)目獲得戈登貝爾獎(jiǎng)!吧裢ぬ狻笔俏覈(guó)第一臺(tái)完全自主研發(fā)的高性能計(jì)算系統(tǒng),也是世界上首臺(tái)峰值性能超過(guò)100PFlops的超級(jí)計(jì)算機(jī)。然而在“神威·太湖之光”上一直未見(jiàn)超大規(guī)模的宇宙學(xué)模擬。本文對(duì)中科院國(guó)家天文臺(tái)自研的一款宇宙學(xué)N體模擬軟件PHoToNs進(jìn)行了深入的研究后,針對(duì)國(guó)產(chǎn)眾核處理器SW26010獨(dú)特的硬件結(jié)構(gòu)提出了數(shù)個(gè)性能優(yōu)化方案,對(duì)軟件中模擬宇宙演化的粒子間作用力計(jì)算模塊進(jìn)行了重新設(shè)計(jì),實(shí)現(xiàn)了用于宇宙學(xué)N體模擬、能夠充分發(fā)揮國(guó)產(chǎn)超級(jí)計(jì)算機(jī)“神威太湖之光”的體系結(jié)構(gòu)優(yōu)勢(shì)的軟件SwPHoToNs。利用SwPHoToNs,我們?cè)?,200,000個(gè)核上進(jìn)行了包含6400億個(gè)粒子的宇宙學(xué)模擬,獲得了29.44PFlops的持續(xù)性能,并行效率為84.6%,計(jì)算效率為4... 

【文章來(lái)源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:77 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向一種眾核架構(gòu)的宇宙學(xué)多體模擬


二維空間下四叉樹(shù)結(jié)構(gòu)示意圖

對(duì)比圖,對(duì)比圖,粒子,多極


esh,粒子樹(shù))[15],其中使用PM方法計(jì)算長(zhǎng)程力,PP法或樹(shù)形法計(jì)算短程力。這些方法的計(jì)算復(fù)雜度一般為O(NlogN)。由于模擬系統(tǒng)中粒子總數(shù)已增長(zhǎng)到數(shù)千億甚至上萬(wàn)億,上述方法的求解時(shí)間仍然不令人滿意。由Greengard和Rokhlin發(fā)明的快速多極子方法(FMM)[16]可以在給定精度下提供O(N)的計(jì)算復(fù)雜度。FMM是為了在N體系統(tǒng)中更快地計(jì)算長(zhǎng)程力而開(kāi)發(fā)的。它在某些方面與樹(shù)形法相似,但使用的是勢(shì)而不是力。并且受力單元不是單個(gè)的粒子,而是粒子集,BH樹(shù)中則是計(jì)算粒子和粒子集之間的作用。兩者構(gòu)造結(jié)構(gòu)差別如圖1-2所示如圖所示。圖1-2BHA和FMM對(duì)比圖FMM通過(guò)層次劃分和位勢(shì)函數(shù)的多極子展開(kāi)計(jì)算各點(diǎn)的位勢(shì),再將各點(diǎn)的位勢(shì)轉(zhuǎn)化后計(jì)算各點(diǎn)所受的力,再計(jì)算其運(yùn)動(dòng),簡(jiǎn)單來(lái)說(shuō)是對(duì)位勢(shì)函數(shù)在遠(yuǎn)場(chǎng)作多極子展開(kāi),即遠(yuǎn)程粒子集的作用,然后轉(zhuǎn)化為近場(chǎng)的局部展開(kāi)。因?yàn)榭焖俣鄻O子方法的計(jì)算精度和劃分的層次有關(guān),因此可以達(dá)到任意的計(jì)算精度。由于FMM計(jì)算復(fù)雜度僅為O(N),且精度可控,因此被美國(guó)計(jì)算物理協(xié)會(huì)評(píng)為20世紀(jì)十大算法之一。1.2.2硬件平臺(tái)發(fā)展超級(jí)計(jì)算機(jī)過(guò)去幾十年里發(fā)展迅速。在短短20年里,頂級(jí)超級(jí)計(jì)算機(jī)的峰值性能已經(jīng)從每秒1012次浮點(diǎn)運(yùn)算(TFlops)增長(zhǎng)到每秒1015次浮點(diǎn)運(yùn)算(PFlops),現(xiàn)在正朝著每秒1018次浮點(diǎn)運(yùn)算(EFlops)邁進(jìn)。這種巨大增長(zhǎng)很大程度上是源于使用GPU或多核芯片等加速器設(shè)備的異構(gòu)架構(gòu)的興起。早期的高性能計(jì)算使用的是單核處理器,在單核處理器時(shí)期,為了增強(qiáng)處理器的性能,一是改進(jìn)處理器的制造來(lái)提升主頻,二是提高每周期執(zhí)行指令數(shù)。但是隨著處理器

短程力,引力,正方形,粗顆粒


欠匠?.6而不是方程2.5。之后利用這個(gè)勢(shì)計(jì)算長(zhǎng)程力。利用方程2.8直接計(jì)算短程力,在該程序中,短程力使用樹(shù)方法近似計(jì)算。同時(shí)從方程中可以看出,隨著分離度的增加,短程力的大小迅速下降,超過(guò)一定范圍后,可以忽略不計(jì)。在進(jìn)行PM和Tree兩個(gè)計(jì)算的在引力中的占比分析時(shí),Bagla發(fā)現(xiàn),長(zhǎng)程力和短程力的占比Rcut是sr的3.5倍,那么重力計(jì)算的誤差小于1%。Springel使用Gadget-2模擬[38]用更嚴(yán)格的切割比R=4.5r,1.2cutssgr。Springel表明,在更高的精度下Rcut應(yīng)大于5.4倍的g,最終PHoToNs選擇R6cutg。圖2-1力的長(zhǎng)短分裂(右圖為左圖的放大部分)圖2-1顯示了力的長(zhǎng)短分裂的概念,粗顆粒(粗實(shí)線正方形)表示的是樹(shù)的節(jié)點(diǎn),細(xì)顆粒(細(xì)實(shí)線正方形)是內(nèi)部的PM網(wǎng)格,粗顆粒的大小恰好為細(xì)顆粒的6倍,由所示虛線可以看出一個(gè)目標(biāo)點(diǎn)進(jìn)行引力計(jì)算時(shí),只需要考慮其所在的正方形的相鄰顆粒和自身。PM的計(jì)算如圖中箭頭所示,樹(shù)的每個(gè)節(jié)點(diǎn)存儲(chǔ)2個(gè)極矩M和L,將粒子間的力轉(zhuǎn)化為極矩之間的相互作用。其中計(jì)算引力的運(yùn)算符有6個(gè):P2M、M2M、M2L、L2L、L2P和P2P。任何目標(biāo)區(qū)域(粒子所在的正方形)的重力是長(zhǎng)程PM力和短程樹(shù)力的總和。虛線圓的半徑正好是PM網(wǎng)格的六倍,因此相鄰的地面樹(shù)節(jié)點(diǎn)(粗顆粒)包含了計(jì)算所需的所有信息。PHoToNs使用這種PM-Tree算法進(jìn)行引力計(jì)算,雖然這種方法可以保證高精度的模擬,但是帶來(lái)了兩個(gè)計(jì)算量上較大的超越函數(shù)exp函數(shù)和erfc函數(shù)。因此對(duì)于這兩個(gè)函數(shù)在“神威·太湖之光”如何進(jìn)行高精度且快速的計(jì)算是一個(gè)很重要的問(wèn)題。

【參考文獻(xiàn)】:
期刊論文
[1]基于數(shù)據(jù)表精簡(jiǎn)算法的超越函數(shù)訪存優(yōu)化方法[J]. 孟虹松,郭紹忠,許謹(jǐn)晨,王磊,張乾坤.  信息工程大學(xué)學(xué)報(bào). 2019(03)
[2]宇宙大尺度結(jié)構(gòu)數(shù)值模擬的研究進(jìn)展[J]. 唐林,林偉鵬.  天文學(xué)進(jìn)展. 2018(02)
[3]多核處理器發(fā)展趨勢(shì)及關(guān)鍵技術(shù)[J]. 周楠,胡娟,胡海明.  計(jì)算機(jī)工程與設(shè)計(jì). 2018(02)
[4]“神威·太湖之光”及其應(yīng)用系統(tǒng)[J]. 楊廣文,趙文來(lái),丁楠,段芳.  科學(xué). 2017(03)
[5]“神威太湖之光”超級(jí)計(jì)算機(jī)[J]. 王濤.  科學(xué). 2016(04)
[6]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG.  Science China(Information Sciences). 2016(07)
[7]現(xiàn)代宇宙學(xué)中的數(shù)值模擬技術(shù)和應(yīng)用[J]. 馮瓏瓏,朱維善.  中國(guó)科學(xué):物理學(xué) 力學(xué) 天文學(xué). 2013(06)
[8]多體問(wèn)題在GPU上實(shí)現(xiàn)的討論[J]. 徐磊,徐瑩.  計(jì)算機(jī)應(yīng)用與軟件. 2012(01)
[9]N-body算法及其并行化[J]. 王小偉,郭力,楊章遠(yuǎn).  計(jì)算機(jī)與應(yīng)用化學(xué). 2003(Z1)

博士論文
[1]宇宙大尺度結(jié)構(gòu)的統(tǒng)計(jì)研究[D]. 楊小虎.中國(guó)科學(xué)技術(shù)大學(xué) 2002



本文編號(hào):3576620

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/tianwen/3576620.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f09d9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com