天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

大規(guī)模申威眾核環(huán)境下二維數(shù)據(jù)計算的可擴(kuò)展方法

發(fā)布時間:2021-09-18 17:36
  隨著超級計算機(jī)及其編程環(huán)境的發(fā)展,異構(gòu)系統(tǒng)結(jié)構(gòu)下的多級并行編程將成為趨勢,神威·太湖之光國產(chǎn)超級計算機(jī)就是其中的一個典型。自2016年神威·太湖之光運(yùn)行以來,國內(nèi)外很多學(xué)者在其上進(jìn)行了方法研究和應(yīng)用驗證,為申威環(huán)境積累了比較豐富的眾核化編程方法及優(yōu)化方法。但是,將全球系統(tǒng)模式CESM移植到申威眾核環(huán)境時,對于海洋分量模式POP中的一些二維數(shù)據(jù)計算,常用的眾核優(yōu)化方法在1 024進(jìn)程規(guī)模下運(yùn)行時具有較好的加速效果,然而在16 800大規(guī)模進(jìn)程下運(yùn)行時眾核化會失效,表現(xiàn)為負(fù)加速。針對上述問題,文中提出了一種基于從核分區(qū)的并行計算方法,一個核組內(nèi)的64個從核被分成多個互不交叉的從核分區(qū),將可以獨(dú)立計算的多個代碼段計算任務(wù)分別分配到不同的從核分區(qū)上進(jìn)行運(yùn)行,能夠有效利用從核的計算能力,還可以實現(xiàn)對多個獨(dú)立的代碼段進(jìn)行計算時間隱藏。每個從核分區(qū)內(nèi)的從核數(shù)量及從核號可以根據(jù)擬分配的計算任務(wù)情況進(jìn)行適當(dāng)選取,使得每個從核都能達(dá)到較適宜的數(shù)據(jù)量和計算量。在采用前述從核分區(qū)方法的基礎(chǔ)上,結(jié)合使用循環(huán)合并和函數(shù)上提等方法增大程序并行粒度,提高了二維數(shù)據(jù)計算在大規(guī)模進(jìn)程下的可擴(kuò)展性,CESM模式高分辨率G算... 

【文章來源】:計算機(jī)科學(xué). 2020,47(08)北大核心CSCD

【文章頁數(shù)】:6 頁

【部分圖文】:

大規(guī)模申威眾核環(huán)境下二維數(shù)據(jù)計算的可擴(kuò)展方法


主核和基于循環(huán)眾核化下動量平流項在不同進(jìn)程中的耗時

體系架構(gòu),處理器


神威·太湖之光國產(chǎn)超級計算機(jī)的眾核環(huán)境主要由申威異構(gòu)眾核處理器、高速計算網(wǎng)絡(luò)和高性能文件系統(tǒng)構(gòu)成。國產(chǎn)申威SW26010處理器的架構(gòu)如圖3所示。SW26010處理器體系架構(gòu)的詳細(xì)介紹可參考文獻(xiàn)[9-11]。基于SW26010的系統(tǒng)架構(gòu),必須采取利用從核的計算能力來減小從核訪問主存的開銷、使用基于訪存帶寬來優(yōu)化數(shù)據(jù)傳輸?shù)却胧?才能充分發(fā)揮SW26010處理器的性能[12]。

流程圖,流程圖,停流,次數(shù)


POP求解正壓二維表面壓力的橢圓方程共分為5個步驟,其中第4步和第5步在循環(huán)中執(zhí)行多次,基于循環(huán)眾核化會導(dǎo)致從核啟停頻繁。因此,考慮對多個循環(huán)執(zhí)行一次spawn和join,相應(yīng)的從核線程啟停流程如圖4所示。合并循環(huán)提高了眾核化并行粒度,其與基于循環(huán)的眾核化的差別是需要總體分析數(shù)據(jù)的athread_get和athread_put需求,可能需要增加額外的處理(如寄存器通信、臨界計算等),其優(yōu)勢是減少了線程啟停次數(shù)和中間臨時數(shù)據(jù)的傳入傳出次數(shù)。這樣,中間變量都可以保存在從核的局存LDM中進(jìn)行重復(fù)利用,減少了不必要的get/put。

【參考文獻(xiàn)】:
期刊論文
[1]基于十億億次國產(chǎn)超算系統(tǒng)的流體力學(xué)軟件眾核適應(yīng)性研究[J]. 李芳,李志輝,徐金秀,范昊,褚學(xué)森,李新亮.  計算機(jī)科學(xué). 2020(01)
[2]基于“神威·太湖之光”的區(qū)域海洋模式并行優(yōu)化[J]. 吳琦,倪裕芳,黃小猛.  計算機(jī)研究與發(fā)展. 2019(07)
[3]“神威·太湖之光”計算機(jī)系統(tǒng)大規(guī)模應(yīng)用特征分析與E級可擴(kuò)展性研究[J]. 劉鑫,郭恒,孫茹君,陳左寧.  計算機(jī)學(xué)報. 2018(10)
[4]全球渦分辨率并行海洋模式POP在神威藍(lán)光上的移植和應(yīng)用[J]. 趙偉,雷曉燕,陳德訓(xùn),趙春,宋振亞.  計算機(jī)應(yīng)用與軟件. 2014(05)
[5]地球系統(tǒng)模式CESM及其在高性能計算機(jī)上的配置應(yīng)用實例[J]. 萬修全,劉澤棟,沈飆,林霄沛,吳德星.  地球科學(xué)進(jìn)展. 2014(04)
[6]海洋環(huán)流數(shù)值模式POP的GPU并行優(yōu)化[J]. 郭松,竇勇,雷元武.  計算機(jī)工程與科學(xué). 2012(08)
[7]POP海洋模式在四核至強(qiáng)集群上的并行計算[J]. 張理論,趙軍,吳建平,宋君強(qiáng).  計算機(jī)工程與應(yīng)用. 2009(05)



本文編號:3400559

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3400559.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶af883***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com