海洋環(huán)流模式LICOM的GPU實(shí)現(xiàn)與優(yōu)化
發(fā)布時(shí)間:2021-04-14 21:51
【目的】為了加速海洋環(huán)流模式LICOM的積分計(jì)算,降低因分辨率的提升而帶來(lái)的運(yùn)行成本,本文設(shè)計(jì)并實(shí)現(xiàn)了基于CUDA C的GPU加速版本。【方法】本文基于目前最新的LICOM3版本,在分析LICOM海洋網(wǎng)格塊的并行算法的基礎(chǔ)上,結(jié)合使用CUDA線程并行計(jì)算海洋網(wǎng)格點(diǎn),將LICOM主要計(jì)算程序移植到GPU平臺(tái)上,并從數(shù)據(jù)傳輸和設(shè)備內(nèi)存的使用兩個(gè)方面進(jìn)行優(yōu)化!窘Y(jié)果】實(shí)驗(yàn)表明,GPU版本模擬結(jié)果的與原CPU版本基本一致。與使用相同數(shù)量的Intel Xeon E5-2680 V2 CPU相比,使用2至16塊NVIDIA K20 GPU單個(gè)模式天加速了9.31到1.27倍。【局限】由于LICOM3計(jì)算的邊界同步通信比較多,限制了程序的可擴(kuò)展性,未來(lái)需要通過(guò)邊界通信優(yōu)化和算法優(yōu)化來(lái)提高模式的可擴(kuò)展性。【結(jié)論】本文對(duì)LICOM3程序進(jìn)行了GPU版本的實(shí)現(xiàn)和優(yōu)化,取得了一定的加速效果并保持較好的擴(kuò)展性,為今后面向更大規(guī)模計(jì)算的海洋環(huán)流模式發(fā)展提供了經(jīng)驗(yàn)和參考。
【文章來(lái)源】:數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020,2(04)
【文章頁(yè)數(shù)】:13 頁(yè)
【部分圖文】:
GPU架構(gòu)
CUDA存儲(chǔ)模型按照訪問(wèn)速度從快到慢分別為寄存器、共享內(nèi)存、常量?jī)?nèi)存、全局內(nèi)存和局部?jī)?nèi)存。如圖6所示,寄存器和共享內(nèi)存都是片上存儲(chǔ)空間,供SM上的所有活躍線程使用,其中寄存器是不可編程的且屬于線程私有,共享內(nèi)存由同一個(gè)Block內(nèi)的線程共享。全局內(nèi)存、局部?jī)?nèi)存和常量?jī)?nèi)存都位于片外顯存中,其中全局內(nèi)存和常量?jī)?nèi)存由同一個(gè)Grid內(nèi)的線程共享,而局部?jī)?nèi)存屬于線程私有且不能合并訪存。2.3 LICOM在GPU上的實(shí)現(xiàn)
本文將LICOM迭代計(jì)算過(guò)程中的7個(gè)模塊使用CUDA C進(jìn)行GPU移植,其他的預(yù)處理部分、模塊初始化部分以及MPI通信部分仍保留原來(lái)的Fortran程序。在MPI并行計(jì)算海洋網(wǎng)格塊的基礎(chǔ)之上,結(jié)合使用CUDA線程并行計(jì)算海洋網(wǎng)格點(diǎn)。如圖7所示,每個(gè)MPI進(jìn)程負(fù)責(zé)一個(gè)海洋網(wǎng)格塊的計(jì)算,海洋網(wǎng)格塊內(nèi)的網(wǎng)格點(diǎn)由GPU線程并行執(zhí)行。表1和表2顯示了LICOM程序片段的Fortran實(shí)現(xiàn)與CUDA實(shí)現(xiàn)的對(duì)應(yīng)關(guān)系,CPU中的全局變量映射到GPU上的全局內(nèi)存中,例如CPU全局變量VIV,在GPU申請(qǐng)為全局內(nèi)存變量d_viv。
【參考文獻(xiàn)】:
期刊論文
[1]基于FMM-PM方法的宇宙N體模擬在GPU上的實(shí)現(xiàn)和優(yōu)化[J]. 扶月月,王武,王喬. 數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(02)
[2]LICOM Model Datasets for the CMIP6 Ocean Model Intercomparison Project[J]. Pengfei LIN,Zhipeng YU,Hailong LIU,Yongqiang YU,Yiwen LI,Jirong JIANG,Wei XUE,Kangjun CHEN,Qian YANG,Bowen ZHAO,Jilin WEI,Mengrong DING,Zhikuo SUN,Yaqi WANG,Yao MENG,Weipeng ZHENG,Jinfeng MA. Advances in Atmospheric Sciences. 2020(03)
[3]2019年中國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫?袁良,袁國(guó)興,李希代. 數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(01)
[4]地球系統(tǒng)模式CAS-ESM[J]. 周廣慶,張?jiān)迫?姜金榮,張賀,吳保東,曹杭,王天一,郝卉群,朱家文,袁良,張明華. 數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(01)
[5]海洋模式LICOM的MIC并行優(yōu)化[J]. 王文浩,姜金榮,王玉柱,遲學(xué)斌. 科研信息化技術(shù)與應(yīng)用. 2015(03)
[6]面向LICOM2的并行I/O優(yōu)化[J]. 季旭,武海平,鄒寅隆,梁亞雄,薛巍,尹萬(wàn)旺,林鵬飛,劉海龍,俞永強(qiáng). 科研信息化技術(shù)與應(yīng)用. 2014(05)
[7]高性能計(jì)算機(jī)系統(tǒng)及平臺(tái)發(fā)展?fàn)顩r分析[J]. 遲學(xué)斌,顧蓓蓓,武虹,王龍,朱鵬. 計(jì)算機(jī)工程與科學(xué). 2013(11)
[8]非靜壓海洋數(shù)值模式加速計(jì)算的CUDA實(shí)現(xiàn)[J]. 王春暉,苗春葆,沈飆. 中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(08)
[9]海洋環(huán)流數(shù)值模式POP的GPU并行優(yōu)化[J]. 郭松,竇勇,雷元武. 計(jì)算機(jī)工程與科學(xué). 2012(08)
[10]IAP第四代大氣環(huán)流模式的氣候系統(tǒng)模式模擬性能評(píng)估[J]. 孫泓川,周廣慶,曾慶存. 大氣科學(xué). 2012(02)
本文編號(hào):3138079
【文章來(lái)源】:數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020,2(04)
【文章頁(yè)數(shù)】:13 頁(yè)
【部分圖文】:
GPU架構(gòu)
CUDA存儲(chǔ)模型按照訪問(wèn)速度從快到慢分別為寄存器、共享內(nèi)存、常量?jī)?nèi)存、全局內(nèi)存和局部?jī)?nèi)存。如圖6所示,寄存器和共享內(nèi)存都是片上存儲(chǔ)空間,供SM上的所有活躍線程使用,其中寄存器是不可編程的且屬于線程私有,共享內(nèi)存由同一個(gè)Block內(nèi)的線程共享。全局內(nèi)存、局部?jī)?nèi)存和常量?jī)?nèi)存都位于片外顯存中,其中全局內(nèi)存和常量?jī)?nèi)存由同一個(gè)Grid內(nèi)的線程共享,而局部?jī)?nèi)存屬于線程私有且不能合并訪存。2.3 LICOM在GPU上的實(shí)現(xiàn)
本文將LICOM迭代計(jì)算過(guò)程中的7個(gè)模塊使用CUDA C進(jìn)行GPU移植,其他的預(yù)處理部分、模塊初始化部分以及MPI通信部分仍保留原來(lái)的Fortran程序。在MPI并行計(jì)算海洋網(wǎng)格塊的基礎(chǔ)之上,結(jié)合使用CUDA線程并行計(jì)算海洋網(wǎng)格點(diǎn)。如圖7所示,每個(gè)MPI進(jìn)程負(fù)責(zé)一個(gè)海洋網(wǎng)格塊的計(jì)算,海洋網(wǎng)格塊內(nèi)的網(wǎng)格點(diǎn)由GPU線程并行執(zhí)行。表1和表2顯示了LICOM程序片段的Fortran實(shí)現(xiàn)與CUDA實(shí)現(xiàn)的對(duì)應(yīng)關(guān)系,CPU中的全局變量映射到GPU上的全局內(nèi)存中,例如CPU全局變量VIV,在GPU申請(qǐng)為全局內(nèi)存變量d_viv。
【參考文獻(xiàn)】:
期刊論文
[1]基于FMM-PM方法的宇宙N體模擬在GPU上的實(shí)現(xiàn)和優(yōu)化[J]. 扶月月,王武,王喬. 數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(02)
[2]LICOM Model Datasets for the CMIP6 Ocean Model Intercomparison Project[J]. Pengfei LIN,Zhipeng YU,Hailong LIU,Yongqiang YU,Yiwen LI,Jirong JIANG,Wei XUE,Kangjun CHEN,Qian YANG,Bowen ZHAO,Jilin WEI,Mengrong DING,Zhikuo SUN,Yaqi WANG,Yao MENG,Weipeng ZHENG,Jinfeng MA. Advances in Atmospheric Sciences. 2020(03)
[3]2019年中國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫?袁良,袁國(guó)興,李希代. 數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(01)
[4]地球系統(tǒng)模式CAS-ESM[J]. 周廣慶,張?jiān)迫?姜金榮,張賀,吳保東,曹杭,王天一,郝卉群,朱家文,袁良,張明華. 數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(01)
[5]海洋模式LICOM的MIC并行優(yōu)化[J]. 王文浩,姜金榮,王玉柱,遲學(xué)斌. 科研信息化技術(shù)與應(yīng)用. 2015(03)
[6]面向LICOM2的并行I/O優(yōu)化[J]. 季旭,武海平,鄒寅隆,梁亞雄,薛巍,尹萬(wàn)旺,林鵬飛,劉海龍,俞永強(qiáng). 科研信息化技術(shù)與應(yīng)用. 2014(05)
[7]高性能計(jì)算機(jī)系統(tǒng)及平臺(tái)發(fā)展?fàn)顩r分析[J]. 遲學(xué)斌,顧蓓蓓,武虹,王龍,朱鵬. 計(jì)算機(jī)工程與科學(xué). 2013(11)
[8]非靜壓海洋數(shù)值模式加速計(jì)算的CUDA實(shí)現(xiàn)[J]. 王春暉,苗春葆,沈飆. 中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(08)
[9]海洋環(huán)流數(shù)值模式POP的GPU并行優(yōu)化[J]. 郭松,竇勇,雷元武. 計(jì)算機(jī)工程與科學(xué). 2012(08)
[10]IAP第四代大氣環(huán)流模式的氣候系統(tǒng)模式模擬性能評(píng)估[J]. 孫泓川,周廣慶,曾慶存. 大氣科學(xué). 2012(02)
本文編號(hào):3138079
本文鏈接:http://sikaile.net/kejilunwen/haiyang/3138079.html
最近更新
教材專著