天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 海洋學(xué)論文 >

海洋環(huán)流模式LICOM的GPU實(shí)現(xiàn)與優(yōu)化

發(fā)布時(shí)間:2021-04-14 21:51
  【目的】為了加速海洋環(huán)流模式LICOM的積分計(jì)算,降低因分辨率的提升而帶來(lái)的運(yùn)行成本,本文設(shè)計(jì)并實(shí)現(xiàn)了基于CUDA C的GPU加速版本。【方法】本文基于目前最新的LICOM3版本,在分析LICOM海洋網(wǎng)格塊的并行算法的基礎(chǔ)上,結(jié)合使用CUDA線程并行計(jì)算海洋網(wǎng)格點(diǎn),將LICOM主要計(jì)算程序移植到GPU平臺(tái)上,并從數(shù)據(jù)傳輸和設(shè)備內(nèi)存的使用兩個(gè)方面進(jìn)行優(yōu)化!窘Y(jié)果】實(shí)驗(yàn)表明,GPU版本模擬結(jié)果的與原CPU版本基本一致。與使用相同數(shù)量的Intel Xeon E5-2680 V2 CPU相比,使用2至16塊NVIDIA K20 GPU單個(gè)模式天加速了9.31到1.27倍。【局限】由于LICOM3計(jì)算的邊界同步通信比較多,限制了程序的可擴(kuò)展性,未來(lái)需要通過(guò)邊界通信優(yōu)化和算法優(yōu)化來(lái)提高模式的可擴(kuò)展性。【結(jié)論】本文對(duì)LICOM3程序進(jìn)行了GPU版本的實(shí)現(xiàn)和優(yōu)化,取得了一定的加速效果并保持較好的擴(kuò)展性,為今后面向更大規(guī)模計(jì)算的海洋環(huán)流模式發(fā)展提供了經(jīng)驗(yàn)和參考。 

【文章來(lái)源】:數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020,2(04)

【文章頁(yè)數(shù)】:13 頁(yè)

【部分圖文】:

海洋環(huán)流模式LICOM的GPU實(shí)現(xiàn)與優(yōu)化


GPU架構(gòu)

編程模型,內(nèi)存,線程,共享內(nèi)存


CUDA存儲(chǔ)模型按照訪問(wèn)速度從快到慢分別為寄存器、共享內(nèi)存、常量?jī)?nèi)存、全局內(nèi)存和局部?jī)?nèi)存。如圖6所示,寄存器和共享內(nèi)存都是片上存儲(chǔ)空間,供SM上的所有活躍線程使用,其中寄存器是不可編程的且屬于線程私有,共享內(nèi)存由同一個(gè)Block內(nèi)的線程共享。全局內(nèi)存、局部?jī)?nèi)存和常量?jī)?nèi)存都位于片外顯存中,其中全局內(nèi)存和常量?jī)?nèi)存由同一個(gè)Grid內(nèi)的線程共享,而局部?jī)?nèi)存屬于線程私有且不能合并訪存。2.3 LICOM在GPU上的實(shí)現(xiàn)

海洋,網(wǎng)格點(diǎn),線程,全局變量


本文將LICOM迭代計(jì)算過(guò)程中的7個(gè)模塊使用CUDA C進(jìn)行GPU移植,其他的預(yù)處理部分、模塊初始化部分以及MPI通信部分仍保留原來(lái)的Fortran程序。在MPI并行計(jì)算海洋網(wǎng)格塊的基礎(chǔ)之上,結(jié)合使用CUDA線程并行計(jì)算海洋網(wǎng)格點(diǎn)。如圖7所示,每個(gè)MPI進(jìn)程負(fù)責(zé)一個(gè)海洋網(wǎng)格塊的計(jì)算,海洋網(wǎng)格塊內(nèi)的網(wǎng)格點(diǎn)由GPU線程并行執(zhí)行。表1和表2顯示了LICOM程序片段的Fortran實(shí)現(xiàn)與CUDA實(shí)現(xiàn)的對(duì)應(yīng)關(guān)系,CPU中的全局變量映射到GPU上的全局內(nèi)存中,例如CPU全局變量VIV,在GPU申請(qǐng)為全局內(nèi)存變量d_viv。

【參考文獻(xiàn)】:
期刊論文
[1]基于FMM-PM方法的宇宙N體模擬在GPU上的實(shí)現(xiàn)和優(yōu)化[J]. 扶月月,王武,王喬.  數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(02)
[2]LICOM Model Datasets for the CMIP6 Ocean Model Intercomparison Project[J]. Pengfei LIN,Zhipeng YU,Hailong LIU,Yongqiang YU,Yiwen LI,Jirong JIANG,Wei XUE,Kangjun CHEN,Qian YANG,Bowen ZHAO,Jilin WEI,Mengrong DING,Zhikuo SUN,Yaqi WANG,Yao MENG,Weipeng ZHENG,Jinfeng MA.  Advances in Atmospheric Sciences. 2020(03)
[3]2019年中國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫?袁良,袁國(guó)興,李希代.  數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(01)
[4]地球系統(tǒng)模式CAS-ESM[J]. 周廣慶,張?jiān)迫?姜金榮,張賀,吳保東,曹杭,王天一,郝卉群,朱家文,袁良,張明華.  數(shù)據(jù)與計(jì)算發(fā)展前沿. 2020(01)
[5]海洋模式LICOM的MIC并行優(yōu)化[J]. 王文浩,姜金榮,王玉柱,遲學(xué)斌.  科研信息化技術(shù)與應(yīng)用. 2015(03)
[6]面向LICOM2的并行I/O優(yōu)化[J]. 季旭,武海平,鄒寅隆,梁亞雄,薛巍,尹萬(wàn)旺,林鵬飛,劉海龍,俞永強(qiáng).  科研信息化技術(shù)與應(yīng)用. 2014(05)
[7]高性能計(jì)算機(jī)系統(tǒng)及平臺(tái)發(fā)展?fàn)顩r分析[J]. 遲學(xué)斌,顧蓓蓓,武虹,王龍,朱鵬.  計(jì)算機(jī)工程與科學(xué). 2013(11)
[8]非靜壓海洋數(shù)值模式加速計(jì)算的CUDA實(shí)現(xiàn)[J]. 王春暉,苗春葆,沈飆.  中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(08)
[9]海洋環(huán)流數(shù)值模式POP的GPU并行優(yōu)化[J]. 郭松,竇勇,雷元武.  計(jì)算機(jī)工程與科學(xué). 2012(08)
[10]IAP第四代大氣環(huán)流模式的氣候系統(tǒng)模式模擬性能評(píng)估[J]. 孫泓川,周廣慶,曾慶存.  大氣科學(xué). 2012(02)



本文編號(hào):3138079

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/haiyang/3138079.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶01c5e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
一区二区三区国产日韩| 日韩人妻免费视频一专区| 成年男女午夜久久久精品| 日本人妻精品有码字幕| 欧美一级日韩中文字幕| 欧美丝袜诱惑一区二区| 欧美色婷婷综合狠狠爱| 久久99青青精品免费| 丁香六月啪啪激情综合区| 日本理论片午夜在线观看| 久久99国产精品果冻传媒| 五月婷婷六月丁香狠狠| 激情偷拍一区二区三区视频| 乱女午夜精品一区二区三区| 日韩欧美在线看一卡一卡| 国产欧美日本在线播放| 自拍偷拍福利视频在线观看| 麻豆果冻传媒一二三区| 日本不卡一区视频欧美| 亚洲日本韩国一区二区三区| 国产免费操美女逼视频| 在线视频三区日本精品| 一区二区三区日韩中文| 99久免费精品视频在线观| 久久热这里只有精品视频| 免费在线观看欧美喷水黄片 | 免费观看在线午夜视频| 亚洲免费黄色高清在线观看| 视频在线播放你懂的一区| 亚洲午夜精品视频观看| 大香蕉精品视频一区二区| 欧美一区二区三区喷汁尤物| 欧美亚洲国产日韩一区二区| 国内自拍偷拍福利视频| 精品亚洲av一区二区三区| 激情图日韩精品中文字幕| 少妇成人精品一区二区| 免费久久一级欧美特大黄孕妇| 丝袜av一区二区三区四区五区| 欧美日韩乱一区二区三区| 国产日韩欧美一区二区|