天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

基于Multi-GPU并行的多場(chǎng)耦合相場(chǎng)模型計(jì)算及優(yōu)化研究

發(fā)布時(shí)間:2020-09-11 10:12
   隨著高性能計(jì)算技術(shù)的不斷發(fā)展,各種高性能計(jì)算方法被廣泛地應(yīng)用于實(shí)際工程領(lǐng)域,在國民經(jīng)濟(jì)、國防建設(shè)和科技發(fā)展中占有非常重要的戰(zhàn)略地位。相場(chǎng)法是目前用于模擬枝晶微觀組織結(jié)構(gòu)最有效的方法之一。伴隨著相場(chǎng)模型的不斷完善和發(fā)展,流場(chǎng)、溫度場(chǎng)、溶質(zhì)場(chǎng)等外部場(chǎng)被耦合到相場(chǎng)中,使得多場(chǎng)耦合相場(chǎng)模型的求解存在計(jì)算量大、計(jì)算效率低、計(jì)算區(qū)域受限等問題。且在相關(guān)實(shí)際應(yīng)用領(lǐng)域,對(duì)相場(chǎng)模型在求解規(guī)模上的擴(kuò)大也有了更為迫切地需求。研究高性能計(jì)算方法求解相場(chǎng)模型已成為了計(jì)算機(jī)科學(xué)與工程學(xué)、材料學(xué)等交叉學(xué)科的研究熱點(diǎn)。多節(jié)點(diǎn)CPU+GPU異構(gòu)的高性能計(jì)算集群為提高相場(chǎng)模型求解速度、擴(kuò)大相場(chǎng)求解規(guī)模提供了新的有力支持。本文基于相場(chǎng)模型與Lattice Boltzmann方法,建立了多場(chǎng)耦合三維PF-LBM相場(chǎng)模型。在多節(jié)點(diǎn)CPU+GPU異構(gòu)集群上,基于CUDA+MPI編程平臺(tái),提出了Multi-GPU并行計(jì)算方法,實(shí)現(xiàn)了對(duì)多場(chǎng)耦合的PF-LBM相場(chǎng)模型的模擬數(shù)值求解。分析了影響Multi-GPU并行計(jì)算方法性能的諸多因素,針對(duì)MPI通信延遲、GPU計(jì)算與通信重疊等問題,提出了兩種相應(yīng)的優(yōu)化方案。為了驗(yàn)證提出的Multi-GPU并行計(jì)算方法的可靠性和有效性,把Multi-GPU并行計(jì)算方法求解PF-LBM相場(chǎng)模型的結(jié)果與經(jīng)典理論值以及其他學(xué)者已有的研究結(jié)果進(jìn)行了對(duì)比分析。同時(shí),將優(yōu)化前后的模擬結(jié)果進(jìn)行對(duì)比,驗(yàn)證了優(yōu)化方案的有效性。對(duì)比和分析結(jié)果表明:在高性能計(jì)算集群上,采用Multi-GPU并行計(jì)算方法的求解結(jié)果與經(jīng)典理論值相符合,證明本文基于Multi-GPU并行方法求解PF-LBM相場(chǎng)模型是行之有效的。相較于以往的模擬計(jì)算方法,Multi-GPU并行計(jì)算方法在計(jì)算效率和模擬規(guī)模上都有一定提升。其中,相較于傳統(tǒng)CPU串行算法,Multi-GPU并行計(jì)算方法的加速比最大可達(dá)58(21GPU)。相較于節(jié)點(diǎn)數(shù)相同的MPI并行算法,Multi-GPU算法也具有更好的加速求解效果。在相場(chǎng)模擬規(guī)模方面,Multi-GPU并行計(jì)算方法的模擬規(guī)模最大可達(dá)819?819?819。兩種優(yōu)化方案M-GPU和CB-GPU均能在一定程度上實(shí)現(xiàn)對(duì)Multi-GPU計(jì)算模型的優(yōu)化,且在較大規(guī)模的相場(chǎng)模擬中,CB-GPU計(jì)算模型擁有更好的優(yōu)化效果。
【學(xué)位單位】:蘭州理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP38
【部分圖文】:

模塊圖,并行機(jī),計(jì)算節(jié)點(diǎn),內(nèi)存


圖 2.1 并行機(jī)體系結(jié)構(gòu):計(jì)算節(jié)點(diǎn)與內(nèi)存模塊分離圖 2.2 并行機(jī)體系結(jié)構(gòu):計(jì)算節(jié)點(diǎn)包含內(nèi)存模塊內(nèi)存訪問模型、微處理器以及互聯(lián)網(wǎng)絡(luò)的差異,目前可將主流對(duì)稱多處理共享存儲(chǔ)并行機(jī)(SMP:Symmetric MultiProcess儲(chǔ)并行機(jī)(DSM:Distributed Shared Memory)、機(jī)群(clu

模塊圖,并行機(jī),計(jì)算節(jié)點(diǎn),內(nèi)存


9圖 2.2 并行機(jī)體系結(jié)構(gòu):計(jì)算節(jié)點(diǎn)包含內(nèi)存模塊根據(jù)內(nèi)存訪問模型、微處理器以及互聯(lián)網(wǎng)絡(luò)的差異,目前可將主流的并行類為:對(duì)稱多處理共享存儲(chǔ)并行機(jī)(SMP:Symmetric MultiProcessing)、共享存儲(chǔ)并行機(jī)(DSM:Distributed Shared Memory)、機(jī)群(cluster)、(constellation)和大規(guī)模并行機(jī)(MPP:Massively Parallel Processing)等。本文將對(duì) SMP 和 DSM 兩種主流并行機(jī)的體系結(jié)構(gòu)進(jìn)行簡要介紹。對(duì)于對(duì)稱多處理共享存儲(chǔ)并行機(jī)(SMP)來說,其處理器和內(nèi)存模塊在互絡(luò)兩側(cè)對(duì)稱的分布,如圖 2.3 所示。其主要特征在于存儲(chǔ)器的對(duì)稱共享。系任一存儲(chǔ)模塊中的存儲(chǔ)單元和 I/O 模塊均可被任一處理器直接訪問,對(duì)于每處理器來說其訪問延遲、帶寬和訪問成功率均是一致的,所有的內(nèi)存單元統(tǒng)

示意圖,體系結(jié)構(gòu),示意圖,并行程序設(shè)計(jì)


基于 Multi-GPU 并行的多場(chǎng)耦合相場(chǎng)模型計(jì)算及優(yōu)化研究每個(gè)處理器在系統(tǒng)中地位相同,系統(tǒng)中不含特權(quán)處理器。每個(gè)處個(gè)局部高速緩存 Cache,使得每個(gè)處理器擁有一個(gè)相對(duì)獨(dú)立的局部Cache 中的數(shù)據(jù)要和存儲(chǔ)塊中的相應(yīng)數(shù)據(jù)保持同步。在 SMP 并行器之間的通信是由進(jìn)程通過共享數(shù)據(jù)區(qū)域的讀寫操作來實(shí)現(xiàn)的,因要略低于網(wǎng)絡(luò)通信的時(shí)延。由于 SMP 并行機(jī)的以上特性,故其可并行程序設(shè)計(jì)、共享存儲(chǔ)并行程序設(shè)計(jì)。但同時(shí),SMP 也存在可性低的缺點(diǎn)。

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朱昶勝;鄧新;馮力;李浩;;MPI+OpenMP環(huán)境下的二元合金三維相場(chǎng)模型的并行方法[J];蘭州理工大學(xué)學(xué)報(bào);2017年04期

2 朱昶勝;朱鳴芳;李浩;王永賢;馮立;;基于MPI二元合金三維枝晶生長相場(chǎng)法的并行研究[J];蘭州理工大學(xué)學(xué)報(bào);2016年06期

3 朱昶勝;車超;馮力;肖榮振;;基于MPI的三維枝晶生長相場(chǎng)法的并行計(jì)算[J];蘭州理工大學(xué)學(xué)報(bào);2015年05期

4 朱昶勝;賈金芳;馮力;肖榮振;王永賢;;基于GPU的流動(dòng)影響枝晶生長相場(chǎng)方法[J];蘭州理工大學(xué)學(xué)報(bào);2015年03期

5 王智平;張辛健;路陽;馮力;朱昶勝;安靈敏;;PF-LBM模型模擬強(qiáng)迫對(duì)流對(duì)二元合金枝晶生長的影響[J];蘭州理工大學(xué)學(xué)報(bào);2014年04期

6 路陽;安靈敏;王智平;馮力;朱昶勝;張辛健;;強(qiáng)迫層流環(huán)境下多晶粒生長的相場(chǎng)法模擬[J];蘭州理工大學(xué)學(xué)報(bào);2014年03期

7 姚光超;鄭堯;肖利民;阮利;;基于MPI+GPU的哼唱檢索系統(tǒng)加速[J];計(jì)算機(jī)工程與科學(xué);2013年11期

8 許彥芹;陳慶奎;;基于SMP集群的MPI+CUDA模型的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年15期

9 呂冬蘭;龍文元;夏春;潘美滿;萬紅;;強(qiáng)迫對(duì)流影響合金凝固過程枝晶生長的數(shù)值模擬[J];特種鑄造及有色合金;2009年11期

10 馮力;王智平;路陽;朱昌盛;;二元合金多晶粒的枝晶生長的等溫相場(chǎng)模型[J];物理學(xué)報(bào);2008年02期

相關(guān)碩士學(xué)位論文 前1條

1 李佳佳;異構(gòu)GPU集群的并行編程模型及實(shí)現(xiàn)[D];復(fù)旦大學(xué);2013年



本文編號(hào):2816541

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2816541.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶20a5c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美一区二区三区播放| 国产成人精品一区二区在线看| 韩日黄片在线免费观看| 亚洲欧美日韩精品永久| 天堂网中文字幕在线观看| 日韩在线精品视频观看| 国产免费一区二区三区av大片| 国产高清在线不卡一区| 亚洲欧美黑人一区二区| 欧美精品亚洲精品日韩专区| 国产无摭挡又爽又色又刺激| 国产成人精品久久二区二区| 亚洲美女国产精品久久| 一区二区免费视频中文乱码国产| 91亚洲国产成人久久精品麻豆| 深夜日本福利在线观看| 日韩欧美一区二区黄色| 懂色一区二区三区四区| 日韩欧美三级中文字幕| 亚洲夫妻性生活免费视频| 黄色片国产一区二区三区| 国产又粗又猛又爽又黄| 在线观看中文字幕91| 99热九九在线中文字幕| 成人免费视频免费观看| 国产精品不卡免费视频| 日韩三极片在线免费播放| 亚洲男女性生活免费视频| 欧美一本在线免费观看| 大尺度激情福利视频在线观看| 亚洲高清欧美中文字幕| 一级片黄色一区二区三区| 国产精品欧美一区二区三区| 两性色午夜天堂免费视频| 黄色片一区二区三区高清| 国产成人精品久久二区二区| 亚洲中文字幕高清乱码毛片| 国产精品流白浆无遮挡| 在线观看视频国产你懂的| 日本高清中文精品在线不卡| 国产不卡视频一区在线|