基于GPU集群的PIC方法并行加速研究
發(fā)布時(shí)間:2022-07-07 11:19
快點(diǎn)火是引發(fā)核聚變反應(yīng)的一種最新方法,而PIC粒子模擬法以其良好的準(zhǔn)確度和較好的性價(jià)比,近年來被廣泛應(yīng)用于模擬此類流體力學(xué)問題。本次研究,基于激光快點(diǎn)火的PIC模擬程序,使用以英偉達(dá)CUDA為核心的并行計(jì)算方法,對(duì)PIC程序進(jìn)行了并行加速,并進(jìn)一步調(diào)整優(yōu)化。在基于英特爾CPU和英偉達(dá)GPU異構(gòu)架構(gòu)的工作站上,加速熱點(diǎn)函數(shù)取得了超過10倍的加速比,程序整體取得了約為4倍的加速比。本次研究中,使用多種方式進(jìn)行程序剖析,以負(fù)載均衡理論為依據(jù)確定優(yōu)化目標(biāo),取得良好效果。此外,本次研究使用重構(gòu)屬性數(shù)組、原子操作、轉(zhuǎn)移數(shù)組等方式,解決了并行化過程中鏈表元素前后依賴、多線程競(jìng)寫、數(shù)據(jù)傳輸開銷大等主要困難,對(duì)此類問題的處理和解決有著普遍的借鑒意義。
【文章頁數(shù)】:73 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
目錄
圖錄
第一章 緒論
1.1 物理背景
1.1.1 核聚變傳統(tǒng)點(diǎn)火方式
1.1.2 快點(diǎn)火方式
1.1.3 粒子模擬方法
1.2 并行計(jì)算在科學(xué)計(jì)算中的應(yīng)用
1.3 目前存在的問題
1.4 研究?jī)?nèi)容及工作
1.5 論文內(nèi)容
第二章 相關(guān)理論技術(shù)
2.1 并行計(jì)算發(fā)展
2.2 GPGPU
2.3 CUDA架構(gòu)
2.3.1 統(tǒng)一計(jì)算設(shè)備架構(gòu)CUDA
2.3.2 新一代Kepler架構(gòu)
2.4 超級(jí)計(jì)算機(jī)
2.4.1 超級(jí)計(jì)算機(jī)發(fā)展
2.4.2 超級(jí)計(jì)算機(jī)π
2.5 本章小結(jié)
第三章 PIC程序分析
3.1 PIC程序介紹
3.1.1 環(huán)境變量
3.1.2 主循環(huán)
3.1.3 碰撞函數(shù)coulomb_collision
3.1.4 轉(zhuǎn)移函數(shù)Mover
3.1.5 電場(chǎng)函數(shù)Fields
3.1.6 調(diào)整函數(shù)Diagnosis
3.2 程序剖析
3.2.1 剖析工具
3.3 剖析結(jié)果分析
3.4 本章小結(jié)
第四章 程序并行加速
4.1 負(fù)載均衡
4.1.1 負(fù)載平衡的評(píng)價(jià)指標(biāo)
4.1.2 負(fù)載均衡和加速比
4.1.3 Amdahl 定律
4.1.4 優(yōu)化策略
4.2 熱點(diǎn)函數(shù)并行化
4.2.1 coulomb_collision函數(shù)并行化
4.2.2 Mover函數(shù)并行化
4.3 優(yōu)化數(shù)據(jù)傳輸
4.3.1 數(shù)據(jù)傳輸現(xiàn)狀
4.3.2 Diagnosis函數(shù)遷移
4.3.3 Fields_origin函數(shù)遷移
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果及分析
5.1 實(shí)驗(yàn)平臺(tái)介紹
5.2 正確性分析
5.3 性能分析
5.4 本章小結(jié)
第六章 結(jié)束語
6.1 論文主要工作
6.1.1 PIC串行程序分析
6.1.2 并行及調(diào)優(yōu)工作
6.1.3 實(shí)驗(yàn)數(shù)據(jù)
6.2 未來工作展望
6.2.1 進(jìn)一步優(yōu)化
6.2.2 針對(duì)平臺(tái)的優(yōu)化
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
期刊論文
[1]快粒子在聚變等離子體中的慢化及能量增益研究[J]. 羅正明,滕禮堅(jiān). 物理學(xué)報(bào). 1982(09)
本文編號(hào):3656328
【文章頁數(shù)】:73 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
目錄
圖錄
第一章 緒論
1.1 物理背景
1.1.1 核聚變傳統(tǒng)點(diǎn)火方式
1.1.2 快點(diǎn)火方式
1.1.3 粒子模擬方法
1.2 并行計(jì)算在科學(xué)計(jì)算中的應(yīng)用
1.3 目前存在的問題
1.4 研究?jī)?nèi)容及工作
1.5 論文內(nèi)容
第二章 相關(guān)理論技術(shù)
2.1 并行計(jì)算發(fā)展
2.2 GPGPU
2.3 CUDA架構(gòu)
2.3.1 統(tǒng)一計(jì)算設(shè)備架構(gòu)CUDA
2.3.2 新一代Kepler架構(gòu)
2.4 超級(jí)計(jì)算機(jī)
2.4.1 超級(jí)計(jì)算機(jī)發(fā)展
2.4.2 超級(jí)計(jì)算機(jī)π
2.5 本章小結(jié)
第三章 PIC程序分析
3.1 PIC程序介紹
3.1.1 環(huán)境變量
3.1.2 主循環(huán)
3.1.3 碰撞函數(shù)coulomb_collision
3.1.4 轉(zhuǎn)移函數(shù)Mover
3.1.5 電場(chǎng)函數(shù)Fields
3.1.6 調(diào)整函數(shù)Diagnosis
3.2 程序剖析
3.2.1 剖析工具
3.3 剖析結(jié)果分析
3.4 本章小結(jié)
第四章 程序并行加速
4.1 負(fù)載均衡
4.1.1 負(fù)載平衡的評(píng)價(jià)指標(biāo)
4.1.2 負(fù)載均衡和加速比
4.1.3 Amdahl 定律
4.1.4 優(yōu)化策略
4.2 熱點(diǎn)函數(shù)并行化
4.2.1 coulomb_collision函數(shù)并行化
4.2.2 Mover函數(shù)并行化
4.3 優(yōu)化數(shù)據(jù)傳輸
4.3.1 數(shù)據(jù)傳輸現(xiàn)狀
4.3.2 Diagnosis函數(shù)遷移
4.3.3 Fields_origin函數(shù)遷移
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果及分析
5.1 實(shí)驗(yàn)平臺(tái)介紹
5.2 正確性分析
5.3 性能分析
5.4 本章小結(jié)
第六章 結(jié)束語
6.1 論文主要工作
6.1.1 PIC串行程序分析
6.1.2 并行及調(diào)優(yōu)工作
6.1.3 實(shí)驗(yàn)數(shù)據(jù)
6.2 未來工作展望
6.2.1 進(jìn)一步優(yōu)化
6.2.2 針對(duì)平臺(tái)的優(yōu)化
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
期刊論文
[1]快粒子在聚變等離子體中的慢化及能量增益研究[J]. 羅正明,滕禮堅(jiān). 物理學(xué)報(bào). 1982(09)
本文編號(hào):3656328
本文鏈接:http://sikaile.net/projectlw/hkxlw/3656328.html
最近更新
教材專著