基于GPU集群的PIC方法并行加速研究
發(fā)布時間:2022-07-07 11:19
快點火是引發(fā)核聚變反應(yīng)的一種最新方法,而PIC粒子模擬法以其良好的準確度和較好的性價比,近年來被廣泛應(yīng)用于模擬此類流體力學問題。本次研究,基于激光快點火的PIC模擬程序,使用以英偉達CUDA為核心的并行計算方法,對PIC程序進行了并行加速,并進一步調(diào)整優(yōu)化。在基于英特爾CPU和英偉達GPU異構(gòu)架構(gòu)的工作站上,加速熱點函數(shù)取得了超過10倍的加速比,程序整體取得了約為4倍的加速比。本次研究中,使用多種方式進行程序剖析,以負載均衡理論為依據(jù)確定優(yōu)化目標,取得良好效果。此外,本次研究使用重構(gòu)屬性數(shù)組、原子操作、轉(zhuǎn)移數(shù)組等方式,解決了并行化過程中鏈表元素前后依賴、多線程競寫、數(shù)據(jù)傳輸開銷大等主要困難,對此類問題的處理和解決有著普遍的借鑒意義。
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
目錄
圖錄
第一章 緒論
1.1 物理背景
1.1.1 核聚變傳統(tǒng)點火方式
1.1.2 快點火方式
1.1.3 粒子模擬方法
1.2 并行計算在科學計算中的應(yīng)用
1.3 目前存在的問題
1.4 研究內(nèi)容及工作
1.5 論文內(nèi)容
第二章 相關(guān)理論技術(shù)
2.1 并行計算發(fā)展
2.2 GPGPU
2.3 CUDA架構(gòu)
2.3.1 統(tǒng)一計算設(shè)備架構(gòu)CUDA
2.3.2 新一代Kepler架構(gòu)
2.4 超級計算機
2.4.1 超級計算機發(fā)展
2.4.2 超級計算機π
2.5 本章小結(jié)
第三章 PIC程序分析
3.1 PIC程序介紹
3.1.1 環(huán)境變量
3.1.2 主循環(huán)
3.1.3 碰撞函數(shù)coulomb_collision
3.1.4 轉(zhuǎn)移函數(shù)Mover
3.1.5 電場函數(shù)Fields
3.1.6 調(diào)整函數(shù)Diagnosis
3.2 程序剖析
3.2.1 剖析工具
3.3 剖析結(jié)果分析
3.4 本章小結(jié)
第四章 程序并行加速
4.1 負載均衡
4.1.1 負載平衡的評價指標
4.1.2 負載均衡和加速比
4.1.3 Amdahl 定律
4.1.4 優(yōu)化策略
4.2 熱點函數(shù)并行化
4.2.1 coulomb_collision函數(shù)并行化
4.2.2 Mover函數(shù)并行化
4.3 優(yōu)化數(shù)據(jù)傳輸
4.3.1 數(shù)據(jù)傳輸現(xiàn)狀
4.3.2 Diagnosis函數(shù)遷移
4.3.3 Fields_origin函數(shù)遷移
4.4 本章小結(jié)
第五章 實驗結(jié)果及分析
5.1 實驗平臺介紹
5.2 正確性分析
5.3 性能分析
5.4 本章小結(jié)
第六章 結(jié)束語
6.1 論文主要工作
6.1.1 PIC串行程序分析
6.1.2 并行及調(diào)優(yōu)工作
6.1.3 實驗數(shù)據(jù)
6.2 未來工作展望
6.2.1 進一步優(yōu)化
6.2.2 針對平臺的優(yōu)化
參考文獻
致謝
攻讀碩士學位期間已發(fā)表或錄用的論文
【參考文獻】:
期刊論文
[1]快粒子在聚變等離子體中的慢化及能量增益研究[J]. 羅正明,滕禮堅. 物理學報. 1982(09)
本文編號:3656328
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
目錄
圖錄
第一章 緒論
1.1 物理背景
1.1.1 核聚變傳統(tǒng)點火方式
1.1.2 快點火方式
1.1.3 粒子模擬方法
1.2 并行計算在科學計算中的應(yīng)用
1.3 目前存在的問題
1.4 研究內(nèi)容及工作
1.5 論文內(nèi)容
第二章 相關(guān)理論技術(shù)
2.1 并行計算發(fā)展
2.2 GPGPU
2.3 CUDA架構(gòu)
2.3.1 統(tǒng)一計算設(shè)備架構(gòu)CUDA
2.3.2 新一代Kepler架構(gòu)
2.4 超級計算機
2.4.1 超級計算機發(fā)展
2.4.2 超級計算機π
2.5 本章小結(jié)
第三章 PIC程序分析
3.1 PIC程序介紹
3.1.1 環(huán)境變量
3.1.2 主循環(huán)
3.1.3 碰撞函數(shù)coulomb_collision
3.1.4 轉(zhuǎn)移函數(shù)Mover
3.1.5 電場函數(shù)Fields
3.1.6 調(diào)整函數(shù)Diagnosis
3.2 程序剖析
3.2.1 剖析工具
3.3 剖析結(jié)果分析
3.4 本章小結(jié)
第四章 程序并行加速
4.1 負載均衡
4.1.1 負載平衡的評價指標
4.1.2 負載均衡和加速比
4.1.3 Amdahl 定律
4.1.4 優(yōu)化策略
4.2 熱點函數(shù)并行化
4.2.1 coulomb_collision函數(shù)并行化
4.2.2 Mover函數(shù)并行化
4.3 優(yōu)化數(shù)據(jù)傳輸
4.3.1 數(shù)據(jù)傳輸現(xiàn)狀
4.3.2 Diagnosis函數(shù)遷移
4.3.3 Fields_origin函數(shù)遷移
4.4 本章小結(jié)
第五章 實驗結(jié)果及分析
5.1 實驗平臺介紹
5.2 正確性分析
5.3 性能分析
5.4 本章小結(jié)
第六章 結(jié)束語
6.1 論文主要工作
6.1.1 PIC串行程序分析
6.1.2 并行及調(diào)優(yōu)工作
6.1.3 實驗數(shù)據(jù)
6.2 未來工作展望
6.2.1 進一步優(yōu)化
6.2.2 針對平臺的優(yōu)化
參考文獻
致謝
攻讀碩士學位期間已發(fā)表或錄用的論文
【參考文獻】:
期刊論文
[1]快粒子在聚變等離子體中的慢化及能量增益研究[J]. 羅正明,滕禮堅. 物理學報. 1982(09)
本文編號:3656328
本文鏈接:http://sikaile.net/projectlw/hkxlw/3656328.html
最近更新
教材專著