面向異構(gòu)體系結(jié)構(gòu)的粒子輸運并行算法研究
發(fā)布時間:2021-06-18 19:40
在很多物理現(xiàn)象中,都會使用粒子輸運方程(Boltzmann方程)來描述粒子的傳輸過程,例如,在核反應堆中,應用輸運方程計算堆芯的中子分布,進行屏蔽設計;在生物醫(yī)學領域中,可以用輸運理論來確定放射性治療的劑量;在天體物理、半導體物理、等離子體物理、宇宙線簇射、氣體放電物理等學科中,輸運理論被用來研究中子、光子、電子和等離子等粒子的輸運問題。通常有兩類數(shù)值方法來求解Boltzmann輸運方程。第一類是確定性方法,包括時間的差分,空間的差分方法、有限元方法,能群的多群近似,角方向的離散縱標方法、球諧函數(shù)法等。第二類是非確定性方法或稱為蒙特卡羅方法,該方法通過模擬單個粒子的歷史,根據(jù)許多個粒子歷史的綜合信息來得到想要的結(jié)果。傳統(tǒng)的高性能計算機一般采用商用通用處理器,在構(gòu)造大規(guī)模并行計算系統(tǒng)時將面臨系統(tǒng)效率、功耗、系統(tǒng)的維護和成本等多方面的挑戰(zhàn)。近年來,異構(gòu)體系結(jié)構(gòu)開始成為構(gòu)造超級計算機系統(tǒng)的一種趨勢。與傳統(tǒng)的并行計算機系統(tǒng)相比,除處理器核間的多核并行及隱含于硬件的指令級并行外,異構(gòu)計算系統(tǒng)的具有顯式SIMD微向量數(shù)據(jù)級并行特征。在粒子輸運實際應用問題模擬計算中,未知粒子子通量定義在能量、時間、...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:154 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 課題研究背景及意義
1.1.1 輸運理論簡介
1.1.2 以粒子輸運模擬為代表的高性能應用面臨的挑戰(zhàn)
1.1.3 異構(gòu)并行計算帶來的機遇和挑戰(zhàn)
1.1.4 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 粒子輸運的并行算法研究
1.2.2 面向異構(gòu)體系結(jié)構(gòu)的并行算法研究
1.3 本文的研究內(nèi)容和主要貢獻
1.3.1 本文的研究內(nèi)容
1.3.2 本文的主要貢獻
1.4 論文結(jié)構(gòu)
第二章 相關工作
2.1 粒子輸運模型及其數(shù)值方法
2.1.1 粒子輸運的基本概念
2.1.2 輸運方程的一般形式及定解條件
2.1.3 輸運方程的確定性數(shù)值近似解法
2.1.4 三維笛卡爾坐標下的輸運方程
2.1.5 三維笛卡爾坐標下的輸運問題的差分方程
2.1.6 二維柱坐標下的輸運方程
2.1.7 二維柱坐標下的輸運問題的間斷有限元方程
2.1.8 離散縱標方法
2.1.9 間斷有限元法
2.1.10 源迭代方法
2.1.11 粒子輸運的非確定性模擬
2.2 異構(gòu)體系結(jié)構(gòu)
2.2.1 分類、特征及趨勢
2.2.2 典型的協(xié)處理單元
2.2.3 高性能計算領域異構(gòu)體系結(jié)構(gòu)面臨的挑戰(zhàn)
2.3 GPU 硬件架構(gòu)及編程模型
第三章 基于GPU 的粒子輸運三維確定性結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級并行掃描算法
3.1 問題提出
3.2 相關研究
3.3 基于GPU 的數(shù)據(jù)級通量掃描算法
3.3.1 基本的線程級并行掃描
3.3.2 從P_n 矩中計算源項
3.3.3 求解遞歸的S_n 方程
3.3.4 更新來自P_n 矩的粒子通量和DSA 面流
3.3.5 其它過程
3.4 算法分析
3.4.1 并行度模型及分析
3.5 數(shù)值實驗和討論
3.5.1 實驗平臺和問題模型
3.5.2 基本數(shù)據(jù)級并行掃描
3.5.3 模擬的收斂性
3.5.4 不進行通量修正的性能
3.5.5 S_n 遞歸方程并行化的效果
3.5.6 GPU 和CPU 實現(xiàn)的細節(jié)比較
3.5.7 進行通量修正時粒子輸運的性能
3.5.8 討論
3.6 小結(jié)
第四章 基于GPU 的粒子輸運二維確定性非結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級并行掃描算法
4.1 問題提出
4.2 相關研究
4.3 基于GPU 的數(shù)據(jù)級掃描算法
4.3.1 預掃描算法:確定掃描順序
4.3.2 映射并行通量掃描計算到GPU 線程執(zhí)行模型
4.3.3 其它過程
4.3.4 優(yōu)化
4.4 算法分析
4.4.1 預掃描算法的可行性分析
4.4.2 并行度分析
4.4.3 層次式異構(gòu)并行算法設計方法:從循環(huán)展開與分割的角度
4.5 數(shù)值實驗和討論
4.5.1 實驗平臺和問題模型
4.5.2 模擬的收斂性
4.5.3 數(shù)據(jù)級并行通量掃描算法的性質(zhì)
4.5.4 性能比較
4.5.5 討論
4.6 小結(jié)
第五章 基于GPU 的非確定性粒子輸運數(shù)據(jù)級并行算法
5.1 問題提出
5.2 相關研究
5.3 基于GPU 的數(shù)據(jù)級并行MC 模擬算法
5.3.1 算法總體流程
5.3.2 并行訪存沖突的消除:引入新型數(shù)據(jù)結(jié)構(gòu)
5.3.3 GPU 多線程并行
5.3.4 基于GPU 的并行偽隨機數(shù)發(fā)生器
5.3.5 基于GPU 的方向角分布抽樣
5.3.6 優(yōu)化
5.4 算法分析
5.4.1 存儲事務模型
5.4.2 面向異構(gòu)體系結(jié)構(gòu)的算法設計優(yōu)化方法簡述
5.5 數(shù)值實驗和討論
5.5.1 測試平臺
5.5.2 并行偽隨機數(shù)測試結(jié)果
5.5.3 角分布抽樣測試結(jié)果
5.5.4 MCNP-GPU 測試結(jié)果
5.5.5 討論
5.6 小結(jié)
第六章 面向異構(gòu)體系結(jié)構(gòu)可擴展粒子輸運并行框架設計與實現(xiàn)
6.1 問題提出
6.2 相關研究
6.3 面向異構(gòu)體系結(jié)構(gòu)的可擴展粒子輸運并行框架設計
6.3.1 層次結(jié)構(gòu)
6.3.2 異構(gòu)類型定義
6.3.3 數(shù)據(jù)結(jié)構(gòu)設計
6.3.4 模塊設計
6.3.5 接口設計
6.3.6 代碼和文檔
6.4 應用示例
6.4.1 Sweep3D-multiGPU
6.4.2 Hybrid-EP
6.5 小結(jié)
第七章 結(jié)束語
7.1 工作總結(jié)
7.2 工作展望
致謝
參考文獻
作者在學期間取得的學術(shù)成果
【參考文獻】:
期刊論文
[1]數(shù)據(jù)庫[J]. 電器. 2011(11)
[2]Parallel implementation of fast multipole method based on JASMIN[J]. CAO XiaoLin 1,2,MO ZeYao 1,2,LIU Xu 1,XU XiaoWen 1 & ZHANG AiQing 1 1 High Performance Computational Center in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;2 Laboratory of Computational Physics in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China. Science China(Information Sciences). 2011(04)
[3]Cell處理器上軟件緩存的設計與實現(xiàn)[J]. 孫守航,楊燦群. 計算機工程. 2011(02)
[4]粒子輸運蒙特卡羅模擬現(xiàn)狀概述[J]. 鄧力,李剛. 計算物理. 2010(06)
[5]非結(jié)構(gòu)網(wǎng)格粒子輸運Sn并行算法[J]. 遲利華,劉杰,田平. 計算機工程與科學. 2010(10)
[6]基于JASMIN框架的快速多極子并行解法器[J]. 曹小林,莫則堯,劉旭,徐小文,張愛清. 中國科學:信息科學. 2010(09)
[7]Efficient Monte Carlo-based options pricing on graphics processors and its optimizations[J]. 劉力,劉利. Science China(Information Sciences). 2010(09)
[8]基于PVM的MCNP程序的并行計算解決方案[J]. 王文煒,凌球,楊磊,黃千紅. 核電子學與探測技術(shù). 2010(08)
[9]基于FPGA內(nèi)置RAM的抗輻射有限狀態(tài)機設計[J]. 孫兆偉,劉源,徐國棟,孫蕊. 航空學報. 2010(05)
[10]一種求解輸運方程的并行調(diào)度算法[J]. 周滌宇,劉杰. 計算機學報. 2010(05)
博士論文
[1]高維中子輸運方程的離散格式與并行算法研究[D]. 陽述林.中國工程物理研究院 2003
碩士論文
[1]粒子輸運的確定性問題并行算法研究[D]. 周滌宇.國防科學技術(shù)大學 2007
[2]二維輸運方程離散縱標方法的并行計算方法研究[D]. 陳靜.國防科學技術(shù)大學 2005
[3]MVC模式在系統(tǒng)框架設計中的研究與應用[D]. 杜愛華.西安建筑科技大學 2005
本文編號:3237264
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:154 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 課題研究背景及意義
1.1.1 輸運理論簡介
1.1.2 以粒子輸運模擬為代表的高性能應用面臨的挑戰(zhàn)
1.1.3 異構(gòu)并行計算帶來的機遇和挑戰(zhàn)
1.1.4 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 粒子輸運的并行算法研究
1.2.2 面向異構(gòu)體系結(jié)構(gòu)的并行算法研究
1.3 本文的研究內(nèi)容和主要貢獻
1.3.1 本文的研究內(nèi)容
1.3.2 本文的主要貢獻
1.4 論文結(jié)構(gòu)
第二章 相關工作
2.1 粒子輸運模型及其數(shù)值方法
2.1.1 粒子輸運的基本概念
2.1.2 輸運方程的一般形式及定解條件
2.1.3 輸運方程的確定性數(shù)值近似解法
2.1.4 三維笛卡爾坐標下的輸運方程
2.1.5 三維笛卡爾坐標下的輸運問題的差分方程
2.1.6 二維柱坐標下的輸運方程
2.1.7 二維柱坐標下的輸運問題的間斷有限元方程
2.1.8 離散縱標方法
2.1.9 間斷有限元法
2.1.10 源迭代方法
2.1.11 粒子輸運的非確定性模擬
2.2 異構(gòu)體系結(jié)構(gòu)
2.2.1 分類、特征及趨勢
2.2.2 典型的協(xié)處理單元
2.2.3 高性能計算領域異構(gòu)體系結(jié)構(gòu)面臨的挑戰(zhàn)
2.3 GPU 硬件架構(gòu)及編程模型
第三章 基于GPU 的粒子輸運三維確定性結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級并行掃描算法
3.1 問題提出
3.2 相關研究
3.3 基于GPU 的數(shù)據(jù)級通量掃描算法
3.3.1 基本的線程級并行掃描
3.3.2 從P_n 矩中計算源項
3.3.3 求解遞歸的S_n 方程
3.3.4 更新來自P_n 矩的粒子通量和DSA 面流
3.3.5 其它過程
3.4 算法分析
3.4.1 并行度模型及分析
3.5 數(shù)值實驗和討論
3.5.1 實驗平臺和問題模型
3.5.2 基本數(shù)據(jù)級并行掃描
3.5.3 模擬的收斂性
3.5.4 不進行通量修正的性能
3.5.5 S_n 遞歸方程并行化的效果
3.5.6 GPU 和CPU 實現(xiàn)的細節(jié)比較
3.5.7 進行通量修正時粒子輸運的性能
3.5.8 討論
3.6 小結(jié)
第四章 基于GPU 的粒子輸運二維確定性非結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級并行掃描算法
4.1 問題提出
4.2 相關研究
4.3 基于GPU 的數(shù)據(jù)級掃描算法
4.3.1 預掃描算法:確定掃描順序
4.3.2 映射并行通量掃描計算到GPU 線程執(zhí)行模型
4.3.3 其它過程
4.3.4 優(yōu)化
4.4 算法分析
4.4.1 預掃描算法的可行性分析
4.4.2 并行度分析
4.4.3 層次式異構(gòu)并行算法設計方法:從循環(huán)展開與分割的角度
4.5 數(shù)值實驗和討論
4.5.1 實驗平臺和問題模型
4.5.2 模擬的收斂性
4.5.3 數(shù)據(jù)級并行通量掃描算法的性質(zhì)
4.5.4 性能比較
4.5.5 討論
4.6 小結(jié)
第五章 基于GPU 的非確定性粒子輸運數(shù)據(jù)級并行算法
5.1 問題提出
5.2 相關研究
5.3 基于GPU 的數(shù)據(jù)級并行MC 模擬算法
5.3.1 算法總體流程
5.3.2 并行訪存沖突的消除:引入新型數(shù)據(jù)結(jié)構(gòu)
5.3.3 GPU 多線程并行
5.3.4 基于GPU 的并行偽隨機數(shù)發(fā)生器
5.3.5 基于GPU 的方向角分布抽樣
5.3.6 優(yōu)化
5.4 算法分析
5.4.1 存儲事務模型
5.4.2 面向異構(gòu)體系結(jié)構(gòu)的算法設計優(yōu)化方法簡述
5.5 數(shù)值實驗和討論
5.5.1 測試平臺
5.5.2 并行偽隨機數(shù)測試結(jié)果
5.5.3 角分布抽樣測試結(jié)果
5.5.4 MCNP-GPU 測試結(jié)果
5.5.5 討論
5.6 小結(jié)
第六章 面向異構(gòu)體系結(jié)構(gòu)可擴展粒子輸運并行框架設計與實現(xiàn)
6.1 問題提出
6.2 相關研究
6.3 面向異構(gòu)體系結(jié)構(gòu)的可擴展粒子輸運并行框架設計
6.3.1 層次結(jié)構(gòu)
6.3.2 異構(gòu)類型定義
6.3.3 數(shù)據(jù)結(jié)構(gòu)設計
6.3.4 模塊設計
6.3.5 接口設計
6.3.6 代碼和文檔
6.4 應用示例
6.4.1 Sweep3D-multiGPU
6.4.2 Hybrid-EP
6.5 小結(jié)
第七章 結(jié)束語
7.1 工作總結(jié)
7.2 工作展望
致謝
參考文獻
作者在學期間取得的學術(shù)成果
【參考文獻】:
期刊論文
[1]數(shù)據(jù)庫[J]. 電器. 2011(11)
[2]Parallel implementation of fast multipole method based on JASMIN[J]. CAO XiaoLin 1,2,MO ZeYao 1,2,LIU Xu 1,XU XiaoWen 1 & ZHANG AiQing 1 1 High Performance Computational Center in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;2 Laboratory of Computational Physics in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China. Science China(Information Sciences). 2011(04)
[3]Cell處理器上軟件緩存的設計與實現(xiàn)[J]. 孫守航,楊燦群. 計算機工程. 2011(02)
[4]粒子輸運蒙特卡羅模擬現(xiàn)狀概述[J]. 鄧力,李剛. 計算物理. 2010(06)
[5]非結(jié)構(gòu)網(wǎng)格粒子輸運Sn并行算法[J]. 遲利華,劉杰,田平. 計算機工程與科學. 2010(10)
[6]基于JASMIN框架的快速多極子并行解法器[J]. 曹小林,莫則堯,劉旭,徐小文,張愛清. 中國科學:信息科學. 2010(09)
[7]Efficient Monte Carlo-based options pricing on graphics processors and its optimizations[J]. 劉力,劉利. Science China(Information Sciences). 2010(09)
[8]基于PVM的MCNP程序的并行計算解決方案[J]. 王文煒,凌球,楊磊,黃千紅. 核電子學與探測技術(shù). 2010(08)
[9]基于FPGA內(nèi)置RAM的抗輻射有限狀態(tài)機設計[J]. 孫兆偉,劉源,徐國棟,孫蕊. 航空學報. 2010(05)
[10]一種求解輸運方程的并行調(diào)度算法[J]. 周滌宇,劉杰. 計算機學報. 2010(05)
博士論文
[1]高維中子輸運方程的離散格式與并行算法研究[D]. 陽述林.中國工程物理研究院 2003
碩士論文
[1]粒子輸運的確定性問題并行算法研究[D]. 周滌宇.國防科學技術(shù)大學 2007
[2]二維輸運方程離散縱標方法的并行計算方法研究[D]. 陳靜.國防科學技術(shù)大學 2005
[3]MVC模式在系統(tǒng)框架設計中的研究與應用[D]. 杜愛華.西安建筑科技大學 2005
本文編號:3237264
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3237264.html
最近更新
教材專著