面向異構(gòu)體系結(jié)構(gòu)的粒子輸運(yùn)并行算法研究
發(fā)布時(shí)間:2021-06-18 19:40
在很多物理現(xiàn)象中,都會(huì)使用粒子輸運(yùn)方程(Boltzmann方程)來(lái)描述粒子的傳輸過(guò)程,例如,在核反應(yīng)堆中,應(yīng)用輸運(yùn)方程計(jì)算堆芯的中子分布,進(jìn)行屏蔽設(shè)計(jì);在生物醫(yī)學(xué)領(lǐng)域中,可以用輸運(yùn)理論來(lái)確定放射性治療的劑量;在天體物理、半導(dǎo)體物理、等離子體物理、宇宙線簇射、氣體放電物理等學(xué)科中,輸運(yùn)理論被用來(lái)研究中子、光子、電子和等離子等粒子的輸運(yùn)問(wèn)題。通常有兩類數(shù)值方法來(lái)求解Boltzmann輸運(yùn)方程。第一類是確定性方法,包括時(shí)間的差分,空間的差分方法、有限元方法,能群的多群近似,角方向的離散縱標(biāo)方法、球諧函數(shù)法等。第二類是非確定性方法或稱為蒙特卡羅方法,該方法通過(guò)模擬單個(gè)粒子的歷史,根據(jù)許多個(gè)粒子歷史的綜合信息來(lái)得到想要的結(jié)果。傳統(tǒng)的高性能計(jì)算機(jī)一般采用商用通用處理器,在構(gòu)造大規(guī)模并行計(jì)算系統(tǒng)時(shí)將面臨系統(tǒng)效率、功耗、系統(tǒng)的維護(hù)和成本等多方面的挑戰(zhàn)。近年來(lái),異構(gòu)體系結(jié)構(gòu)開始成為構(gòu)造超級(jí)計(jì)算機(jī)系統(tǒng)的一種趨勢(shì)。與傳統(tǒng)的并行計(jì)算機(jī)系統(tǒng)相比,除處理器核間的多核并行及隱含于硬件的指令級(jí)并行外,異構(gòu)計(jì)算系統(tǒng)的具有顯式SIMD微向量數(shù)據(jù)級(jí)并行特征。在粒子輸運(yùn)實(shí)際應(yīng)用問(wèn)題模擬計(jì)算中,未知粒子子通量定義在能量、時(shí)間、...
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:154 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 課題研究背景及意義
1.1.1 輸運(yùn)理論簡(jiǎn)介
1.1.2 以粒子輸運(yùn)模擬為代表的高性能應(yīng)用面臨的挑戰(zhàn)
1.1.3 異構(gòu)并行計(jì)算帶來(lái)的機(jī)遇和挑戰(zhàn)
1.1.4 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 粒子輸運(yùn)的并行算法研究
1.2.2 面向異構(gòu)體系結(jié)構(gòu)的并行算法研究
1.3 本文的研究?jī)?nèi)容和主要貢獻(xiàn)
1.3.1 本文的研究?jī)?nèi)容
1.3.2 本文的主要貢獻(xiàn)
1.4 論文結(jié)構(gòu)
第二章 相關(guān)工作
2.1 粒子輸運(yùn)模型及其數(shù)值方法
2.1.1 粒子輸運(yùn)的基本概念
2.1.2 輸運(yùn)方程的一般形式及定解條件
2.1.3 輸運(yùn)方程的確定性數(shù)值近似解法
2.1.4 三維笛卡爾坐標(biāo)下的輸運(yùn)方程
2.1.5 三維笛卡爾坐標(biāo)下的輸運(yùn)問(wèn)題的差分方程
2.1.6 二維柱坐標(biāo)下的輸運(yùn)方程
2.1.7 二維柱坐標(biāo)下的輸運(yùn)問(wèn)題的間斷有限元方程
2.1.8 離散縱標(biāo)方法
2.1.9 間斷有限元法
2.1.10 源迭代方法
2.1.11 粒子輸運(yùn)的非確定性模擬
2.2 異構(gòu)體系結(jié)構(gòu)
2.2.1 分類、特征及趨勢(shì)
2.2.2 典型的協(xié)處理單元
2.2.3 高性能計(jì)算領(lǐng)域異構(gòu)體系結(jié)構(gòu)面臨的挑戰(zhàn)
2.3 GPU 硬件架構(gòu)及編程模型
第三章 基于GPU 的粒子輸運(yùn)三維確定性結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級(jí)并行掃描算法
3.1 問(wèn)題提出
3.2 相關(guān)研究
3.3 基于GPU 的數(shù)據(jù)級(jí)通量掃描算法
3.3.1 基本的線程級(jí)并行掃描
3.3.2 從P_n 矩中計(jì)算源項(xiàng)
3.3.3 求解遞歸的S_n 方程
3.3.4 更新來(lái)自P_n 矩的粒子通量和DSA 面流
3.3.5 其它過(guò)程
3.4 算法分析
3.4.1 并行度模型及分析
3.5 數(shù)值實(shí)驗(yàn)和討論
3.5.1 實(shí)驗(yàn)平臺(tái)和問(wèn)題模型
3.5.2 基本數(shù)據(jù)級(jí)并行掃描
3.5.3 模擬的收斂性
3.5.4 不進(jìn)行通量修正的性能
3.5.5 S_n 遞歸方程并行化的效果
3.5.6 GPU 和CPU 實(shí)現(xiàn)的細(xì)節(jié)比較
3.5.7 進(jìn)行通量修正時(shí)粒子輸運(yùn)的性能
3.5.8 討論
3.6 小結(jié)
第四章 基于GPU 的粒子輸運(yùn)二維確定性非結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級(jí)并行掃描算法
4.1 問(wèn)題提出
4.2 相關(guān)研究
4.3 基于GPU 的數(shù)據(jù)級(jí)掃描算法
4.3.1 預(yù)掃描算法:確定掃描順序
4.3.2 映射并行通量掃描計(jì)算到GPU 線程執(zhí)行模型
4.3.3 其它過(guò)程
4.3.4 優(yōu)化
4.4 算法分析
4.4.1 預(yù)掃描算法的可行性分析
4.4.2 并行度分析
4.4.3 層次式異構(gòu)并行算法設(shè)計(jì)方法:從循環(huán)展開與分割的角度
4.5 數(shù)值實(shí)驗(yàn)和討論
4.5.1 實(shí)驗(yàn)平臺(tái)和問(wèn)題模型
4.5.2 模擬的收斂性
4.5.3 數(shù)據(jù)級(jí)并行通量掃描算法的性質(zhì)
4.5.4 性能比較
4.5.5 討論
4.6 小結(jié)
第五章 基于GPU 的非確定性粒子輸運(yùn)數(shù)據(jù)級(jí)并行算法
5.1 問(wèn)題提出
5.2 相關(guān)研究
5.3 基于GPU 的數(shù)據(jù)級(jí)并行MC 模擬算法
5.3.1 算法總體流程
5.3.2 并行訪存沖突的消除:引入新型數(shù)據(jù)結(jié)構(gòu)
5.3.3 GPU 多線程并行
5.3.4 基于GPU 的并行偽隨機(jī)數(shù)發(fā)生器
5.3.5 基于GPU 的方向角分布抽樣
5.3.6 優(yōu)化
5.4 算法分析
5.4.1 存儲(chǔ)事務(wù)模型
5.4.2 面向異構(gòu)體系結(jié)構(gòu)的算法設(shè)計(jì)優(yōu)化方法簡(jiǎn)述
5.5 數(shù)值實(shí)驗(yàn)和討論
5.5.1 測(cè)試平臺(tái)
5.5.2 并行偽隨機(jī)數(shù)測(cè)試結(jié)果
5.5.3 角分布抽樣測(cè)試結(jié)果
5.5.4 MCNP-GPU 測(cè)試結(jié)果
5.5.5 討論
5.6 小結(jié)
第六章 面向異構(gòu)體系結(jié)構(gòu)可擴(kuò)展粒子輸運(yùn)并行框架設(shè)計(jì)與實(shí)現(xiàn)
6.1 問(wèn)題提出
6.2 相關(guān)研究
6.3 面向異構(gòu)體系結(jié)構(gòu)的可擴(kuò)展粒子輸運(yùn)并行框架設(shè)計(jì)
6.3.1 層次結(jié)構(gòu)
6.3.2 異構(gòu)類型定義
6.3.3 數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)
6.3.4 模塊設(shè)計(jì)
6.3.5 接口設(shè)計(jì)
6.3.6 代碼和文檔
6.4 應(yīng)用示例
6.4.1 Sweep3D-multiGPU
6.4.2 Hybrid-EP
6.5 小結(jié)
第七章 結(jié)束語(yǔ)
7.1 工作總結(jié)
7.2 工作展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)庫(kù)[J]. 電器. 2011(11)
[2]Parallel implementation of fast multipole method based on JASMIN[J]. CAO XiaoLin 1,2,MO ZeYao 1,2,LIU Xu 1,XU XiaoWen 1 & ZHANG AiQing 1 1 High Performance Computational Center in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;2 Laboratory of Computational Physics in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China. Science China(Information Sciences). 2011(04)
[3]Cell處理器上軟件緩存的設(shè)計(jì)與實(shí)現(xiàn)[J]. 孫守航,楊燦群. 計(jì)算機(jī)工程. 2011(02)
[4]粒子輸運(yùn)蒙特卡羅模擬現(xiàn)狀概述[J]. 鄧力,李剛. 計(jì)算物理. 2010(06)
[5]非結(jié)構(gòu)網(wǎng)格粒子輸運(yùn)Sn并行算法[J]. 遲利華,劉杰,田平. 計(jì)算機(jī)工程與科學(xué). 2010(10)
[6]基于JASMIN框架的快速多極子并行解法器[J]. 曹小林,莫?jiǎng)t堯,劉旭,徐小文,張愛清. 中國(guó)科學(xué):信息科學(xué). 2010(09)
[7]Efficient Monte Carlo-based options pricing on graphics processors and its optimizations[J]. 劉力,劉利. Science China(Information Sciences). 2010(09)
[8]基于PVM的MCNP程序的并行計(jì)算解決方案[J]. 王文煒,凌球,楊磊,黃千紅. 核電子學(xué)與探測(cè)技術(shù). 2010(08)
[9]基于FPGA內(nèi)置RAM的抗輻射有限狀態(tài)機(jī)設(shè)計(jì)[J]. 孫兆偉,劉源,徐國(guó)棟,孫蕊. 航空學(xué)報(bào). 2010(05)
[10]一種求解輸運(yùn)方程的并行調(diào)度算法[J]. 周滌宇,劉杰. 計(jì)算機(jī)學(xué)報(bào). 2010(05)
博士論文
[1]高維中子輸運(yùn)方程的離散格式與并行算法研究[D]. 陽(yáng)述林.中國(guó)工程物理研究院 2003
碩士論文
[1]粒子輸運(yùn)的確定性問(wèn)題并行算法研究[D]. 周滌宇.國(guó)防科學(xué)技術(shù)大學(xué) 2007
[2]二維輸運(yùn)方程離散縱標(biāo)方法的并行計(jì)算方法研究[D]. 陳靜.國(guó)防科學(xué)技術(shù)大學(xué) 2005
[3]MVC模式在系統(tǒng)框架設(shè)計(jì)中的研究與應(yīng)用[D]. 杜愛華.西安建筑科技大學(xué) 2005
本文編號(hào):3237264
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:154 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 課題研究背景及意義
1.1.1 輸運(yùn)理論簡(jiǎn)介
1.1.2 以粒子輸運(yùn)模擬為代表的高性能應(yīng)用面臨的挑戰(zhàn)
1.1.3 異構(gòu)并行計(jì)算帶來(lái)的機(jī)遇和挑戰(zhàn)
1.1.4 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 粒子輸運(yùn)的并行算法研究
1.2.2 面向異構(gòu)體系結(jié)構(gòu)的并行算法研究
1.3 本文的研究?jī)?nèi)容和主要貢獻(xiàn)
1.3.1 本文的研究?jī)?nèi)容
1.3.2 本文的主要貢獻(xiàn)
1.4 論文結(jié)構(gòu)
第二章 相關(guān)工作
2.1 粒子輸運(yùn)模型及其數(shù)值方法
2.1.1 粒子輸運(yùn)的基本概念
2.1.2 輸運(yùn)方程的一般形式及定解條件
2.1.3 輸運(yùn)方程的確定性數(shù)值近似解法
2.1.4 三維笛卡爾坐標(biāo)下的輸運(yùn)方程
2.1.5 三維笛卡爾坐標(biāo)下的輸運(yùn)問(wèn)題的差分方程
2.1.6 二維柱坐標(biāo)下的輸運(yùn)方程
2.1.7 二維柱坐標(biāo)下的輸運(yùn)問(wèn)題的間斷有限元方程
2.1.8 離散縱標(biāo)方法
2.1.9 間斷有限元法
2.1.10 源迭代方法
2.1.11 粒子輸運(yùn)的非確定性模擬
2.2 異構(gòu)體系結(jié)構(gòu)
2.2.1 分類、特征及趨勢(shì)
2.2.2 典型的協(xié)處理單元
2.2.3 高性能計(jì)算領(lǐng)域異構(gòu)體系結(jié)構(gòu)面臨的挑戰(zhàn)
2.3 GPU 硬件架構(gòu)及編程模型
第三章 基于GPU 的粒子輸運(yùn)三維確定性結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級(jí)并行掃描算法
3.1 問(wèn)題提出
3.2 相關(guān)研究
3.3 基于GPU 的數(shù)據(jù)級(jí)通量掃描算法
3.3.1 基本的線程級(jí)并行掃描
3.3.2 從P_n 矩中計(jì)算源項(xiàng)
3.3.3 求解遞歸的S_n 方程
3.3.4 更新來(lái)自P_n 矩的粒子通量和DSA 面流
3.3.5 其它過(guò)程
3.4 算法分析
3.4.1 并行度模型及分析
3.5 數(shù)值實(shí)驗(yàn)和討論
3.5.1 實(shí)驗(yàn)平臺(tái)和問(wèn)題模型
3.5.2 基本數(shù)據(jù)級(jí)并行掃描
3.5.3 模擬的收斂性
3.5.4 不進(jìn)行通量修正的性能
3.5.5 S_n 遞歸方程并行化的效果
3.5.6 GPU 和CPU 實(shí)現(xiàn)的細(xì)節(jié)比較
3.5.7 進(jìn)行通量修正時(shí)粒子輸運(yùn)的性能
3.5.8 討論
3.6 小結(jié)
第四章 基于GPU 的粒子輸運(yùn)二維確定性非結(jié)構(gòu)化網(wǎng)格數(shù)據(jù)級(jí)并行掃描算法
4.1 問(wèn)題提出
4.2 相關(guān)研究
4.3 基于GPU 的數(shù)據(jù)級(jí)掃描算法
4.3.1 預(yù)掃描算法:確定掃描順序
4.3.2 映射并行通量掃描計(jì)算到GPU 線程執(zhí)行模型
4.3.3 其它過(guò)程
4.3.4 優(yōu)化
4.4 算法分析
4.4.1 預(yù)掃描算法的可行性分析
4.4.2 并行度分析
4.4.3 層次式異構(gòu)并行算法設(shè)計(jì)方法:從循環(huán)展開與分割的角度
4.5 數(shù)值實(shí)驗(yàn)和討論
4.5.1 實(shí)驗(yàn)平臺(tái)和問(wèn)題模型
4.5.2 模擬的收斂性
4.5.3 數(shù)據(jù)級(jí)并行通量掃描算法的性質(zhì)
4.5.4 性能比較
4.5.5 討論
4.6 小結(jié)
第五章 基于GPU 的非確定性粒子輸運(yùn)數(shù)據(jù)級(jí)并行算法
5.1 問(wèn)題提出
5.2 相關(guān)研究
5.3 基于GPU 的數(shù)據(jù)級(jí)并行MC 模擬算法
5.3.1 算法總體流程
5.3.2 并行訪存沖突的消除:引入新型數(shù)據(jù)結(jié)構(gòu)
5.3.3 GPU 多線程并行
5.3.4 基于GPU 的并行偽隨機(jī)數(shù)發(fā)生器
5.3.5 基于GPU 的方向角分布抽樣
5.3.6 優(yōu)化
5.4 算法分析
5.4.1 存儲(chǔ)事務(wù)模型
5.4.2 面向異構(gòu)體系結(jié)構(gòu)的算法設(shè)計(jì)優(yōu)化方法簡(jiǎn)述
5.5 數(shù)值實(shí)驗(yàn)和討論
5.5.1 測(cè)試平臺(tái)
5.5.2 并行偽隨機(jī)數(shù)測(cè)試結(jié)果
5.5.3 角分布抽樣測(cè)試結(jié)果
5.5.4 MCNP-GPU 測(cè)試結(jié)果
5.5.5 討論
5.6 小結(jié)
第六章 面向異構(gòu)體系結(jié)構(gòu)可擴(kuò)展粒子輸運(yùn)并行框架設(shè)計(jì)與實(shí)現(xiàn)
6.1 問(wèn)題提出
6.2 相關(guān)研究
6.3 面向異構(gòu)體系結(jié)構(gòu)的可擴(kuò)展粒子輸運(yùn)并行框架設(shè)計(jì)
6.3.1 層次結(jié)構(gòu)
6.3.2 異構(gòu)類型定義
6.3.3 數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)
6.3.4 模塊設(shè)計(jì)
6.3.5 接口設(shè)計(jì)
6.3.6 代碼和文檔
6.4 應(yīng)用示例
6.4.1 Sweep3D-multiGPU
6.4.2 Hybrid-EP
6.5 小結(jié)
第七章 結(jié)束語(yǔ)
7.1 工作總結(jié)
7.2 工作展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)庫(kù)[J]. 電器. 2011(11)
[2]Parallel implementation of fast multipole method based on JASMIN[J]. CAO XiaoLin 1,2,MO ZeYao 1,2,LIU Xu 1,XU XiaoWen 1 & ZHANG AiQing 1 1 High Performance Computational Center in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;2 Laboratory of Computational Physics in Institute of Applied Physics and Computational Mathematics,Beijing 100094,China. Science China(Information Sciences). 2011(04)
[3]Cell處理器上軟件緩存的設(shè)計(jì)與實(shí)現(xiàn)[J]. 孫守航,楊燦群. 計(jì)算機(jī)工程. 2011(02)
[4]粒子輸運(yùn)蒙特卡羅模擬現(xiàn)狀概述[J]. 鄧力,李剛. 計(jì)算物理. 2010(06)
[5]非結(jié)構(gòu)網(wǎng)格粒子輸運(yùn)Sn并行算法[J]. 遲利華,劉杰,田平. 計(jì)算機(jī)工程與科學(xué). 2010(10)
[6]基于JASMIN框架的快速多極子并行解法器[J]. 曹小林,莫?jiǎng)t堯,劉旭,徐小文,張愛清. 中國(guó)科學(xué):信息科學(xué). 2010(09)
[7]Efficient Monte Carlo-based options pricing on graphics processors and its optimizations[J]. 劉力,劉利. Science China(Information Sciences). 2010(09)
[8]基于PVM的MCNP程序的并行計(jì)算解決方案[J]. 王文煒,凌球,楊磊,黃千紅. 核電子學(xué)與探測(cè)技術(shù). 2010(08)
[9]基于FPGA內(nèi)置RAM的抗輻射有限狀態(tài)機(jī)設(shè)計(jì)[J]. 孫兆偉,劉源,徐國(guó)棟,孫蕊. 航空學(xué)報(bào). 2010(05)
[10]一種求解輸運(yùn)方程的并行調(diào)度算法[J]. 周滌宇,劉杰. 計(jì)算機(jī)學(xué)報(bào). 2010(05)
博士論文
[1]高維中子輸運(yùn)方程的離散格式與并行算法研究[D]. 陽(yáng)述林.中國(guó)工程物理研究院 2003
碩士論文
[1]粒子輸運(yùn)的確定性問(wèn)題并行算法研究[D]. 周滌宇.國(guó)防科學(xué)技術(shù)大學(xué) 2007
[2]二維輸運(yùn)方程離散縱標(biāo)方法的并行計(jì)算方法研究[D]. 陳靜.國(guó)防科學(xué)技術(shù)大學(xué) 2005
[3]MVC模式在系統(tǒng)框架設(shè)計(jì)中的研究與應(yīng)用[D]. 杜愛華.西安建筑科技大學(xué) 2005
本文編號(hào):3237264
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3237264.html
最近更新
教材專著