基于多GPU的PCG算法并行研究及其在地下水流動模擬中的應(yīng)用
發(fā)布時(shí)間:2021-04-28 10:26
PCG算法的并行化對許多研究問題有重要意義,可通過提高求解方程組的效率來提高數(shù)值模擬的效率。為了科學(xué)使用地下水資源往往需要分析預(yù)測其流動規(guī)律。隨著研究的不斷發(fā)展,地下水?dāng)?shù)值模擬程序MODFLOW已經(jīng)不能很好的對大規(guī)模實(shí)驗(yàn)問題進(jìn)行模擬分析。為了提高模擬效率,本文主要研究在多GPU環(huán)境下對PCG算法的并行化,并將其應(yīng)用于MODFLOW中,從而實(shí)現(xiàn)MODFLOW的并行模擬。本文將PCG算法中的線性代數(shù)運(yùn)算實(shí)現(xiàn)為基于CUDA的核函數(shù),重點(diǎn)研究DIA格式并實(shí)現(xiàn)了較為高效的SpMV核函數(shù)。為了在單節(jié)點(diǎn)多GPU環(huán)境下對PCG并行化,計(jì)算任務(wù)被均等劃分并分別求解,求解過程中GPU間數(shù)據(jù)傳輸是性能瓶頸,為此本文通過減少非必要的數(shù)據(jù)傳輸和將SpMV計(jì)算與傳輸重疊的方法來減少數(shù)據(jù)傳輸開銷,提高PCG的加速比。在單節(jié)點(diǎn)環(huán)境中使用6個(gè)GPU的條件下,PCG的加速比隨著GPU數(shù)量的增多和數(shù)據(jù)規(guī)模的增大而得到明顯提高,最高達(dá)到36.3。在多節(jié)點(diǎn)環(huán)境中,通過MPI創(chuàng)建多個(gè)進(jìn)程來通過多個(gè)GPU求解方程組,本文通過合理的數(shù)據(jù)傳輸模型來統(tǒng)一節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間數(shù)據(jù)傳輸?shù)牟町愋?使其具有可移植性和高效性。在使用2個(gè)節(jié)點(diǎn)4個(gè)GPU的...
【文章來源】:中國地質(zhì)大學(xué)(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究目標(biāo)與內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)內(nèi)容介紹
2.1 預(yù)條件共軛梯度算法
2.2 稀疏矩陣的存儲格式
2.3 地下水流動數(shù)值模型
2.4 并行計(jì)算相關(guān)技術(shù)
2.4.1 GPU架構(gòu)
2.4.2 CUDA編程模型
2.4.3 OpenMP編程模型
2.4.4 MPI編程模型
2.5 本章小結(jié)
第3章 基于多GPU的 PCG算法并行研究
3.1 基于CUDA的 PCG并行研究
3.1.1 PCG并行化分析
3.1.2 稀疏矩陣的存儲
3.1.3 高性能Sp MV設(shè)計(jì)
3.2 基于單節(jié)點(diǎn)的PCG并行計(jì)算
3.2.1 單節(jié)點(diǎn)并行架構(gòu)設(shè)計(jì)
3.2.2 GPU間的數(shù)據(jù)傳輸
3.2.3 數(shù)據(jù)傳輸優(yōu)化
3.2.4 實(shí)驗(yàn)與結(jié)果分析
3.3 基于多節(jié)點(diǎn)的PCG并行計(jì)算
3.3.1 多節(jié)點(diǎn)并行架構(gòu)設(shè)計(jì)
3.3.2 數(shù)據(jù)傳輸模型
3.3.3 實(shí)驗(yàn)與結(jié)果分析
3.4 本章小結(jié)
第4章 基于多GPU的地下水模擬并行研究
4.1 地下水模擬程序結(jié)構(gòu)分析
4.2 基于單節(jié)點(diǎn)的地下水模擬并行加速
4.2.1 單節(jié)點(diǎn)并行模擬流程
4.2.2 實(shí)驗(yàn)與結(jié)果分析
4.3 基于多節(jié)點(diǎn)的地下水模擬并行加速
4.3.1 多節(jié)點(diǎn)并行模擬流程
4.3.2 實(shí)驗(yàn)與結(jié)果分析
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
附錄
【參考文獻(xiàn)】:
博士論文
[1]地下水流動空間數(shù)據(jù)并行計(jì)算的研究[D]. 李丹丹.中國地質(zhì)大學(xué)(北京) 2014
[2]地下水流動數(shù)值模擬的高效并行計(jì)算研究[D]. 程湯培.中國地質(zhì)大學(xué)(北京) 2011
本文編號:3165314
【文章來源】:中國地質(zhì)大學(xué)(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究目標(biāo)與內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)內(nèi)容介紹
2.1 預(yù)條件共軛梯度算法
2.2 稀疏矩陣的存儲格式
2.3 地下水流動數(shù)值模型
2.4 并行計(jì)算相關(guān)技術(shù)
2.4.1 GPU架構(gòu)
2.4.2 CUDA編程模型
2.4.3 OpenMP編程模型
2.4.4 MPI編程模型
2.5 本章小結(jié)
第3章 基于多GPU的 PCG算法并行研究
3.1 基于CUDA的 PCG并行研究
3.1.1 PCG并行化分析
3.1.2 稀疏矩陣的存儲
3.1.3 高性能Sp MV設(shè)計(jì)
3.2 基于單節(jié)點(diǎn)的PCG并行計(jì)算
3.2.1 單節(jié)點(diǎn)并行架構(gòu)設(shè)計(jì)
3.2.2 GPU間的數(shù)據(jù)傳輸
3.2.3 數(shù)據(jù)傳輸優(yōu)化
3.2.4 實(shí)驗(yàn)與結(jié)果分析
3.3 基于多節(jié)點(diǎn)的PCG并行計(jì)算
3.3.1 多節(jié)點(diǎn)并行架構(gòu)設(shè)計(jì)
3.3.2 數(shù)據(jù)傳輸模型
3.3.3 實(shí)驗(yàn)與結(jié)果分析
3.4 本章小結(jié)
第4章 基于多GPU的地下水模擬并行研究
4.1 地下水模擬程序結(jié)構(gòu)分析
4.2 基于單節(jié)點(diǎn)的地下水模擬并行加速
4.2.1 單節(jié)點(diǎn)并行模擬流程
4.2.2 實(shí)驗(yàn)與結(jié)果分析
4.3 基于多節(jié)點(diǎn)的地下水模擬并行加速
4.3.1 多節(jié)點(diǎn)并行模擬流程
4.3.2 實(shí)驗(yàn)與結(jié)果分析
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
附錄
【參考文獻(xiàn)】:
博士論文
[1]地下水流動空間數(shù)據(jù)并行計(jì)算的研究[D]. 李丹丹.中國地質(zhì)大學(xué)(北京) 2014
[2]地下水流動數(shù)值模擬的高效并行計(jì)算研究[D]. 程湯培.中國地質(zhì)大學(xué)(北京) 2011
本文編號:3165314
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3165314.html
最近更新
教材專著