多區(qū)結構網(wǎng)格CFD典型求解器的CPU/GPU并行計算研究
發(fā)布時間:2021-11-03 23:25
CPU/GPU異構并行計算是當前高性能計算研究的重要趨勢,本文基于我國自主發(fā)展的WCNS高階精度格式多區(qū)結構網(wǎng)格外流場空氣動力學數(shù)值模擬實際應用背景,在國家超算長沙中心的“天河-1A”超級計算機系統(tǒng)上開展了典型CFD求解器的GPU并行計算和CPU/GPU協(xié)同并行計算的研究與實現(xiàn)。主要工作包括:1)對典型的顯式、隱式CFD求解方法的基本原理、算法流程、計算的數(shù)據(jù)依賴關系等進行了深入分析;歸納出數(shù)據(jù)獨立、弱數(shù)據(jù)依賴、強數(shù)據(jù)依賴和分支密集型等幾種類型的CFD計算過程,相應地提出了基于網(wǎng)格點并行和基于網(wǎng)格線并行的GPU并行計算方法。結合CFD計算特點以及GPU體系結構和編程模型特點,實現(xiàn)、優(yōu)化了顯式龍格-庫塔求解器和隱式雅可比迭代求解器的GPU并行計算,并用不同規(guī)模結構網(wǎng)格的真實算例對其性能進行了測試。結果表明:龍格-庫塔求解器和雅可比迭代求解器的GPU并行加速隨網(wǎng)格規(guī)模的增大而增大;在200萬規(guī)模的單區(qū)結構網(wǎng)格上,二者分別取得了4.62倍和8.85倍的加速比;雅可比迭代求解器具有較好的GPU并行計算適應性。2)面向當前多核CPU和眾核GPU高性能異構計算節(jié)點,結合CFD多區(qū)計算特點,對多區(qū)結...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
CPU與GPU的浮點性能對比
CPU 和 GPU 的訪存性能對比
于雅可比迭代是新引入的求解方法,故而本文先將雅可比迭代求解務程序中現(xiàn)有的點松弛求解器分別在 5 萬、200 萬和 7200 萬的網(wǎng)格進行迭代計算收斂性的對比驗證。從圖 3.3 的測試結果可以看出,二算例中的迭代計算收斂性保持一致,雅可比迭代求解器能夠很好地務程序的實際應用需求。
【參考文獻】:
期刊論文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 楊學軍,廖湘科,盧凱,胡慶豐,宋君強,蘇金樹. Journal of Computer Science & Technology. 2011(03)
[2]基于GPU和隱式格式的CFD并行計算方法[J]. 張兵,韓景龍. 航空學報. 2010(02)
[3]Beginning a new period celebrating the 60th anniversary of the journal Scientia Sinica-(Science China)[J]. Da-Cheng Wang Editor-in-Chief. Science China(Life Sciences). 2010(01)
[4]Jacobi和Laplace算法在GPU平臺上的設計與實現(xiàn)[J]. 唐滔,林一松. 計算機工程與科學. 2009(S1)
[5]高階加權緊致非線性格式(WCNS)在二維流動計算中的加速收斂研究[J]. 張毅鋒,鄧小剛,毛枚良,陳堅強. 空氣動力學學報. 2008(03)
[6]一種可壓縮流動的高階加權緊致非線性格式(WCNS)的加速收斂方法[J]. 張毅鋒,鄧小剛,毛枚良,陳堅強. 計算物理. 2007(06)
[7]高階精度耗散加權緊致非線性格式[J]. 鄧小剛. 中國科學(A輯). 2001(12)
本文編號:3474540
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
CPU與GPU的浮點性能對比
CPU 和 GPU 的訪存性能對比
于雅可比迭代是新引入的求解方法,故而本文先將雅可比迭代求解務程序中現(xiàn)有的點松弛求解器分別在 5 萬、200 萬和 7200 萬的網(wǎng)格進行迭代計算收斂性的對比驗證。從圖 3.3 的測試結果可以看出,二算例中的迭代計算收斂性保持一致,雅可比迭代求解器能夠很好地務程序的實際應用需求。
【參考文獻】:
期刊論文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 楊學軍,廖湘科,盧凱,胡慶豐,宋君強,蘇金樹. Journal of Computer Science & Technology. 2011(03)
[2]基于GPU和隱式格式的CFD并行計算方法[J]. 張兵,韓景龍. 航空學報. 2010(02)
[3]Beginning a new period celebrating the 60th anniversary of the journal Scientia Sinica-(Science China)[J]. Da-Cheng Wang Editor-in-Chief. Science China(Life Sciences). 2010(01)
[4]Jacobi和Laplace算法在GPU平臺上的設計與實現(xiàn)[J]. 唐滔,林一松. 計算機工程與科學. 2009(S1)
[5]高階加權緊致非線性格式(WCNS)在二維流動計算中的加速收斂研究[J]. 張毅鋒,鄧小剛,毛枚良,陳堅強. 空氣動力學學報. 2008(03)
[6]一種可壓縮流動的高階加權緊致非線性格式(WCNS)的加速收斂方法[J]. 張毅鋒,鄧小剛,毛枚良,陳堅強. 計算物理. 2007(06)
[7]高階精度耗散加權緊致非線性格式[J]. 鄧小剛. 中國科學(A輯). 2001(12)
本文編號:3474540
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3474540.html
最近更新
教材專著