基于CPU/GPU異構系統(tǒng)架構的高超聲速湍流直接數(shù)值模擬研究
發(fā)布時間:2024-06-29 06:31
【目的】高超聲速湍流直接數(shù)值模擬(DNS)對空間及時間分辨率要求高,計算量非常大。過大的計算量及過長的計算時間是導致DNS難以在工程中被大范圍應用的重要原因。為加快計算速度,作者設計并開發(fā)了一套CPU/GPU異構系統(tǒng)架構(HSA)下的高性能計算流體力學程序OpenCFD-SCU。【方法】該程序以作者前期開發(fā)的高精度有限差分求解器OpenCFD-SC為基礎,經GPU系統(tǒng)的移植及優(yōu)化而得。GPU程序的計算部分使用CUDA編程,確保所有算術運算都在GPU上完成!窘Y果】利用GPU程序OpenCFD-SCU,進行了來流Mach數(shù)6,6°攻角鈍錐邊界層轉捩的直接數(shù)值模擬,得到了轉捩過程中的時空演化流場。針對這一算例,GPU程序OpenCFD-SCU與CPU程序OpenCFD-SC相比,實現(xiàn)了60倍的加速效果(單GPU卡對單CPU核心),大大加速了DNS計算過程。【結論】未來,相信會有更多高超聲速湍流模擬選擇在GPU上開展。
【文章頁數(shù)】:12 頁
【部分圖文】:
本文編號:3997308
【文章頁數(shù)】:12 頁
【部分圖文】:
圖6鈍錐表面流向網格
網格規(guī)模為1600*1200*120,其中流線網格數(shù)1600,周向網格數(shù)1200,法向網格數(shù)120,總網格2.3億,流向網格在頭部進行加密,周向采用非均勻網格在迎風面對網格進行加密。壁面第一層網格為0.01mm。流向與周向網格見圖6、圖7。圖7鈍錐表面周向網格
圖1CPU與GPU浮點運算能力[16]
在過往對高超聲速湍流的DNS中,往往通過在大規(guī)模CPU集群上做并行計算來實現(xiàn),節(jié)點間采用MPI(MessagePassingInterface)、ZeroMQ(0MQ)、Hadoop等方式進行數(shù)據通訊。然而,多核架構的CPU的計算能力現(xiàn)今已被眾核架構的GPU甩在身后,圖1、....
圖2CPU與GPU的帶寬[16]
利用GPU求解流體力學問題前人已經開展過一些工作,2003年TakashiAmada在GPU上實現(xiàn)了基于平滑分子動力學(SmoothedParticleHydrody-namics)的粒子流動模擬[3],同年,J.Kruger利用GPU求解了二維不可壓N-S方程[4]。20....
圖3OpenCFD-SC計算流程
CPU/GPU異構系統(tǒng)架構(HSA)下的計算流體力學程序OpenCFD-SCU(OpenCFDScientificComputing-CUDA)以作者前期開發(fā)的高精度有限差分求解器OpenCFD-SC[20]為基礎,兩者使用相同的程序框架,程序框架如圖3。程序先讀入控制....
本文編號:3997308
本文鏈接:http://sikaile.net/kejilunwen/lxlw/3997308.html
教材專著