面向求解三維復雜流動問題的GPU并行算法及其應用研究
發(fā)布時間:2020-07-17 19:40
【摘要】:近年來,一種新的基于GPU(Graphics Processing Unit)的并行計算技術,隨著圖形快速渲染需求應運而生,備受工程界和學術界的關注;贕PU異型架構發(fā)展新型的并行算法,已成為當前計算流體力學(CFD)領域研究的熱點之一。本文緊扣這一并行算法發(fā)展的趨勢,結合工程應用中經(jīng)常遇到的Euler方程和Navier-Stokes方程三維復雜流動求解問題,開展了適合處理復雜幾何外形的有限體積法和無網(wǎng)格算法的GPU并行化研究。先對顯式格式網(wǎng)格方法的GPU并行化改造問題進行了研究。針對格點格式有限體積法,圍繞并行計算任務劃分、GPU線程結構和核函數(shù)(Kernel)構建以及數(shù)據(jù)存儲結構構造等問題,開展了GPU并行化改造工作。具體根據(jù)有限體積法計算流程,提出了GPU并行任務劃分的一般方法;再根據(jù)計算發(fā)生的位置對并行任務進行分類,并依此構建出與各自計算規(guī)模相適應的GPU線程結構和核函數(shù)。進一步為了提高核函數(shù)的數(shù)據(jù)訪問效率,提出了適合GPU的格點格式有限體積法數(shù)據(jù)存儲結構,該結構能較好地滿足GPU內(nèi)存合并訪問要求。最后,用翼型和機翼典型繞流算例對發(fā)展的顯式格式有限體積GPU并行算法進行了并行加速效率考核,取得了預期的效果。接著研究了隱式格式網(wǎng)格方法的GPU并行化改造問題。隱式格式固有的強數(shù)據(jù)依賴性不適合GPU線程運算數(shù)據(jù)獨立性(Data Independency)的要求。本文針對這一瓶頸問題,提出了網(wǎng)格頂點著色分組方法。通過著色處理將網(wǎng)格頂點分為一系列顏色分組,使得每一分組內(nèi)不同網(wǎng)格頂點的隱式計算相互獨立。利用所提網(wǎng)格頂點著色分組方法,成功地對LU-SGS格式進行了GPU并行化改造,發(fā)展出適合GPU并行計算的LU-SGS隱式格式,并結合Euler方程和Navier-Stokes方程的求解,用典型繞流算例對發(fā)展的隱式格式有限體積GPU并行算法進行了考核運算。結果表明,如預期,發(fā)展的隱式格式GPU并行算法計算效率能進一步提升,相比顯式格式能進一步提高2至4倍左右。最后開展了無網(wǎng)格方法的GPU并行化研究,致力于發(fā)展出無網(wǎng)格GPU并行算法。無網(wǎng)格方法計算區(qū)域的離散只涉及布點,具有靈活性而特別適合復雜外形復雜繞流問題的處理,但因其點云結構等特殊性,算法的GPU并行化在國內(nèi)外還不多見。本文結合無網(wǎng)格點云結構特點,構建并行線程與無網(wǎng)格點云中心點之間的點映射關系,提出了基于這一點映射的無網(wǎng)格GPU并行化改造的實施方法。具體先結合Runge-Kutta格式,發(fā)展了顯式格式無網(wǎng)格GPU并行算法;再在顯式算法取得成功的基礎上,開展了隱式無網(wǎng)格GPU并行算法的研究。結合無網(wǎng)格點云結構特點,提出了基于點云拓撲關系的點著色分組技術,成功地發(fā)展出隱式格式無網(wǎng)格GPU并行算法。接著對發(fā)展的算法開展了并行加速效率進一步提升的研究。具體在上述基于點映射的無網(wǎng)格GPU算法框架下,研究了核函數(shù)合并方法,因降低了總內(nèi)存訪問量,提高了整體計算效率;同時,針對不規(guī)則點云上GPU算法的計算效率相對較低的問題,提出了無網(wǎng)格點分層著色排序(Multi-Layered Point Reordering,MLPRO)方法,有效地提高了無網(wǎng)格點云衛(wèi)星點的有序性,提高了GPU算法的并行加速效率。最后,基于所提算法,成功地研制了相應的無網(wǎng)格GPU計算程序,完成了對典型二維流動算例的考核驗算,并成功地推廣應用到了三維粘性流動問題的求解。所有算例都取得了GPU加速效果,相比單核CPU,顯式算法GPU加速最多達85倍,隱式算法還可進一步提升2到5倍,同時算例也表明,所提核函數(shù)合并和MLPRO排序等措施也能顯著提升算法效率。
【學位授予單位】:南京航空航天大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:O35;TP332
【圖文】:
面向求解三維復雜流動問題的 GPU 并行算法及其應用研究而應運而生,并得到了迅速發(fā)展。圖 1.1 顯示了 2003 年至 2016 年間 NVIDIAGPU 和 Intel CPU的單雙精度浮點運算峰值性能和內(nèi)存訪問帶寬的發(fā)展情況[86]。從浮點運算峰值性能上看,GPU達到同時期 CPU 的 5-10 倍;從內(nèi)存帶寬上看,GPU 為同時期 CPU 的 3 倍以上。強大的運算能力一定程度上反映了 GPU 并行算法的加速潛能。
面向求解三維復雜流動問題的 GPU 并行算法及其應用研究雜外形流動問題。因此,本文基于非結構網(wǎng)格數(shù)據(jù)結構發(fā)展有限體積 GP格單元類型有二維的三角形、四邊形網(wǎng)格單元和三維的四面體、六面體單元,如圖 2.1 所示。(a)三角形單元 (b)四邊形單元 (c)四面體單元
三棱柱單元 (e)金字塔單元 (f)六面圖 2.1 有限體積法網(wǎng)格單元類型形式不同,可將有限體積法分為格點格式(cell-)。本文采用的是格點格式有限體積法,其控制離散的網(wǎng)格頂點, , 1, ,6iE i 表示網(wǎng)格單元元的中心點和所有網(wǎng)格邊的中心點依次相連所構
本文編號:2759851
【學位授予單位】:南京航空航天大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:O35;TP332
【圖文】:
面向求解三維復雜流動問題的 GPU 并行算法及其應用研究而應運而生,并得到了迅速發(fā)展。圖 1.1 顯示了 2003 年至 2016 年間 NVIDIAGPU 和 Intel CPU的單雙精度浮點運算峰值性能和內(nèi)存訪問帶寬的發(fā)展情況[86]。從浮點運算峰值性能上看,GPU達到同時期 CPU 的 5-10 倍;從內(nèi)存帶寬上看,GPU 為同時期 CPU 的 3 倍以上。強大的運算能力一定程度上反映了 GPU 并行算法的加速潛能。
面向求解三維復雜流動問題的 GPU 并行算法及其應用研究雜外形流動問題。因此,本文基于非結構網(wǎng)格數(shù)據(jù)結構發(fā)展有限體積 GP格單元類型有二維的三角形、四邊形網(wǎng)格單元和三維的四面體、六面體單元,如圖 2.1 所示。(a)三角形單元 (b)四邊形單元 (c)四面體單元
三棱柱單元 (e)金字塔單元 (f)六面圖 2.1 有限體積法網(wǎng)格單元類型形式不同,可將有限體積法分為格點格式(cell-)。本文采用的是格點格式有限體積法,其控制離散的網(wǎng)格頂點, , 1, ,6iE i 表示網(wǎng)格單元元的中心點和所有網(wǎng)格邊的中心點依次相連所構
【參考文獻】
相關期刊論文 前9條
1 蒲賽虎;陳紅全;;處理動邊界問題的無網(wǎng)格/直角網(wǎng)格混合算法[J];南京航空航天大學學報;2010年04期
2 張兵;韓景龍;;基于GPU和隱式格式的CFD并行計算方法[J];航空學報;2010年02期
3 馬志華;陳紅全;吳曉軍;饒玲;王紅;;基于局部無網(wǎng)格的混合算法研究[J];空氣動力學學報;2008年03期
4 周季夫;鐘誠文;尹世群;解建飛;張勇;;基于GPGPU的Lattice-Boltzmann數(shù)值模擬算法[J];計算機輔助設計與圖形學學報;2008年07期
5 閆曉軍,張玉珠,聶景旭;空間碎片超高速碰撞數(shù)值模擬的SPH方法[J];北京航空航天大學學報;2005年03期
6 呂曉斌,蘭黔章,朱自強;求解Euler方程的區(qū)域分解方法與并行算法[J];計算物理;2000年04期
7 蘇繼超;ADI方法求解完全跨聲速非定常小擾動方程[J];空氣動力學學報;1990年02期
8 張涵信;無波動、無自由參數(shù)的耗散差分格式[J];空氣動力學學報;1988年02期
9 羅世鳳;跨音速小擾動方程的近似因式分解法[J];空氣動力學學報;1983年02期
相關博士學位論文 前1條
1 馬志華;自適應無網(wǎng)格及網(wǎng)格和無網(wǎng)格混合算法研究[D];南京航空航天大學;2008年
本文編號:2759851
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2759851.html
最近更新
教材專著