面向求解三維復雜流動問題的GPU并行算法及其應用研究

發(fā)布時間：2020-07-17 19:40

【摘要】：近年來,一種新的基于GPU(Graphics Processing Unit)的并行計算技術,隨著圖形快速渲染需求應運而生,備受工程界和學術界的關注�；贕PU異型架構發(fā)展新型的并行算法,已成為當前計算流體力學(CFD)領域研究的熱點之一。本文緊扣這一并行算法發(fā)展的趨勢,結合工程應用中經(jīng)常遇到的Euler方程和Navier-Stokes方程三維復雜流動求解問題,開展了適合處理復雜幾何外形的有限體積法和無網(wǎng)格算法的GPU并行化研究。先對顯式格式網(wǎng)格方法的GPU并行化改造問題進行了研究。針對格點格式有限體積法,圍繞并行計算任務劃分、GPU線程結構和核函數(shù)(Kernel)構建以及數(shù)據(jù)存儲結構構造等問題,開展了GPU并行化改造工作。具體根據(jù)有限體積法計算流程,提出了GPU并行任務劃分的一般方法;再根據(jù)計算發(fā)生的位置對并行任務進行分類,并依此構建出與各自計算規(guī)模相適應的GPU線程結構和核函數(shù)。進一步為了提高核函數(shù)的數(shù)據(jù)訪問效率,提出了適合GPU的格點格式有限體積法數(shù)據(jù)存儲結構,該結構能較好地滿足GPU內(nèi)存合并訪問要求。最后,用翼型和機翼典型繞流算例對發(fā)展的顯式格式有限體積GPU并行算法進行了并行加速效率考核,取得了預期的效果。接著研究了隱式格式網(wǎng)格方法的GPU并行化改造問題。隱式格式固有的強數(shù)據(jù)依賴性不適合GPU線程運算數(shù)據(jù)獨立性(Data Independency)的要求。本文針對這一瓶頸問題,提出了網(wǎng)格頂點著色分組方法。通過著色處理將網(wǎng)格頂點分為一系列顏色分組,使得每一分組內(nèi)不同網(wǎng)格頂點的隱式計算相互獨立。利用所提網(wǎng)格頂點著色分組方法,成功地對LU-SGS格式進行了GPU并行化改造,發(fā)展出適合GPU并行計算的LU-SGS隱式格式,并結合Euler方程和Navier-Stokes方程的求解,用典型繞流算例對發(fā)展的隱式格式有限體積GPU并行算法進行了考核運算。結果表明,如預期,發(fā)展的隱式格式GPU并行算法計算效率能進一步提升,相比顯式格式能進一步提高2至4倍左右。最后開展了無網(wǎng)格方法的GPU并行化研究,致力于發(fā)展出無網(wǎng)格GPU并行算法。無網(wǎng)格方法計算區(qū)域的離散只涉及布點,具有靈活性而特別適合復雜外形復雜繞流問題的處理,但因其點云結構等特殊性,算法的GPU并行化在國內(nèi)外還不多見。本文結合無網(wǎng)格點云結構特點,構建并行線程與無網(wǎng)格點云中心點之間的點映射關系,提出了基于這一點映射的無網(wǎng)格GPU并行化改造的實施方法。具體先結合Runge-Kutta格式,發(fā)展了顯式格式無網(wǎng)格GPU并行算法;再在顯式算法取得成功的基礎上,開展了隱式無網(wǎng)格GPU并行算法的研究。結合無網(wǎng)格點云結構特點,提出了基于點云拓撲關系的點著色分組技術,成功地發(fā)展出隱式格式無網(wǎng)格GPU并行算法。接著對發(fā)展的算法開展了并行加速效率進一步提升的研究。具體在上述基于點映射的無網(wǎng)格GPU算法框架下,研究了核函數(shù)合并方法,因降低了總內(nèi)存訪問量,提高了整體計算效率;同時,針對不規(guī)則點云上GPU算法的計算效率相對較低的問題,提出了無網(wǎng)格點分層著色排序(Multi-Layered Point Reordering,MLPRO)方法,有效地提高了無網(wǎng)格點云衛(wèi)星點的有序性,提高了GPU算法的并行加速效率。最后,基于所提算法,成功地研制了相應的無網(wǎng)格GPU計算程序,完成了對典型二維流動算例的考核驗算,并成功地推廣應用到了三維粘性流動問題的求解。所有算例都取得了GPU加速效果,相比單核CPU,顯式算法GPU加速最多達85倍,隱式算法還可進一步提升2到5倍,同時算例也表明,所提核函數(shù)合并和MLPRO排序等措施也能顯著提升算法效率。
【學位授予單位】：南京航空航天大學
【學位級別】：博士
【學位授予年份】：2018
【分類號】：O35;TP332
【圖文】：

計算性能,并行算法,內(nèi)存訪問,帶寬

面向求解三維復雜流動問題的 GPU 并行算法及其應用研究而應運而生，并得到了迅速發(fā)展。圖 1.1 顯示了 2003 年至 2016 年間 NVIDIAGPU 和 Intel CPU的單雙精度浮點運算峰值性能和內(nèi)存訪問帶寬的發(fā)展情況[86]。從浮點運算峰值性能上看，GPU達到同時期 CPU 的 5-10 倍；從內(nèi)存帶寬上看，GPU 為同時期 CPU 的 3 倍以上。強大的運算能力一定程度上反映了 GPU 并行算法的加速潛能。

有限體積法,網(wǎng)格單元,類型,流動問題

面向求解三維復雜流動問題的 GPU 并行算法及其應用研究雜外形流動問題。因此，本文基于非結構網(wǎng)格數(shù)據(jù)結構發(fā)展有限體積 GP格單元類型有二維的三角形、四邊形網(wǎng)格單元和三維的四面體、六面體單元，如圖 2.1 所示。（a）三角形單元（b）四邊形單元（c）四面體單元

示意圖,有限體積法,格點,格式

三棱柱單元（e）金字塔單元（f）六面圖 2.1 有限體積法網(wǎng)格單元類型形式不同，可將有限體積法分為格點格式（cell-）。本文采用的是格點格式有限體積法，其控制離散的網(wǎng)格頂點， , 1, ,6iE i 表示網(wǎng)格單元元的中心點和所有網(wǎng)格邊的中心點依次相連所構

【參考文獻】

相關期刊論文前9條

1 蒲賽虎;陳紅全;;處理動邊界問題的無網(wǎng)格/直角網(wǎng)格混合算法[J];南京航空航天大學學報;2010年04期

2 張兵;韓景龍;;基于GPU和隱式格式的CFD并行計算方法[J];航空學報;2010年02期

3 馬志華;陳紅全;吳曉軍;饒玲;王紅;;基于局部無網(wǎng)格的混合算法研究[J];空氣動力學學報;2008年03期

4 周季夫;鐘誠文;尹世群;解建飛;張勇;;基于GPGPU的Lattice-Boltzmann數(shù)值模擬算法[J];計算機輔助設計與圖形學學報;2008年07期

5 閆曉軍,張玉珠,聶景旭;空間碎片超高速碰撞數(shù)值模擬的SPH方法[J];北京航空航天大學學報;2005年03期

6 呂曉斌,蘭黔章,朱自強;求解Euler方程的區(qū)域分解方法與并行算法[J];計算物理;2000年04期

7 蘇繼超;ADI方法求解完全跨聲速非定常小擾動方程[J];空氣動力學學報;1990年02期

8 張涵信;無波動、無自由參數(shù)的耗散差分格式[J];空氣動力學學報;1988年02期

9 羅世鳳;跨音速小擾動方程的近似因式分解法[J];空氣動力學學報;1983年02期

相關博士學位論文前1條

1 馬志華;自適應無網(wǎng)格及網(wǎng)格和無網(wǎng)格混合算法研究[D];南京航空航天大學;2008年

本文編號：2759851

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2759851.html

上一篇：嵌入式封裝電子一體化雙噴頭復合3D打印機的研制
下一篇：粗粒度可重構陣列處理器性能優(yōu)化技術研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向求解三維復雜流動問題的GPU并行算法及其應用研究