天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于非結(jié)構(gòu)網(wǎng)格的可壓縮粘性流動(dòng)數(shù)值方法的GPU實(shí)現(xiàn)

發(fā)布時(shí)間:2017-04-15 01:06

  本文關(guān)鍵詞:基于非結(jié)構(gòu)網(wǎng)格的可壓縮粘性流動(dòng)數(shù)值方法的GPU實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:近年來(lái),CPU的性能提升受制于功耗和工藝逐漸放緩了腳步,而圖形處理器(GPU)由于其出色的浮點(diǎn)運(yùn)算性能以及相較于CPU更高的內(nèi)存帶寬在科學(xué)計(jì)算領(lǐng)域中得到了越來(lái)越多的青睞。學(xué)者們嘗試將GPU應(yīng)用于CFD領(lǐng)域,并且獲得了不錯(cuò)的加速效果。本文實(shí)現(xiàn)了GPU平臺(tái)的、基于非結(jié)構(gòu)網(wǎng)格、采用有限體積方法的RANS方程求解器,其適用于三維可壓縮、定常/非定常流動(dòng)的數(shù)值仿真。采用格點(diǎn)格式進(jìn)行控制體的離散。實(shí)現(xiàn)了Roe和Hllc通量計(jì)算格式,通過(guò)線(xiàn)性重構(gòu)結(jié)合Venkatakrishnan限制器實(shí)現(xiàn)了空間上的二階精度。時(shí)間離散方面討論了顯式Runge-Kutta方法以及隱式LU-SGS方法在GPU上的可行性。本文也將Runge-Kutta方法應(yīng)用于非定常計(jì)算中的時(shí)間積分,但是為了加速時(shí)間推進(jìn),進(jìn)一步地討論了時(shí)間離散上具備二階精度的雙時(shí)間步長(zhǎng)方法。采用Spalart-Allmaras一方程湍流模型封閉RANS方程,加入DES選項(xiàng)在分離區(qū)引入大渦模擬特性而邊界層內(nèi)仍然采用RANS方程。此外,針對(duì)規(guī)模較大的網(wǎng)格,實(shí)現(xiàn)了基于KD-Tree方法的物面距求解。針對(duì)如上算法,通過(guò)詳細(xì)分析GPU軟、硬件架構(gòu),提出了一套完整的、高效的、采用雙精度浮點(diǎn)數(shù)的內(nèi)核函數(shù)設(shè)計(jì)及執(zhí)行方案。針對(duì)非結(jié)構(gòu)網(wǎng)格及格點(diǎn)格式特性,進(jìn)行了基于硬件利用率、內(nèi)存訪(fǎng)問(wèn)以及指令執(zhí)行三個(gè)層次的深度優(yōu)化,并提出了全新的、適用于本套算法的網(wǎng)格排序方法。通過(guò)多個(gè)定常/非定常算例驗(yàn)證了本文實(shí)現(xiàn)的正確性,實(shí)現(xiàn)了Runge-Kutta方法在單GPU上相較于CPU串行程序82~116倍的加速效果以及LU-SGS方法在單GPU上55~100倍的加速效果。結(jié)果充分展示了GPU在CFD領(lǐng)域中良好的應(yīng)用前景。
【關(guān)鍵詞】:計(jì)算流體力學(xué) 非結(jié)構(gòu)網(wǎng)格 格點(diǎn)格式 GPU CUDA 雙精度 并行計(jì)算 非定常 網(wǎng)格排序
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:O241.82;O35
【目錄】:
  • 摘要4-5
  • ABSTRACT5-11
  • 注釋表11-12
  • 第一章 緒論12-16
  • 1.1 研究背景12-13
  • 1.2 研究現(xiàn)狀13-15
  • 1.3 本文主要工作15-16
  • 第二章 數(shù)值方法16-37
  • 2.1 引言16
  • 2.2 控制方程16-18
  • 2.3 空間離散18-23
  • 2.3.1 基于非結(jié)構(gòu)網(wǎng)格的有限體積方法18-19
  • 2.3.2 對(duì)流通量離散19-23
  • 2.3.3 粘性通量離散23
  • 2.4 時(shí)間離散23-29
  • 2.4.1 Runge-Kutta方法23-26
  • 2.4.2 LU-SGS方法26-28
  • 2.4.3 雙時(shí)間步長(zhǎng)方法28-29
  • 2.5 湍流模型29-33
  • 2.5.1 Spalart-Allmaras一方程模型29-31
  • 2.5.2 基于KD-Tree的物面距計(jì)算方法31-33
  • 2.6 邊界條件33-34
  • 2.7 數(shù)值方法驗(yàn)證34-36
  • 2.7.1 RAE2822跨音速翼型算例34-35
  • 2.7.2 KD-Tree與直接計(jì)算方法對(duì)比35-36
  • 2.8 本章小結(jié)36-37
  • 第三章 GPU并行加速37-65
  • 3.1 GPU基本介紹37-48
  • 3.1.1 GPU硬件模型38-41
  • 3.1.2 GPU執(zhí)行模型41-44
  • 3.1.3 GPU存儲(chǔ)器模型44-46
  • 3.1.4 GPU軟件模型46-48
  • 3.2 求解器設(shè)計(jì)48-57
  • 3.2.1 流程分析及相關(guān)定義48-52
  • 3.2.2 格點(diǎn)格式的實(shí)現(xiàn)難點(diǎn)52-53
  • 3.2.3 GPU求解器實(shí)現(xiàn)方案53-57
  • 3.2.4 邊界條件及規(guī)約57
  • 3.3 性能優(yōu)化57-64
  • 3.3.1 硬件利用率57-58
  • 3.3.2 內(nèi)存58-63
  • 3.3.3 指令63-64
  • 3.4 本章小結(jié)64-65
  • 第四章 算例分析及性能評(píng)估65-82
  • 4.1 ONERA M6機(jī)翼算例65-67
  • 4.2 DLR-F6翼身組合體算例67-72
  • 4.3 二維圓柱卡門(mén)渦街算例72-73
  • 4.4 高雷諾數(shù)圓柱DES數(shù)值模擬73-76
  • 4.5 性能評(píng)估76-81
  • 4.5.1 Kernel設(shè)計(jì)方案對(duì)比77
  • 4.5.2 不同優(yōu)化方法效果分析77-79
  • 4.5.3 不同網(wǎng)格總加速性能分析79-80
  • 4.5.4 Runge-Kutta和LU-SGS對(duì)比80
  • 4.5.5 GPU與CPU實(shí)現(xiàn)的能量性?xún)r(jià)比80-81
  • 4.6 本章小結(jié)81-82
  • 第五章 總結(jié)與展望82-84
  • 5.1 總結(jié)82
  • 5.2 本文創(chuàng)新點(diǎn)82-83
  • 5.3 展望83-84
  • 參考文獻(xiàn)84-89
  • 致謝89-90
  • 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文90

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條

1 鞠鵬飛;寧方飛;;GPU平臺(tái)上的葉輪機(jī)械CFD加速計(jì)算[J];航空動(dòng)力學(xué)報(bào);2014年05期

2 劉楓;李樺;田正雨;潘沙;;基于MPI+CUDA的異構(gòu)并行可壓縮流求解器[J];國(guó)防科技大學(xué)學(xué)報(bào);2014年01期

3 董廷星;李新亮;李森;遲學(xué)斌;;GPU上計(jì)算流體力學(xué)的加速[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年01期


  本文關(guān)鍵詞:基于非結(jié)構(gòu)網(wǎng)格的可壓縮粘性流動(dòng)數(shù)值方法的GPU實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。



本文編號(hào):307239

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/307239.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f0e94***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com