天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

大規(guī)模CFD高效CPU/GPU異構(gòu)并行計(jì)算關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2025-05-20 06:40
  計(jì)算流體力學(xué)(Computational Fluid Dynamics,CFD)采用數(shù)值計(jì)算方法求解流動(dòng)控制方程以發(fā)現(xiàn)各種流動(dòng)現(xiàn)象和規(guī)律,已廣泛應(yīng)用于航空航天等領(lǐng)域。隨著數(shù)值模擬的幾何外形、物理模型日益復(fù)雜,流動(dòng)機(jī)理研究越來越精細(xì),CFD計(jì)算的規(guī)模和復(fù)雜度空前增長,迫切需要利用高性能計(jì)算機(jī)實(shí)現(xiàn)高效CFD并行計(jì)算以提升CFD應(yīng)用效率。近年來,隨著圖像處理器(Graphics Processing Unit,GPU)浮點(diǎn)運(yùn)算性能和可編程性的提升,采用CPU/GPU異構(gòu)體系結(jié)構(gòu)成為構(gòu)造高性能計(jì)算機(jī)系統(tǒng)的一種趨勢。盡管異構(gòu)體系結(jié)構(gòu)能夠在兼顧通用性和效能的同時(shí)大幅提升系統(tǒng)性能,但復(fù)雜的硬件架構(gòu)要求研究者綜合利用多種編程模型以挖掘多層次并行性,對高效CFD并行應(yīng)用開發(fā)帶來了極大的挑戰(zhàn)。本文面向CPU/GPU異構(gòu)體系結(jié)構(gòu)和典型CFD應(yīng)用,圍繞大規(guī)模、高效CFD異構(gòu)協(xié)同并行計(jì)算關(guān)鍵技術(shù)開展研究,重點(diǎn)研究了CFD應(yīng)用異構(gòu)協(xié)同并行編程框架、并行算法和性能優(yōu)化、負(fù)載均衡等問題。論文的工作包括:(1)針對多區(qū)塊結(jié)構(gòu)網(wǎng)格CFD計(jì)算的特點(diǎn),提出了適應(yīng)大型CPU/GPU異構(gòu)系統(tǒng)的TLCF三層異構(gòu)協(xié)同編程框架。綜合MP...

【文章頁數(shù)】:160 頁

【學(xué)位級別】:博士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景及意義
        1.1.1 CFD簡介
        1.1.2 CFD高性能計(jì)算的需求和挑戰(zhàn)
        1.1.3 CPU/GPU異構(gòu)計(jì)算系統(tǒng)帶來的機(jī)遇
        1.1.4 CFD異構(gòu)并行計(jì)算所遇到的挑戰(zhàn)
        1.1.5 研究意義
    1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
        1.2.1 CFD發(fā)展研究
        1.2.2 CPU/GPU異構(gòu)環(huán)境下CFD應(yīng)用映射和優(yōu)化研究
    1.3 研究內(nèi)容
        1.3.1 主要研究內(nèi)容及創(chuàng)新
        1.3.2 論文結(jié)構(gòu)
第二章 相關(guān)背景技術(shù)介紹
    2.1 空氣動(dòng)力學(xué)控制方程及離散格式
        2.1.1 傳統(tǒng)Navier-Stokes方程及離散格式
        2.1.2 格子Boltzmann方程及離散格式
    2.2 GPU體系結(jié)構(gòu)
        2.2.1 GPU體系結(jié)構(gòu)發(fā)展歷程
        2.2.2 當(dāng)前主流GPU體系結(jié)構(gòu)
    2.3 GPU編程語言發(fā)展及CUDA并行編程模型
        2.3.1 GPU編程語言發(fā)展
        2.3.2 CUDA并行編程模型
    2.4 小結(jié)
第三章 面向多區(qū)塊結(jié)構(gòu)網(wǎng)格CFD應(yīng)用的混合異構(gòu)協(xié)同編程框架
    3.1 異構(gòu)并行計(jì)算機(jī)體系結(jié)構(gòu)特點(diǎn)
    3.2 多區(qū)塊結(jié)構(gòu)網(wǎng)格CFD并行計(jì)算特點(diǎn)
    3.3 異構(gòu)并行計(jì)算協(xié)同編程框架
        3.3.1 三層混合異構(gòu)協(xié)同并行編程框架
        3.3.2 TLCF框架的實(shí)現(xiàn)
        3.3.3 異構(gòu)協(xié)同并行編程框架對CFD應(yīng)用的適用性
    3.4 小結(jié)
第四章 格子Boltzmann方程大規(guī)模高效異構(gòu)協(xié)同并行計(jì)算
    4.1 引言
    4.2 相關(guān)工作
    4.3 LBM在單GPU上的并行算法
        4.3.1 碰撞過程的GPU并行算法
        4.3.2 遷移過程的GPU并行算法
        4.3.3 邊界處理的GPU并行算法
    4.4 LBM在CPU/GPU異構(gòu)系統(tǒng)上的并行算法
        4.4.1 基本并行LBM-Base算法
        4.4.2 通信與計(jì)算重疊并行LBM-overlap算法
        4.4.3 CPU/GPU協(xié)同并行LBM-hybrid算法
    4.5 算法分析
        4.5.1 LBM在單GPU上并行算法分析與比較
        4.5.2 LBM在CPU/GPU異構(gòu)系統(tǒng)上并行算法分析與比較
    4.6 實(shí)驗(yàn)結(jié)果
        4.6.1 數(shù)值驗(yàn)證
        4.6.2 單GPU并行方法測試結(jié)果
        4.6.3 多GPU并行方法測試結(jié)果
    4.7 小結(jié)
第五章 高精度多區(qū)塊結(jié)構(gòu)網(wǎng)格Navier-Stokes方程高效異構(gòu)協(xié)同并行計(jì)算
    5.1 引言
    5.2 相關(guān)工作
        5.2.1 高階精度格式概況
        5.2.2 高階精度格式在異構(gòu)體系結(jié)構(gòu)上的應(yīng)用
        5.2.3 HOSTA程序
    5.3 Navier-Stokes方程在單GPU上并行算法
    5.4 Navier-Stokes方程的CPU/GPU協(xié)同并行算法
        5.4.1 協(xié)同并行算法的存儲(chǔ)優(yōu)化
        5.4.2 協(xié)同并行算法的通信優(yōu)化
    5.5 實(shí)現(xiàn)以及實(shí)驗(yàn)結(jié)果
        5.5.1 并行實(shí)現(xiàn)
        5.5.2 數(shù)值實(shí)驗(yàn)
        5.5.3 單GPU性能結(jié)果
        5.5.4 單計(jì)算節(jié)點(diǎn)性能結(jié)果
        5.5.5 多計(jì)算節(jié)點(diǎn)性能結(jié)果
    5.6 小結(jié)
第六章 異構(gòu)系統(tǒng)上CFD計(jì)算的負(fù)載均衡策略研究
    6.1 引言
    6.2 粗粒度負(fù)載均衡
        6.2.1 相關(guān)研究
        6.2.2 基于性能模型的靜態(tài)負(fù)載均衡
        6.2.3 基于預(yù)取的任務(wù)竊取動(dòng)態(tài)負(fù)載均衡
        6.2.4 實(shí)驗(yàn)結(jié)果
    6.3 細(xì)粒度負(fù)載均衡
        6.3.1 相關(guān)研究
        6.3.2 基于稀疏矩陣存儲(chǔ)格式的細(xì)粒度負(fù)載均衡
        6.3.3 實(shí)驗(yàn)結(jié)果
    6.4 小結(jié)
第七章 結(jié)論及展望
    7.1 工作總結(jié)
    7.2 研究展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
主要參研項(xiàng)目



本文編號:4047005

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4047005.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶86049***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com