天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

高性能低能耗GPGPU計算技術研究

發(fā)布時間:2024-02-18 01:01
  高性能計算是科學和工程領域的關鍵基礎技術,致力于研究和開發(fā)高性能計算機相關的硬件體系結(jié)構(gòu)及軟件技術。高性能計算的技術被廣泛應用于各個領域如云計算、大數(shù)據(jù)處理及物聯(lián)網(wǎng)等以提高實驗規(guī)模和效率,推動各個領域取得突破性進展。世界超級計算機五百強等排名是各國高性能計算研究實力乃至于綜合國力的體現(xiàn)。高性能計算機系統(tǒng)可根據(jù)硬件分為同構(gòu)系統(tǒng)和異構(gòu)系統(tǒng),由CPU和GPU(Graphics Processing Unit)等不同種類處理器構(gòu)成的系統(tǒng)為異構(gòu)系統(tǒng),在性能和能效方面具備優(yōu)勢;贑PU和GPU異構(gòu)架構(gòu)的高性能計算技術稱為GPU高性能計算,是當前的一個熱門研究領域。本文以提高GPU高性能計算的能效和性能,拓展其應用為目標,從體系結(jié)構(gòu)研究、系統(tǒng)軟件研究和應用研究這三個層次上提出一些軟硬件新技術。本文的第一部分工作提出高能效的新GPU處理器架構(gòu)。近年來,GPU以其高并行度、高能效和高訪存帶寬的優(yōu)勢,被廣泛部署在超級計算機、數(shù)據(jù)中心及科研平臺上用于加速各種科學計算。大型計算機系統(tǒng)的高能耗一直是研究者們努力解決的問題。GPU處理器中負責處理指令的前端部件是處理器中較為耗能的部件之一。我們提出將GPU內(nèi)的多...

【文章頁數(shù)】:124 頁

【學位級別】:博士

【文章目錄】:
摘要
ABSTRACT
縮略語
第一章 緒論
    1.1 GPU高性能計算簡介
        1.1.1 GPU高性能計算研究分類
    1.2 GPU高性能計算軟硬件平臺介紹
        1.2.1 GPU硬件體系結(jié)構(gòu)
        1.2.2 GPU編程模型及軟件開發(fā)平臺
    1.3 研究內(nèi)容和創(chuàng)新點
    1.4 國內(nèi)外研究現(xiàn)狀
        1.4.1 高能效GPU新架構(gòu)研究
        1.4.2 GPU上的不規(guī)則應用及負載均衡研究
        1.4.3 GPU上的圖算法及圖處理系統(tǒng)研究
    1.5 論文的組織和結(jié)構(gòu)
第二章 高能效GPU處理器架構(gòu)Buddy SM
    2.1 研究背景及簡介
    2.2 GPU前端介紹
        2.2.1 前端的構(gòu)成
        2.2.2 指令發(fā)射機制
    2.3 Buddy SM架構(gòu)
        2.3.1 架構(gòu)總覽
        2.3.2 指令發(fā)射
        2.3.3 統(tǒng)一線程塊分配
        2.3.4 建立共享
        2.3.5 解除共享
        2.3.6 重建共享
        2.3.7 共享群的通信
        2.3.8 自適應共享群
    2.4 實驗方法
        2.4.1 模擬器配置
        2.4.2 功率和面積的開銷
        2.4.3 測試集
    2.5 實驗結(jié)果和分析
        2.5.1 共享時間百分比
        2.5.2 重建共享策略的比較
        2.5.3 自適應共享群方法的性能評估
        2.5.4 Buddy SM的影響
        2.5.5 性能比較
        2.5.6 前端的節(jié)能
        2.5.7 整個GPU的節(jié)能
    2.6 本章小結(jié)
第三章 高性能GPU系統(tǒng)軟件CUIRRE
    3.1 研究背景及簡介
    3.2 不規(guī)則循環(huán)和線程級負載不均衡
        3.2.1 不規(guī)則應用的特征化
        3.2.2 GPU資源利用率
    3.3 線程級負載均衡的任務池方法
        3.3.1 任務池方法簡介
        3.3.2 任務池方法的GPU實現(xiàn)
        3.3.3 自適應負載因子方法
    3.4 CUIRRE庫
        3.4.1 負載均衡模塊
        3.4.2 診斷模塊
        3.4.3 特征化模塊
        3.4.4 CUIRRE庫的應用
    3.5 應用集
        3.5.1 測試應用
        3.5.2 真實應用
    3.6 實驗方法
        3.6.1 硬軟件配置
        3.6.2 其它負載均衡方法
        3.6.3 測試過程
        3.6.4 性能指標
        3.6.5 開銷測量
    3.7 實驗結(jié)果及分析
        3.7.1 應用的特征化
        3.7.2 負載均衡方法性能比較
        3.7.3 自適應負載因子方法的性能評估
    3.8 本章小結(jié)
第四章 高性能GPU應用GGraph
    4.1 研究背景及簡介
    4.2 CPU和GPU異構(gòu)系統(tǒng)上的圖處理
        4.2.1 圖算法
        4.2.2 圖的表示
        4.2.3 計算模型
        4.2.4 磁盤的I/O特性
    4.3 GGraph平臺的架構(gòu)
        4.3.1 圖數(shù)據(jù)的存儲
        4.3.2 讀寫模塊
        4.3.3 分圖模塊
        4.3.4 消息管理模塊
        4.3.5 內(nèi)存管理模塊
    4.4 實驗方法
        4.4.1 圖算法
        4.4.2 軟件和實驗配置
        4.4.3 硬件平臺
        4.4.4 測試圖數(shù)據(jù)集
        4.4.5 性能指標
    4.5 實驗結(jié)果及分析
        4.5.1 自適應負載均衡方法的評測
        4.5.2 可擴展性評測
        4.5.3 所有平臺的性能比較
        4.5.4 運行不同算法的性能比較
        4.5.5 所有平臺的能效比較
    4.6 本章小結(jié)
第五章 總結(jié)與展望
    5.1 本文工作總結(jié)
    5.2 后續(xù)研究方向
參考文獻
致謝
攻讀博士期間發(fā)表、錄用和完成的學術論文目錄



本文編號:3901621

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3901621.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b1418***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
丰满的人妻一区二区三区| 日本加勒比系列在线播放| 国产韩国日本精品视频| 一区二区三区日韩经典| 国产一级一片内射视频在线| 蜜桃av人妻精品一区二区三区| 暴力性生活在线免费视频| 欧美国产日韩变态另类在线看| 午夜精品在线观看视频午夜| 99热九九热这里只有精品| 国产性色精品福利在线观看| 高清不卡视频在线观看| 亚洲国产一区精品一区二区三区色| 在线视频三区日本精品| 欧美性高清一区二区三区视频| 国产高清一区二区白浆| 中文字幕日韩一区二区不卡| 五月天丁香婷婷一区二区| 欧美黑人在线一区二区| 国产福利一区二区三区四区| 成人日韩视频中文字幕| 香港国产三级久久精品三级| 一区二区三区在线不卡免费| 日韩国产亚洲欧美另类| 国产传媒高清视频在线| 少妇一区二区三区精品 | 日韩欧美91在线视频| 国产又爽又猛又粗又色对黄| 日本高清视频在线播放| 婷婷色网视频在线播放| 成人精品日韩专区在线观看| 久久人妻人人澡人人妻| 亚洲中文字幕视频一区二区| 粉嫩一区二区三区粉嫩视频| 在线精品首页中文字幕亚洲| 少妇高潮呻吟浪语91| 日本本亚洲三级在线播放| 91久久精品国产成人| 日本91在线观看视频| 精品人妻一区二区三区免费| 亚洲欧洲成人精品香蕉网|