高性能低能耗GPGPU計算技術研究
發(fā)布時間:2024-02-18 01:01
高性能計算是科學和工程領域的關鍵基礎技術,致力于研究和開發(fā)高性能計算機相關的硬件體系結(jié)構(gòu)及軟件技術。高性能計算的技術被廣泛應用于各個領域如云計算、大數(shù)據(jù)處理及物聯(lián)網(wǎng)等以提高實驗規(guī)模和效率,推動各個領域取得突破性進展。世界超級計算機五百強等排名是各國高性能計算研究實力乃至于綜合國力的體現(xiàn)。高性能計算機系統(tǒng)可根據(jù)硬件分為同構(gòu)系統(tǒng)和異構(gòu)系統(tǒng),由CPU和GPU(Graphics Processing Unit)等不同種類處理器構(gòu)成的系統(tǒng)為異構(gòu)系統(tǒng),在性能和能效方面具備優(yōu)勢;贑PU和GPU異構(gòu)架構(gòu)的高性能計算技術稱為GPU高性能計算,是當前的一個熱門研究領域。本文以提高GPU高性能計算的能效和性能,拓展其應用為目標,從體系結(jié)構(gòu)研究、系統(tǒng)軟件研究和應用研究這三個層次上提出一些軟硬件新技術。本文的第一部分工作提出高能效的新GPU處理器架構(gòu)。近年來,GPU以其高并行度、高能效和高訪存帶寬的優(yōu)勢,被廣泛部署在超級計算機、數(shù)據(jù)中心及科研平臺上用于加速各種科學計算。大型計算機系統(tǒng)的高能耗一直是研究者們努力解決的問題。GPU處理器中負責處理指令的前端部件是處理器中較為耗能的部件之一。我們提出將GPU內(nèi)的多...
【文章頁數(shù)】:124 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
縮略語
第一章 緒論
1.1 GPU高性能計算簡介
1.1.1 GPU高性能計算研究分類
1.2 GPU高性能計算軟硬件平臺介紹
1.2.1 GPU硬件體系結(jié)構(gòu)
1.2.2 GPU編程模型及軟件開發(fā)平臺
1.3 研究內(nèi)容和創(chuàng)新點
1.4 國內(nèi)外研究現(xiàn)狀
1.4.1 高能效GPU新架構(gòu)研究
1.4.2 GPU上的不規(guī)則應用及負載均衡研究
1.4.3 GPU上的圖算法及圖處理系統(tǒng)研究
1.5 論文的組織和結(jié)構(gòu)
第二章 高能效GPU處理器架構(gòu)Buddy SM
2.1 研究背景及簡介
2.2 GPU前端介紹
2.2.1 前端的構(gòu)成
2.2.2 指令發(fā)射機制
2.3 Buddy SM架構(gòu)
2.3.1 架構(gòu)總覽
2.3.2 指令發(fā)射
2.3.3 統(tǒng)一線程塊分配
2.3.4 建立共享
2.3.5 解除共享
2.3.6 重建共享
2.3.7 共享群的通信
2.3.8 自適應共享群
2.4 實驗方法
2.4.1 模擬器配置
2.4.2 功率和面積的開銷
2.4.3 測試集
2.5 實驗結(jié)果和分析
2.5.1 共享時間百分比
2.5.2 重建共享策略的比較
2.5.3 自適應共享群方法的性能評估
2.5.4 Buddy SM的影響
2.5.5 性能比較
2.5.6 前端的節(jié)能
2.5.7 整個GPU的節(jié)能
2.6 本章小結(jié)
第三章 高性能GPU系統(tǒng)軟件CUIRRE
3.1 研究背景及簡介
3.2 不規(guī)則循環(huán)和線程級負載不均衡
3.2.1 不規(guī)則應用的特征化
3.2.2 GPU資源利用率
3.3 線程級負載均衡的任務池方法
3.3.1 任務池方法簡介
3.3.2 任務池方法的GPU實現(xiàn)
3.3.3 自適應負載因子方法
3.4 CUIRRE庫
3.4.1 負載均衡模塊
3.4.2 診斷模塊
3.4.3 特征化模塊
3.4.4 CUIRRE庫的應用
3.5 應用集
3.5.1 測試應用
3.5.2 真實應用
3.6 實驗方法
3.6.1 硬軟件配置
3.6.2 其它負載均衡方法
3.6.3 測試過程
3.6.4 性能指標
3.6.5 開銷測量
3.7 實驗結(jié)果及分析
3.7.1 應用的特征化
3.7.2 負載均衡方法性能比較
3.7.3 自適應負載因子方法的性能評估
3.8 本章小結(jié)
第四章 高性能GPU應用GGraph
4.1 研究背景及簡介
4.2 CPU和GPU異構(gòu)系統(tǒng)上的圖處理
4.2.1 圖算法
4.2.2 圖的表示
4.2.3 計算模型
4.2.4 磁盤的I/O特性
4.3 GGraph平臺的架構(gòu)
4.3.1 圖數(shù)據(jù)的存儲
4.3.2 讀寫模塊
4.3.3 分圖模塊
4.3.4 消息管理模塊
4.3.5 內(nèi)存管理模塊
4.4 實驗方法
4.4.1 圖算法
4.4.2 軟件和實驗配置
4.4.3 硬件平臺
4.4.4 測試圖數(shù)據(jù)集
4.4.5 性能指標
4.5 實驗結(jié)果及分析
4.5.1 自適應負載均衡方法的評測
4.5.2 可擴展性評測
4.5.3 所有平臺的性能比較
4.5.4 運行不同算法的性能比較
4.5.5 所有平臺的能效比較
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 后續(xù)研究方向
參考文獻
致謝
攻讀博士期間發(fā)表、錄用和完成的學術論文目錄
本文編號:3901621
【文章頁數(shù)】:124 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
縮略語
第一章 緒論
1.1 GPU高性能計算簡介
1.1.1 GPU高性能計算研究分類
1.2 GPU高性能計算軟硬件平臺介紹
1.2.1 GPU硬件體系結(jié)構(gòu)
1.2.2 GPU編程模型及軟件開發(fā)平臺
1.3 研究內(nèi)容和創(chuàng)新點
1.4 國內(nèi)外研究現(xiàn)狀
1.4.1 高能效GPU新架構(gòu)研究
1.4.2 GPU上的不規(guī)則應用及負載均衡研究
1.4.3 GPU上的圖算法及圖處理系統(tǒng)研究
1.5 論文的組織和結(jié)構(gòu)
第二章 高能效GPU處理器架構(gòu)Buddy SM
2.1 研究背景及簡介
2.2 GPU前端介紹
2.2.1 前端的構(gòu)成
2.2.2 指令發(fā)射機制
2.3 Buddy SM架構(gòu)
2.3.1 架構(gòu)總覽
2.3.2 指令發(fā)射
2.3.3 統(tǒng)一線程塊分配
2.3.4 建立共享
2.3.5 解除共享
2.3.6 重建共享
2.3.7 共享群的通信
2.3.8 自適應共享群
2.4 實驗方法
2.4.1 模擬器配置
2.4.2 功率和面積的開銷
2.4.3 測試集
2.5 實驗結(jié)果和分析
2.5.1 共享時間百分比
2.5.2 重建共享策略的比較
2.5.3 自適應共享群方法的性能評估
2.5.4 Buddy SM的影響
2.5.5 性能比較
2.5.6 前端的節(jié)能
2.5.7 整個GPU的節(jié)能
2.6 本章小結(jié)
第三章 高性能GPU系統(tǒng)軟件CUIRRE
3.1 研究背景及簡介
3.2 不規(guī)則循環(huán)和線程級負載不均衡
3.2.1 不規(guī)則應用的特征化
3.2.2 GPU資源利用率
3.3 線程級負載均衡的任務池方法
3.3.1 任務池方法簡介
3.3.2 任務池方法的GPU實現(xiàn)
3.3.3 自適應負載因子方法
3.4 CUIRRE庫
3.4.1 負載均衡模塊
3.4.2 診斷模塊
3.4.3 特征化模塊
3.4.4 CUIRRE庫的應用
3.5 應用集
3.5.1 測試應用
3.5.2 真實應用
3.6 實驗方法
3.6.1 硬軟件配置
3.6.2 其它負載均衡方法
3.6.3 測試過程
3.6.4 性能指標
3.6.5 開銷測量
3.7 實驗結(jié)果及分析
3.7.1 應用的特征化
3.7.2 負載均衡方法性能比較
3.7.3 自適應負載因子方法的性能評估
3.8 本章小結(jié)
第四章 高性能GPU應用GGraph
4.1 研究背景及簡介
4.2 CPU和GPU異構(gòu)系統(tǒng)上的圖處理
4.2.1 圖算法
4.2.2 圖的表示
4.2.3 計算模型
4.2.4 磁盤的I/O特性
4.3 GGraph平臺的架構(gòu)
4.3.1 圖數(shù)據(jù)的存儲
4.3.2 讀寫模塊
4.3.3 分圖模塊
4.3.4 消息管理模塊
4.3.5 內(nèi)存管理模塊
4.4 實驗方法
4.4.1 圖算法
4.4.2 軟件和實驗配置
4.4.3 硬件平臺
4.4.4 測試圖數(shù)據(jù)集
4.4.5 性能指標
4.5 實驗結(jié)果及分析
4.5.1 自適應負載均衡方法的評測
4.5.2 可擴展性評測
4.5.3 所有平臺的性能比較
4.5.4 運行不同算法的性能比較
4.5.5 所有平臺的能效比較
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 后續(xù)研究方向
參考文獻
致謝
攻讀博士期間發(fā)表、錄用和完成的學術論文目錄
本文編號:3901621
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3901621.html
最近更新
教材專著