眾核加速器的緩存管理
發(fā)布時(shí)間:2022-01-02 21:58
為了延續(xù)摩爾定律,半導(dǎo)體產(chǎn)業(yè)開始向高效能的異構(gòu)芯片或系統(tǒng)的方向發(fā)展。以GPU為代表的眾核加速器得到廣泛應(yīng)用,并且開始集成到通用微處理器中。GPU采用SIMT執(zhí)行模型,對(duì)于很多訪存模式規(guī)則的應(yīng)用程序,GPU能夠通過大規(guī)模多線程來隱藏訪存延遲。為了支持更多不規(guī)則訪存模式的應(yīng)用程序,片上緩存層次結(jié)構(gòu)被加入到GPU體系結(jié)構(gòu)中,來捕捉時(shí)間和空間局部性,從而緩解不規(guī)則訪問對(duì)系統(tǒng)性能的不利影響。然而,GPU緩存的效率不高,制約了系統(tǒng)的性能和效能。GPU緩存低效的主要原因是其管理策略同面向吞吐率的執(zhí)行模型不相適應(yīng)。GPU生成的大量訪存請(qǐng)求引起了緩存沖突和資源擁塞,F(xiàn)有的CPU緩存管理策略是針對(duì)多核系統(tǒng)設(shè)計(jì)的,直接應(yīng)用到GPU中效果并不好。這主要是因?yàn)镃PU緩存管理策略無法有效控制工作集和其它資源使用情況。不僅如此,當(dāng)大規(guī)模并行受限于片上資源時(shí),計(jì)算部件長(zhǎng)時(shí)間處于等待數(shù)據(jù)的狀態(tài),系統(tǒng)效能也會(huì)因此降低。為了盡可能地減少訪存延遲和帶寬需求,程序員往往需要對(duì)GPU代碼進(jìn)行復(fù)雜而繁瑣的優(yōu)化,這在很大程度上增加了程序員的負(fù)擔(dān)。為了解決上述問題,本文提出針對(duì)GPGPU的執(zhí)行模式定制其片上緩存管理策略。對(duì)線程束調(diào)度和...
【文章來源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:148 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
符號(hào)使用說明
第一章 引言
1.1 研究動(dòng)機(jī)
1.2 研究?jī)?nèi)容
1.2.1 緩存替換和旁路
1.2.2 線程調(diào)節(jié)
1.2.3 功耗控制
1.3 本文主要貢獻(xiàn)
1.4 本文結(jié)構(gòu)
第二章 研究背景
2.1 眾核加速器
2.2 GPU架構(gòu)
2.2.1 線程調(diào)度
2.2.2 流水線微體系結(jié)構(gòu)
2.2.3 GPU存儲(chǔ)層次
2.2.4 實(shí)驗(yàn)方法
2.3 編程模型和應(yīng)用
2.3.1 GPU編程模型
2.3.2 高級(jí)編程語言和編譯支持
2.3.3 GPU應(yīng)用
2.4 本章小節(jié)
第三章 相關(guān)研究工作
3.1 替換和旁路策略
3.2 線程調(diào)節(jié)
3.3 功耗控制
3.4 其它緩存管理策略
第四章 自適應(yīng)替換和旁路策略
4.1 緩存屬性和行為分析
4.2 緩存沖突特征化
4.3 CPU緩存管理策略的局限性
4.3.1 緩存替換策略
4.3.2 緩存旁路策略
4.3.3 LLC管理策略
4.4 自適應(yīng)保護(hù)策略
4.5 本章小節(jié)
第五章 協(xié)同旁路與線程束調(diào)節(jié)
5.1 線程束調(diào)節(jié)的性能潛力
5.2 面向吞吐率的自適應(yīng)資源管理
5.2.1 訪存模式監(jiān)測(cè)
5.2.2 最優(yōu)并發(fā)度預(yù)測(cè)
5.2.3 硬件開銷和復(fù)雜度
5.3 實(shí)驗(yàn)結(jié)果
5.3.1 對(duì)比純旁路策略
5.3.2 對(duì)比其它緩存管理策略
5.3.3 緩存容量敏感性分析
5.3.4 MSHR敏感性分析
5.4 本章小節(jié)
第六章 緩存感知的功耗優(yōu)化
6.1 活躍核調(diào)節(jié)
6.2 DVFS調(diào)節(jié)
6.3 資源監(jiān)控與功耗控制
6.4 本章小結(jié)
第七章 總結(jié)
7.1 本文的主要貢獻(xiàn)
7.2 未來工作
7.3 結(jié)束語
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
附錄A DVFS對(duì)系統(tǒng)平均功耗的影響
附錄B 訪存暫停比例
本文編號(hào):3564950
【文章來源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:148 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
符號(hào)使用說明
第一章 引言
1.1 研究動(dòng)機(jī)
1.2 研究?jī)?nèi)容
1.2.1 緩存替換和旁路
1.2.2 線程調(diào)節(jié)
1.2.3 功耗控制
1.3 本文主要貢獻(xiàn)
1.4 本文結(jié)構(gòu)
第二章 研究背景
2.1 眾核加速器
2.2 GPU架構(gòu)
2.2.1 線程調(diào)度
2.2.2 流水線微體系結(jié)構(gòu)
2.2.3 GPU存儲(chǔ)層次
2.2.4 實(shí)驗(yàn)方法
2.3 編程模型和應(yīng)用
2.3.1 GPU編程模型
2.3.2 高級(jí)編程語言和編譯支持
2.3.3 GPU應(yīng)用
2.4 本章小節(jié)
第三章 相關(guān)研究工作
3.1 替換和旁路策略
3.2 線程調(diào)節(jié)
3.3 功耗控制
3.4 其它緩存管理策略
第四章 自適應(yīng)替換和旁路策略
4.1 緩存屬性和行為分析
4.2 緩存沖突特征化
4.3 CPU緩存管理策略的局限性
4.3.1 緩存替換策略
4.3.2 緩存旁路策略
4.3.3 LLC管理策略
4.4 自適應(yīng)保護(hù)策略
4.5 本章小節(jié)
第五章 協(xié)同旁路與線程束調(diào)節(jié)
5.1 線程束調(diào)節(jié)的性能潛力
5.2 面向吞吐率的自適應(yīng)資源管理
5.2.1 訪存模式監(jiān)測(cè)
5.2.2 最優(yōu)并發(fā)度預(yù)測(cè)
5.2.3 硬件開銷和復(fù)雜度
5.3 實(shí)驗(yàn)結(jié)果
5.3.1 對(duì)比純旁路策略
5.3.2 對(duì)比其它緩存管理策略
5.3.3 緩存容量敏感性分析
5.3.4 MSHR敏感性分析
5.4 本章小節(jié)
第六章 緩存感知的功耗優(yōu)化
6.1 活躍核調(diào)節(jié)
6.2 DVFS調(diào)節(jié)
6.3 資源監(jiān)控與功耗控制
6.4 本章小結(jié)
第七章 總結(jié)
7.1 本文的主要貢獻(xiàn)
7.2 未來工作
7.3 結(jié)束語
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
附錄A DVFS對(duì)系統(tǒng)平均功耗的影響
附錄B 訪存暫停比例
本文編號(hào):3564950
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3564950.html
最近更新
教材專著