一種軟硬結(jié)合的預(yù)取技術(shù)研究
發(fā)布時間:2021-04-28 09:45
“存儲墻”問題一直是影響計算機(jī)效能的挑戰(zhàn)性問題。隨著技術(shù)的發(fā)展,處理器和存儲器的速度差異不斷的增大,同時多核技術(shù)使得存儲瓶頸更加嚴(yán)重。針對Cache失效中的強(qiáng)制性失效和容量失效,傳統(tǒng)的硬件預(yù)取或軟件預(yù)取都不能很好的改善性能,因?yàn)橛布A(yù)取只是基于程序的歷史信息來預(yù)測程序未來的行為,導(dǎo)致了預(yù)取過于盲目;而軟件預(yù)取需要增加大量額外的預(yù)取指令,造成了預(yù)取性能不佳。軟硬件結(jié)合的預(yù)取技術(shù)可以很好的結(jié)合軟件預(yù)取和硬件預(yù)取的優(yōu)點(diǎn),但仍處于研究階段。本文對軟硬件結(jié)合的數(shù)據(jù)預(yù)取技術(shù)展開了深入研究,提出了編譯指導(dǎo)的基于訪存預(yù)取表的預(yù)取技術(shù)。為了更好地利用編譯信息來指導(dǎo)預(yù)取,本文提出了一套可視化的Cache訪問特性分析方法來研究Cache的行為規(guī)律。使用該方法對實(shí)驗(yàn)數(shù)據(jù)分析表明:對大數(shù)組線性訪問是造成Cache失效的一個關(guān)鍵因素。為了提高Cache性能,文中采用了增量式的研究思路,提出了基于預(yù)取觸發(fā)地址的訪存預(yù)測表預(yù)取技術(shù),將編譯時的訪存模式信息編碼到訪存指令中來指導(dǎo)預(yù)取的進(jìn)行。該技術(shù)有效避免了傳統(tǒng)順序預(yù)取方法預(yù)取效率低的問題,可以有效的降低Cache失效率。同時,提出了將Evict Me和編譯指導(dǎo)的訪存預(yù)測...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 研究現(xiàn)狀
1.3 本文工作
1.4 論文結(jié)構(gòu)
第二章 相關(guān)研究工作
2.1 基本概念
2.1.1 局部性原理
2.1.2 層次存儲結(jié)構(gòu)的基本概念
2.1.3 訪存模式
2.2 相關(guān)工作
2.2.1 預(yù)取技術(shù)
2.2.2 軟件管理的Cache技術(shù)
2.2.3 編譯器優(yōu)化技術(shù)
2.3 小結(jié)
第三章 對 Cache失效問題的研究
3.1 現(xiàn)狀及意義
3.2 NPB的Cache行為分析
3.2.1 可視化的分析方法
3.2.2 分析與統(tǒng)計
3.3 小結(jié)
第四章 軟硬件結(jié)合的預(yù)取技術(shù)研究
4.1 編譯指導(dǎo)的失效時預(yù)取
4.1.1 基本思想
4.1.2 編譯指導(dǎo)的失效時預(yù)取
4.1.3 設(shè)置預(yù)取標(biāo)志位的編譯算法框架
4.2 編譯指導(dǎo)的基于訪存預(yù)測表的預(yù)取技術(shù)
4.2.1 基本思想
4.2.2 對RPT技術(shù)的改進(jìn)
4.2.3 編譯指導(dǎo)的RPT技術(shù)
4.2.4 設(shè)置預(yù)取標(biāo)志位的編譯算法框架
4.3 編譯指導(dǎo)的基于訪存預(yù)測表的預(yù)取+編譯指導(dǎo)的替換策略
4.3.1 基本思想
4.3.2 實(shí)現(xiàn)
4.3.3 設(shè)置替換標(biāo)志位的編譯算法框架
4.4 小結(jié)
第五章 性能評測
5.1 測試環(huán)境
5.1.1 模擬器
5.1.2 Benchmark
5.2 測試方案
5.3 實(shí)驗(yàn)結(jié)果分析
5.3.1 編譯指導(dǎo)的失效時預(yù)取技術(shù)性能分析
5.3.2 編譯指導(dǎo)的基于訪存預(yù)測表的預(yù)取技術(shù)性能分析
5.3.3 編譯指導(dǎo)替換策略和預(yù)取的基于訪存預(yù)測表的預(yù)取技術(shù)性能分析
5.4 小結(jié)
第六章 結(jié)束語
6.1 主要工作
6.2 未來展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的學(xué)術(shù)成果
攻讀碩士學(xué)位期間參加的科研工作
【參考文獻(xiàn)】:
期刊論文
[1]一個由編譯器控制的Cache替換策略[J]. 杜紅燕,田興彥,田新華. 計算機(jī)工程. 2006(08)
[2]一種新穎的軟件可控Cache優(yōu)化方法[J]. 杜紅燕,田興彥,田新華. 計算機(jī)工程與應(yīng)用. 2005(21)
本文編號:3165259
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 研究現(xiàn)狀
1.3 本文工作
1.4 論文結(jié)構(gòu)
第二章 相關(guān)研究工作
2.1 基本概念
2.1.1 局部性原理
2.1.2 層次存儲結(jié)構(gòu)的基本概念
2.1.3 訪存模式
2.2 相關(guān)工作
2.2.1 預(yù)取技術(shù)
2.2.2 軟件管理的Cache技術(shù)
2.2.3 編譯器優(yōu)化技術(shù)
2.3 小結(jié)
第三章 對 Cache失效問題的研究
3.1 現(xiàn)狀及意義
3.2 NPB的Cache行為分析
3.2.1 可視化的分析方法
3.2.2 分析與統(tǒng)計
3.3 小結(jié)
第四章 軟硬件結(jié)合的預(yù)取技術(shù)研究
4.1 編譯指導(dǎo)的失效時預(yù)取
4.1.1 基本思想
4.1.2 編譯指導(dǎo)的失效時預(yù)取
4.1.3 設(shè)置預(yù)取標(biāo)志位的編譯算法框架
4.2 編譯指導(dǎo)的基于訪存預(yù)測表的預(yù)取技術(shù)
4.2.1 基本思想
4.2.2 對RPT技術(shù)的改進(jìn)
4.2.3 編譯指導(dǎo)的RPT技術(shù)
4.2.4 設(shè)置預(yù)取標(biāo)志位的編譯算法框架
4.3 編譯指導(dǎo)的基于訪存預(yù)測表的預(yù)取+編譯指導(dǎo)的替換策略
4.3.1 基本思想
4.3.2 實(shí)現(xiàn)
4.3.3 設(shè)置替換標(biāo)志位的編譯算法框架
4.4 小結(jié)
第五章 性能評測
5.1 測試環(huán)境
5.1.1 模擬器
5.1.2 Benchmark
5.2 測試方案
5.3 實(shí)驗(yàn)結(jié)果分析
5.3.1 編譯指導(dǎo)的失效時預(yù)取技術(shù)性能分析
5.3.2 編譯指導(dǎo)的基于訪存預(yù)測表的預(yù)取技術(shù)性能分析
5.3.3 編譯指導(dǎo)替換策略和預(yù)取的基于訪存預(yù)測表的預(yù)取技術(shù)性能分析
5.4 小結(jié)
第六章 結(jié)束語
6.1 主要工作
6.2 未來展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的學(xué)術(shù)成果
攻讀碩士學(xué)位期間參加的科研工作
【參考文獻(xiàn)】:
期刊論文
[1]一個由編譯器控制的Cache替換策略[J]. 杜紅燕,田興彥,田新華. 計算機(jī)工程. 2006(08)
[2]一種新穎的軟件可控Cache優(yōu)化方法[J]. 杜紅燕,田興彥,田新華. 計算機(jī)工程與應(yīng)用. 2005(21)
本文編號:3165259
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3165259.html
最近更新
教材專著