基于重用距離的GPU緩存缺失分析模型的設(shè)計與驗證
發(fā)布時間:2017-04-09 16:19
本文關(guān)鍵詞:基于重用距離的GPU緩存缺失分析模型的設(shè)計與驗證,,由筆耕文化傳播整理發(fā)布。
【摘要】:近十年來,GPU從專用圖形處理器逐漸發(fā)展成通用計算平臺,憑借其強大的并行計算能力和功耗控制能力,GPU通用計算在科學計算領(lǐng)域得到了廣泛的應用和關(guān)注。由于GPU芯片將大部分面積都分配給計算單元,僅分配少量芯片面積給緩存和控制單元,大量GPU應用程序的性能受限于GPU的訪存速度,而非計算能力。對于GPU訪存限制型應用程序,緩存使用效率對程序整體性能影響顯著,優(yōu)化緩存使用效率以提高整體性能是一種重要的手段。為了幫助程序開發(fā)者理解GPU緩存行為特征,選擇恰當?shù)木彺鎯?yōu)化方法,準確性高、速度快、功能全的GPU緩存缺失分析工具就顯得的尤為重要。本文根據(jù)GPU并行計算平臺的特點,優(yōu)化了重用距離算法在GPU平臺的精度和速度,并設(shè)計了基于重用距離的GPU緩存缺失分析模型。具體地,根據(jù)GPU緩存微結(jié)構(gòu)特征,修正重用距離算法中核心數(shù)據(jù)的更新時間,修正線程阻塞信息的使用機制,提升了GPU平臺下重用距離算法精度。然后,根據(jù)GPU線程維度設(shè)置,將重用距離計算劃分為多個子任務并行完成;合并訪存記錄以節(jié)省存儲空間;根據(jù)訪存總數(shù)量改變訪存序列采樣標準;提升GPU平臺下重用距離算法速度。最后,基于重用距離理論,建立GPU緩存缺失分析模型,分析GPU應用程序的緩存行為特征。除了實現(xiàn)傳統(tǒng)的緩存缺失類型分析,還提出緩存容量敏感性分析,預測在緩存容量發(fā)生變化時,缺失率將如何改變;以及,指令級緩存缺失分析,將GPU程序的緩存缺失定位到具體的訪存指令。經(jīng)過在PolyBench/GPU和Parboil兩個GPU測試集上的驗證實驗,優(yōu)化后,本文設(shè)計的GPU平臺重用距離算法的平均誤差由13.6%降至5.74%,重用距離計算的平均時間開銷由7749ms降低到1297ms。此外,為了檢驗模型的實用性,將其運用于具體的GPU應用程序緩存缺失行為特征的分析中,并根據(jù)模型的分析結(jié)果,針對性地設(shè)計緩存性能優(yōu)化方案,根據(jù)實驗結(jié)果,優(yōu)化后各GPU應用程序緩存缺失率和執(zhí)行時間均明顯下降,驗證了本文設(shè)計的GPU緩存缺失分析模型的實用性。
【關(guān)鍵詞】:GPU 緩存 重用距離 缺失分析
【學位授予單位】:東南大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP332
【目錄】:
- 摘要5-6
- Abstract6-10
- 專用術(shù)語注釋表10-11
- 第一章 緒論11-17
- 1.1 研究背景與意義11-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-14
- 1.3 論文的研究目標和主要工作14-15
- 1.4 論文組織結(jié)構(gòu)15-17
- 第二章 GPU緩存效率優(yōu)化與緩存缺失分析17-27
- 2.1 緩存的硬件結(jié)構(gòu)17-20
- 2.1.1 緩存的基礎(chǔ)知識17-18
- 2.1.2 GPU體系結(jié)構(gòu)中的緩存18-19
- 2.1.3 不同GPU微架構(gòu)下的緩存微結(jié)構(gòu)比較19-20
- 2.2 GPU緩存效率的軟件優(yōu)化20-22
- 2.2.1 GPU應用程序緩存效率低下的常見原因20-21
- 2.2.2 GPU緩存效率的軟件優(yōu)化方法21
- 2.2.3 GPU緩存缺失行為分析的重要性21-22
- 2.3 基于重用距離的緩存缺失分析22-25
- 2.3.1 經(jīng)典的重用距離算法22-23
- 2.3.2 基于經(jīng)典重用距離算法的緩存缺失分析23-24
- 2.3.3 GPU平臺重用距離算法與緩存缺失分析的難點24-25
- 2.4 本章小結(jié)25-27
- 第三章 GPU平臺重用距離算法優(yōu)化27-39
- 3.1 Nugteren等人提出的GPU平臺重用距離算法27-31
- 3.1.1 線程分組27-28
- 3.1.2 訪存合并28-29
- 3.1.3 訪存排序29-30
- 3.1.4 重用距離計算30-31
- 3.2 GPU平臺重用距離算法的精度優(yōu)化31-34
- 3.2.1 根據(jù)緩存行分配策略修正核心數(shù)據(jù)更新時間32-33
- 3.2.2 線程阻塞條件修正33-34
- 3.3 GPU平臺重用距離算法的速度優(yōu)化34-37
- 3.3.1 重用距離計算并行化34-35
- 3.3.2 訪存序列采樣與存儲優(yōu)化35-37
- 3.4 本章小結(jié)37-39
- 第四章 GPU緩存缺失分析模型的設(shè)計39-47
- 4.1 緩存模型的整體框架39-40
- 4.2 訪存序列生成模塊的設(shè)計40-42
- 4.2.1 序列生成器的設(shè)計41
- 4.2.2 訪存序列生成模塊的編譯系統(tǒng)41-42
- 4.3 重用距離計算模塊設(shè)計42
- 4.3.1 架構(gòu)普適性設(shè)計42
- 4.4 緩存行為分析模塊設(shè)計42-45
- 4.4.1 緩存缺失類型分析43-44
- 4.4.2 程序緩存容量敏感性分析44
- 4.4.3 指令級緩存缺失分析44-45
- 4.5 本章小結(jié)45-47
- 第五章 GPU緩存缺失分析模型的實驗驗證47-61
- 5.1 實驗環(huán)境47-48
- 5.2 測試程序集的選擇48-51
- 5.2.1 運算訪存比評測49-50
- 5.2.2 內(nèi)存印跡評測50-51
- 5.2.3 緩存缺失率評測51
- 5.3 GPU緩存缺失分析模型的精度驗證51-54
- 5.3.1 實驗設(shè)計51-52
- 5.3.2 實驗結(jié)果與分析52-54
- 5.4 重用距離計算速度驗證54-57
- 5.4.1 實驗設(shè)計54-55
- 5.4.2 實驗結(jié)果與分析55-57
- 5.5 GPU緩存分析模型的架構(gòu)普適性驗證57-59
- 5.5.1 實驗設(shè)計57
- 5.5.2 實驗結(jié)果與分析57-59
- 5.6 本章小結(jié)59-61
- 第六章 案例分析61-67
- 6.1 使用GPU緩存缺失分析模型的流程61-62
- 6.2 bfs:強制型缺失嚴重程序的分析與優(yōu)化62-63
- 6.3 gesummv:緩存容量敏感型程序的分析與優(yōu)化63-64
- 6.4 atax:指令級缺失顯著程序的分析與優(yōu)化64-66
- 6.5 本章小結(jié)66-67
- 第七章 總結(jié)與展望67-69
- 7.1 總結(jié)67
- 7.2 展望67-69
- 致謝69-71
- 參考文獻71-73
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 王曦;;網(wǎng)絡環(huán)境下高職圖書館服務體系缺失分析[J];內(nèi)江科技;2013年12期
2 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 彭園園;孟巖;姚鳳霞;韓娟娟;黃尚志;;中國人DMD基因缺失檢測多重PCR新體系的建立[A];第八次全國醫(yī)學遺傳學學術(shù)會議(中華醫(yī)學會2009年醫(yī)學遺傳學年會)論文摘要匯編[C];2009年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 張亞;基于重用距離的GPU緩存缺失分析模型的設(shè)計與驗證[D];東南大學;2016年
本文關(guān)鍵詞:基于重用距離的GPU緩存缺失分析模型的設(shè)計與驗證,由筆耕文化傳播整理發(fā)布。
本文編號:295653
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/295653.html
最近更新
教材專著