面向存儲(chǔ)層次設(shè)計(jì)優(yōu)化的GPU程序性能分析
本文選題:異構(gòu)系統(tǒng) + 圖形處理器; 參考:《計(jì)算機(jī)科學(xué)》2017年12期
【摘要】:圖形處理器憑借著比傳統(tǒng)CPU更高的峰值性能和能效,以及日漸成熟的軟件環(huán)境,逐漸成為構(gòu)建異構(gòu)并行系統(tǒng)的最流行的加速器之一。雖然GPU依靠輕量級線程的靈活切換來隱藏訪存延遲,但其超高的并發(fā)度仍然給存儲(chǔ)系統(tǒng)帶來了很大壓力,其性能的有效發(fā)揮受訪存效率的強(qiáng)烈影響。因此GPU程序的訪存行為分析及優(yōu)化一直是GPU相關(guān)領(lǐng)域的研究熱點(diǎn),但很少有工作從體系結(jié)構(gòu)的角度分析存儲(chǔ)層次的設(shè)計(jì)對性能的影響。為了更好地指導(dǎo)GPU存儲(chǔ)層次的設(shè)計(jì)和訪存優(yōu)化,從實(shí)驗(yàn)的角度詳細(xì)地分析了GPU各存儲(chǔ)層次對程序性能的影響,并總結(jié)出若干指導(dǎo)性的優(yōu)化策略,為未來類似體系結(jié)構(gòu)的存儲(chǔ)層次設(shè)計(jì)和程序優(yōu)化提供建議。
[Abstract]:Graphics processor (GPU) has become one of the most popular accelerators for building heterogeneous parallel systems because of its higher peak performance and energy efficiency than traditional CPU and the increasingly mature software environment. Although GPU relies on the flexible switching of lightweight threads to hide the memory access delay, its high degree of concurrency still brings great pressure to the storage system, and its performance exerts a strong influence on the efficiency of the visited memory. Therefore, the analysis and optimization of memory access behavior of GPU programs has been a hot topic in GPU related fields, but there is little work to analyze the impact of storage hierarchy design on performance from the perspective of architecture. In order to better guide the design of GPU storage hierarchy and memory access optimization, the effects of GPU storage levels on program performance are analyzed in detail from the point of view of experiments, and some guiding optimization strategies are summarized. Provide suggestions for storage hierarchy design and program optimization of similar architectures in the future.
【作者單位】: 國防科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國家自然科學(xué)基金(61402488) 教育部博士點(diǎn)基金(20134307120035)資助
【分類號(hào)】:TP332
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 白振興,何華燦,魏寶剛;智能IC卡的分類與標(biāo)準(zhǔn)及技術(shù)性能分析[J];現(xiàn)代電子技術(shù);1997年02期
2 ;圖形處理器加速移動(dòng)產(chǎn)品設(shè)計(jì)[J];電子產(chǎn)品世界;2001年07期
3 ;NVIDIA GeForce FX被評為2002年最佳圖形處理器[J];CAD/CAM與制造業(yè)信息化;2003年Z1期
4 李海燕;張春元;李禮;任巨;;圖形處理器的流執(zhí)行模型[J];計(jì)算機(jī)工程;2008年22期
5 肖靈芝;蒲林;韓俊剛;李濤;;異構(gòu)多核圖形處理器存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];電子技術(shù)應(yīng)用;2013年05期
6 吳亮;鐘誠文;鄭彥奎;劉沙;卓叢山;陳效鵬;;多圖形處理器上Lattice-Boltzmann方法的加速[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2010年11期
7 鐘聯(lián)波;;GPU與CPU的比較分析[J];技術(shù)與市場;2009年09期
8 明月;圖形精靈Paint Shop Pro for Wn95——介紹圖形處理器Paint Shop Pro4.1[J];電腦;1998年02期
9 張健;陳瑞;;圖形處理器在通用計(jì)算中的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年14期
10 ;全新Mac Pro開始發(fā)售[J];影視制作;2014年01期
相關(guān)重要報(bào)紙文章 前10條
1 《網(wǎng)絡(luò)世界》記者 蒙克;福祿克推出應(yīng)用性能分析解決方案[N];網(wǎng)絡(luò)世界;2013年
2 嚴(yán)威川;明明白白顯卡“芯”[N];中國電腦教育報(bào);2007年
3 ;NEC圖形處理器每秒運(yùn)行50.2G條指令[N];計(jì)算機(jī)世界;2003年
4 均兒;人人都有臺(tái)超級計(jì)算機(jī)[N];電腦報(bào);2008年
5 小鄒;服務(wù)器進(jìn)入異構(gòu)并行時(shí)代[N];電腦報(bào);2010年
6 趙欣;“玩”3D,筆記本也行![N];中國計(jì)算機(jī)報(bào);2003年
7 ;HP Compaq Evo D210教育信息化的好幫手[N];中國計(jì)算機(jī)報(bào);2003年
8 記者 郇公弟;顯卡革命:或讓最快CPU望塵莫及[N];新華每日電訊;2009年
9 樂天 編譯;混合CPU更節(jié)能[N];計(jì)算機(jī)世界;2009年
10 本報(bào)記者 李奕;有多少企業(yè)需要HPC?[N];中國計(jì)算機(jī)報(bào);2013年
相關(guān)博士學(xué)位論文 前5條
1 祖淵;基于圖形處理器的高速并行算法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
2 柴俊;面向應(yīng)用的加速器增強(qiáng)型異構(gòu)系統(tǒng)大規(guī)模并行計(jì)算關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
3 吳強(qiáng);面向異構(gòu)系統(tǒng)的并行編程關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
4 劉軍;動(dòng)態(tài)異構(gòu)虛擬盤陣及其關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年
5 馮權(quán)友;大規(guī)模眾核微處理器互連網(wǎng)絡(luò)體系結(jié)構(gòu)及性能分析研究[D];國防科學(xué)技術(shù)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 李豪;面向OpenFOAM并行開發(fā)框架的性能分析關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
2 徐蔚;基于圖形處理器的窗口系統(tǒng)的研究[D];西安工程大學(xué);2015年
3 劉伍鋒;基于PCI總線的主設(shè)備功能仿真與驗(yàn)證[D];西安電子科技大學(xué);2016年
4 李天驥;圖形處理器存儲(chǔ)系統(tǒng)的高精度System Verilog模型與自動(dòng)化仿真驗(yàn)證[D];西安電子科技大學(xué);2016年
5 陳貴華;基于RDMA高性能通信庫的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2015年
6 闕恒;嵌入式圖形處理器設(shè)計(jì)[D];南京航空航天大學(xué);2007年
7 周國建;龍芯嵌入式系統(tǒng)的性能分析與優(yōu)化研究[D];中國石油大學(xué);2008年
8 王皓;基于圖形處理器的數(shù)據(jù)流并行處理方法研究[D];大連理工大學(xué);2009年
9 蘭王靖輝;一種針對異構(gòu)多核平臺(tái)的系統(tǒng)架構(gòu)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
10 成思遠(yuǎn);異構(gòu)(CPU-GPU)計(jì)算機(jī)系統(tǒng)性能評測與優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
,本文編號(hào):1909841
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1909841.html