天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

面向存儲(chǔ)層次設(shè)計(jì)優(yōu)化的GPU程序性能分析

發(fā)布時(shí)間:2018-05-19 10:58

  本文選題:異構(gòu)系統(tǒng) + 圖形處理器; 參考:《計(jì)算機(jī)科學(xué)》2017年12期


【摘要】:圖形處理器憑借著比傳統(tǒng)CPU更高的峰值性能和能效,以及日漸成熟的軟件環(huán)境,逐漸成為構(gòu)建異構(gòu)并行系統(tǒng)的最流行的加速器之一。雖然GPU依靠輕量級線程的靈活切換來隱藏訪存延遲,但其超高的并發(fā)度仍然給存儲(chǔ)系統(tǒng)帶來了很大壓力,其性能的有效發(fā)揮受訪存效率的強(qiáng)烈影響。因此GPU程序的訪存行為分析及優(yōu)化一直是GPU相關(guān)領(lǐng)域的研究熱點(diǎn),但很少有工作從體系結(jié)構(gòu)的角度分析存儲(chǔ)層次的設(shè)計(jì)對性能的影響。為了更好地指導(dǎo)GPU存儲(chǔ)層次的設(shè)計(jì)和訪存優(yōu)化,從實(shí)驗(yàn)的角度詳細(xì)地分析了GPU各存儲(chǔ)層次對程序性能的影響,并總結(jié)出若干指導(dǎo)性的優(yōu)化策略,為未來類似體系結(jié)構(gòu)的存儲(chǔ)層次設(shè)計(jì)和程序優(yōu)化提供建議。
[Abstract]:Graphics processor (GPU) has become one of the most popular accelerators for building heterogeneous parallel systems because of its higher peak performance and energy efficiency than traditional CPU and the increasingly mature software environment. Although GPU relies on the flexible switching of lightweight threads to hide the memory access delay, its high degree of concurrency still brings great pressure to the storage system, and its performance exerts a strong influence on the efficiency of the visited memory. Therefore, the analysis and optimization of memory access behavior of GPU programs has been a hot topic in GPU related fields, but there is little work to analyze the impact of storage hierarchy design on performance from the perspective of architecture. In order to better guide the design of GPU storage hierarchy and memory access optimization, the effects of GPU storage levels on program performance are analyzed in detail from the point of view of experiments, and some guiding optimization strategies are summarized. Provide suggestions for storage hierarchy design and program optimization of similar architectures in the future.
【作者單位】: 國防科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國家自然科學(xué)基金(61402488) 教育部博士點(diǎn)基金(20134307120035)資助
【分類號(hào)】:TP332

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 白振興,何華燦,魏寶剛;智能IC卡的分類與標(biāo)準(zhǔn)及技術(shù)性能分析[J];現(xiàn)代電子技術(shù);1997年02期

2 ;圖形處理器加速移動(dòng)產(chǎn)品設(shè)計(jì)[J];電子產(chǎn)品世界;2001年07期

3 ;NVIDIA GeForce FX被評為2002年最佳圖形處理器[J];CAD/CAM與制造業(yè)信息化;2003年Z1期

4 李海燕;張春元;李禮;任巨;;圖形處理器的流執(zhí)行模型[J];計(jì)算機(jī)工程;2008年22期

5 肖靈芝;蒲林;韓俊剛;李濤;;異構(gòu)多核圖形處理器存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];電子技術(shù)應(yīng)用;2013年05期

6 吳亮;鐘誠文;鄭彥奎;劉沙;卓叢山;陳效鵬;;多圖形處理器上Lattice-Boltzmann方法的加速[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2010年11期

7 鐘聯(lián)波;;GPU與CPU的比較分析[J];技術(shù)與市場;2009年09期

8 明月;圖形精靈Paint Shop Pro for Wn95——介紹圖形處理器Paint Shop Pro4.1[J];電腦;1998年02期

9 張健;陳瑞;;圖形處理器在通用計(jì)算中的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年14期

10 ;全新Mac Pro開始發(fā)售[J];影視制作;2014年01期

相關(guān)重要報(bào)紙文章 前10條

1 《網(wǎng)絡(luò)世界》記者 蒙克;福祿克推出應(yīng)用性能分析解決方案[N];網(wǎng)絡(luò)世界;2013年

2 嚴(yán)威川;明明白白顯卡“芯”[N];中國電腦教育報(bào);2007年

3 ;NEC圖形處理器每秒運(yùn)行50.2G條指令[N];計(jì)算機(jī)世界;2003年

4 均兒;人人都有臺(tái)超級計(jì)算機(jī)[N];電腦報(bào);2008年

5 小鄒;服務(wù)器進(jìn)入異構(gòu)并行時(shí)代[N];電腦報(bào);2010年

6 趙欣;“玩”3D,筆記本也行![N];中國計(jì)算機(jī)報(bào);2003年

7 ;HP Compaq Evo D210教育信息化的好幫手[N];中國計(jì)算機(jī)報(bào);2003年

8 記者 郇公弟;顯卡革命:或讓最快CPU望塵莫及[N];新華每日電訊;2009年

9 樂天 編譯;混合CPU更節(jié)能[N];計(jì)算機(jī)世界;2009年

10 本報(bào)記者 李奕;有多少企業(yè)需要HPC?[N];中國計(jì)算機(jī)報(bào);2013年

相關(guān)博士學(xué)位論文 前5條

1 祖淵;基于圖形處理器的高速并行算法研究[D];中國科學(xué)技術(shù)大學(xué);2014年

2 柴俊;面向應(yīng)用的加速器增強(qiáng)型異構(gòu)系統(tǒng)大規(guī)模并行計(jì)算關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年

3 吳強(qiáng);面向異構(gòu)系統(tǒng)的并行編程關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年

4 劉軍;動(dòng)態(tài)異構(gòu)虛擬盤陣及其關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年

5 馮權(quán)友;大規(guī)模眾核微處理器互連網(wǎng)絡(luò)體系結(jié)構(gòu)及性能分析研究[D];國防科學(xué)技術(shù)大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 李豪;面向OpenFOAM并行開發(fā)框架的性能分析關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年

2 徐蔚;基于圖形處理器的窗口系統(tǒng)的研究[D];西安工程大學(xué);2015年

3 劉伍鋒;基于PCI總線的主設(shè)備功能仿真與驗(yàn)證[D];西安電子科技大學(xué);2016年

4 李天驥;圖形處理器存儲(chǔ)系統(tǒng)的高精度System Verilog模型與自動(dòng)化仿真驗(yàn)證[D];西安電子科技大學(xué);2016年

5 陳貴華;基于RDMA高性能通信庫的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2015年

6 闕恒;嵌入式圖形處理器設(shè)計(jì)[D];南京航空航天大學(xué);2007年

7 周國建;龍芯嵌入式系統(tǒng)的性能分析與優(yōu)化研究[D];中國石油大學(xué);2008年

8 王皓;基于圖形處理器的數(shù)據(jù)流并行處理方法研究[D];大連理工大學(xué);2009年

9 蘭王靖輝;一種針對異構(gòu)多核平臺(tái)的系統(tǒng)架構(gòu)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

10 成思遠(yuǎn);異構(gòu)(CPU-GPU)計(jì)算機(jī)系統(tǒng)性能評測與優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

,

本文編號(hào):1909841

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1909841.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶26677***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
男女午夜福利院在线观看| 激情国产白嫩美女在线观看| 91人妻久久精品一区二区三区| 日韩av欧美中文字幕| 午夜午夜精品一区二区| 亚洲午夜av久久久精品| 欧美日韩精品综合在线| 色婷婷成人精品综合一区| 欧美又黑又粗大又硬又爽| 人妻亚洲一区二区三区| 欧美黄色黑人一区二区| 欧美一级特黄大片做受大屁股| 九九热精彩视频在线播放| 中文字幕人妻av不卡| 国产免费成人激情视频| 国产日韩欧美专区一区| 国产精品刮毛视频不卡| 午夜福利视频偷拍91| 国产精品一区二区日韩新区| 91日韩在线视频观看| 国产av精品一区二区| 国产成人精品一区在线观看| 一区二区三区日韩在线| 亚洲av专区在线观看| 国产精品99一区二区三区| 国产一区二区三区四区中文| 69老司机精品视频在线观看| 自拍偷拍福利视频在线观看| 久久99青青精品免费观看| 亚洲中文在线男人的天堂| 东京热男人的天堂一二三区| 黄色激情视频中文字幕| 99久久国产精品免费| 亚洲一区二区三区精选| 亚洲欧美日韩国产成人| 丁香六月啪啪激情综合区| 欧美亚洲美女资源国产| 91插插插外国一区二区婷婷| 日韩少妇人妻中文字幕| 不卡一区二区高清视频| 最新69国产精品视频|