GPU矩陣乘法的性能定量分析模型
發(fā)布時(shí)間:2018-03-11 14:02
本文選題:GPU 切入點(diǎn):GPGPU-Sim 出處:《計(jì)算機(jī)科學(xué)》2015年12期 論文類型:期刊論文
【摘要】:性能評(píng)價(jià)和優(yōu)化是設(shè)計(jì)高效率并行程序必不可少的重要工作,存儲(chǔ)系統(tǒng)的性能高低直接影響到處理器的整體性能。利用GPGPU-Sim對(duì)GPU的存儲(chǔ)層次結(jié)構(gòu)進(jìn)行了模擬,找出了SM數(shù)量與存儲(chǔ)控制器數(shù)量之間最佳配置關(guān)系。矩陣乘法是科學(xué)計(jì)算領(lǐng)域中的基本組成部分,是一種具有計(jì)算和訪存密集特點(diǎn)的典型應(yīng)用,其性能是GPU高性能計(jì)算的一個(gè)重要指標(biāo)。性能模型作為并行系統(tǒng)性能評(píng)價(jià)的新的技術(shù)解決方案,具有許多其它性能評(píng)價(jià)方法無法比擬的優(yōu)勢(shì)。建立了一個(gè)性能模型,模型通過對(duì)指令流水線、共享存儲(chǔ)器訪存、全局存儲(chǔ)器訪存進(jìn)行定量分析,找到了程序運(yùn)行瓶頸,提高了執(zhí)行速度。實(shí)驗(yàn)證明,該模型具有實(shí)用性,并有效地實(shí)現(xiàn)了矩陣乘法的優(yōu)化。
[Abstract]:Performance evaluation and optimization is an essential work in designing efficient parallel programs. The performance of storage system directly affects the overall performance of the processor. The memory hierarchy of GPU is simulated by GPGPU-Sim. The optimal configuration relationship between SM number and memory controller number is found. Matrix multiplication is a basic part of scientific computing field, and it is a typical application with the characteristics of computing and memory access. As a new technical solution for parallel system performance evaluation, the performance model has many advantages that cannot be compared with other performance evaluation methods. Through quantitative analysis of instruction pipeline, shared memory access and global memory access, the model finds the bottleneck of program running and improves the execution speed. Experiments show that the model is practical. The optimization of matrix multiplication is realized effectively.
【作者單位】: 武漢大學(xué)計(jì)算機(jī)學(xué)院;湖北工程學(xué)院計(jì)算機(jī)與信息科學(xué)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61370092) 湖北省自然科學(xué)基金(2013CFC005) 湖北省中青年創(chuàng)新團(tuán)隊(duì)(T201410)資助
【分類號(hào)】:TP332.22
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 鄒航;王華秋;黃勇;;基于GPU加速的彩虹表分析MD5哈希密碼[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2013年07期
【共引文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 黃東江;GPU集群上彩虹表構(gòu)造與查找的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 張慶科;楊波;王琳;朱福祥;;基于GPU的現(xiàn)代并行優(yōu)化算法[J];計(jì)算機(jī)科學(xué);2012年04期
2 劉永磊;金志剛;陳U,
本文編號(hào):1598477
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1598477.html
最近更新
教材專著