GPU矩陣乘法的性能定量分析模型
發(fā)布時間:2018-03-11 14:02
本文選題:GPU 切入點:GPGPU-Sim 出處:《計算機科學》2015年12期 論文類型:期刊論文
【摘要】:性能評價和優(yōu)化是設計高效率并行程序必不可少的重要工作,存儲系統(tǒng)的性能高低直接影響到處理器的整體性能。利用GPGPU-Sim對GPU的存儲層次結構進行了模擬,找出了SM數(shù)量與存儲控制器數(shù)量之間最佳配置關系。矩陣乘法是科學計算領域中的基本組成部分,是一種具有計算和訪存密集特點的典型應用,其性能是GPU高性能計算的一個重要指標。性能模型作為并行系統(tǒng)性能評價的新的技術解決方案,具有許多其它性能評價方法無法比擬的優(yōu)勢。建立了一個性能模型,模型通過對指令流水線、共享存儲器訪存、全局存儲器訪存進行定量分析,找到了程序運行瓶頸,提高了執(zhí)行速度。實驗證明,該模型具有實用性,并有效地實現(xiàn)了矩陣乘法的優(yōu)化。
[Abstract]:Performance evaluation and optimization is an essential work in designing efficient parallel programs. The performance of storage system directly affects the overall performance of the processor. The memory hierarchy of GPU is simulated by GPGPU-Sim. The optimal configuration relationship between SM number and memory controller number is found. Matrix multiplication is a basic part of scientific computing field, and it is a typical application with the characteristics of computing and memory access. As a new technical solution for parallel system performance evaluation, the performance model has many advantages that cannot be compared with other performance evaluation methods. Through quantitative analysis of instruction pipeline, shared memory access and global memory access, the model finds the bottleneck of program running and improves the execution speed. Experiments show that the model is practical. The optimization of matrix multiplication is realized effectively.
【作者單位】: 武漢大學計算機學院;湖北工程學院計算機與信息科學學院;
【基金】:國家自然科學基金(61370092) 湖北省自然科學基金(2013CFC005) 湖北省中青年創(chuàng)新團隊(T201410)資助
【分類號】:TP332.22
【參考文獻】
相關期刊論文 前1條
1 鄒航;王華秋;黃勇;;基于GPU加速的彩虹表分析MD5哈希密碼[J];重慶理工大學學報(自然科學);2013年07期
【共引文獻】
相關碩士學位論文 前1條
1 黃東江;GPU集群上彩虹表構造與查找的研究與實現(xiàn)[D];華南理工大學;2014年
【二級參考文獻】
相關期刊論文 前5條
1 張慶科;楊波;王琳;朱福祥;;基于GPU的現(xiàn)代并行優(yōu)化算法[J];計算機科學;2012年04期
2 劉永磊;金志剛;陳U,
本文編號:1598477
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1598477.html
最近更新
教材專著