GPU平臺上面向性能和功耗的分支優(yōu)化
發(fā)布時間:2017-06-27 00:11
本文關(guān)鍵詞:GPU平臺上面向性能和功耗的分支優(yōu)化,由筆耕文化傳播整理發(fā)布。
【摘要】:強大的計算能力使得GPGPU在通用計算領(lǐng)域得到了廣泛的應(yīng)用。然而,GPGPU的SIMT(Single Instruction Multiple Threads)工作方式,使其執(zhí)行效率受到應(yīng)用中不一致分支行為(Branch Divergence)的嚴(yán)重影響。雖然人們提出了線程交換方法來減小分支帶來的性能損失,但這種方法往往會引入額外的訪存操作,不僅在一定程度上減少了線程交換優(yōu)化的性能收益,還增加了功耗。首先舉例說明線程交換范圍對程序性能和功耗的影響;然后提出了一種減少線程交換所引入的額外訪存操作的方法。實驗表明,對于Reduction程序,當(dāng)交換范圍為256時,在性能平均損失為4%的情況下功耗降低幅度最大為7%;而對于Bitonic程序,當(dāng)交換范圍為256和512時,在沒有功耗開銷的情況下,性能分別最大提升了6.4%和5.3%。
【作者單位】: 國防科學(xué)技術(shù)大學(xué)計算機學(xué)院;
【關(guān)鍵詞】: 不一致分支行為 訪存 線程交換
【基金】:國家自然科學(xué)基金項目(61472431,61202121) 教育部高等學(xué)校博士點新教師基金項目(20114307120013)資助
【分類號】:TP38
【正文快照】: 1 引言近幾年,GPGPU在通用計算領(lǐng)域得到了廣泛的應(yīng)用,成為當(dāng)前高性能計算系統(tǒng)的重要組成部分。許多應(yīng)用被成功移植到CPU+GPU的異構(gòu)平臺上,得到了很好的加速效果。GPU的優(yōu)勢在于其強大的并行計算能力以及良好的可編程性。以NVIDIA公司的GPU產(chǎn)品為例,每個GPU中含有多個流多處理
本文關(guān)鍵詞:GPU平臺上面向性能和功耗的分支優(yōu)化,由筆耕文化傳播整理發(fā)布。
,本文編號:488025
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/488025.html
最近更新
教材專著