天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

GPU平臺上面向性能和功耗的分支優(yōu)化

發(fā)布時間:2017-06-27 00:11

  本文關(guān)鍵詞:GPU平臺上面向性能和功耗的分支優(yōu)化,由筆耕文化傳播整理發(fā)布。


【摘要】:強大的計算能力使得GPGPU在通用計算領(lǐng)域得到了廣泛的應(yīng)用。然而,GPGPU的SIMT(Single Instruction Multiple Threads)工作方式,使其執(zhí)行效率受到應(yīng)用中不一致分支行為(Branch Divergence)的嚴(yán)重影響。雖然人們提出了線程交換方法來減小分支帶來的性能損失,但這種方法往往會引入額外的訪存操作,不僅在一定程度上減少了線程交換優(yōu)化的性能收益,還增加了功耗。首先舉例說明線程交換范圍對程序性能和功耗的影響;然后提出了一種減少線程交換所引入的額外訪存操作的方法。實驗表明,對于Reduction程序,當(dāng)交換范圍為256時,在性能平均損失為4%的情況下功耗降低幅度最大為7%;而對于Bitonic程序,當(dāng)交換范圍為256和512時,在沒有功耗開銷的情況下,性能分別最大提升了6.4%和5.3%。
【作者單位】: 國防科學(xué)技術(shù)大學(xué)計算機學(xué)院;
【關(guān)鍵詞】不一致分支行為 訪存 線程交換
【基金】:國家自然科學(xué)基金項目(61472431,61202121) 教育部高等學(xué)校博士點新教師基金項目(20114307120013)資助
【分類號】:TP38
【正文快照】: 1 引言近幾年,GPGPU在通用計算領(lǐng)域得到了廣泛的應(yīng)用,成為當(dāng)前高性能計算系統(tǒng)的重要組成部分。許多應(yīng)用被成功移植到CPU+GPU的異構(gòu)平臺上,得到了很好的加速效果。GPU的優(yōu)勢在于其強大的并行計算能力以及良好的可編程性。以NVIDIA公司的GPU產(chǎn)品為例,每個GPU中含有多個流多處理

  本文關(guān)鍵詞:GPU平臺上面向性能和功耗的分支優(yōu)化,由筆耕文化傳播整理發(fā)布。



本文編號:488025

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/488025.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3d1b0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲在线观看福利视频| 亚洲一区二区精品免费视频| 韩国日本欧美国产三级| 亚洲一区二区三区熟女少妇| 老熟妇乱视频一区二区| 欧美亚洲国产日韩一区二区| 91精品国产综合久久福利| 中文字幕人妻一区二区免费| 欧美日韩在线观看自拍| 日本不卡一区视频欧美| 91免费精品国自产拍偷拍| 亚洲第一区二区三区女厕偷拍| 日本不卡在线视频中文国产| 国产精品香蕉在线的人| 99热九九热这里只有精品| 亚洲中文在线男人的天堂| 年轻女房东2中文字幕| 国产精品一区二区香蕉视频 | 激情五月天免费在线观看| 激情五月综五月综合网| 亚洲内射人妻一区二区| 亚洲欧洲一区二区中文字幕| 精品亚洲av一区二区三区| 精品香蕉一区二区在线| 日本av一区二区不卡| 久久成人国产欧美精品一区二区| 亚洲国产成人爱av在线播放下载| 国产又黄又爽又粗视频在线| 粉嫩国产美女国产av| 午夜成年人黄片免费观看| 97人妻精品一区二区三区免| 亚洲中文字幕免费人妻| 东京不热免费观看日本| 国产一级一片内射视频在线| 国产精品一区二区丝袜| 亚洲欧美中文字幕精品| 绝望的校花花间淫事2| 欧美人妻一区二区三区| 一个人的久久精彩视频| 欧美日韩综合在线第一页| 91精品日本在线视频|