天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

面向稀疏數(shù)據(jù)的GPU程序優(yōu)化技術(shù)研究

發(fā)布時(shí)間:2021-02-11 03:05
  隨著信息技術(shù)的不斷發(fā)展,計(jì)算機(jī)需要處理的數(shù)據(jù)量和任務(wù)量日益增多,為了提高計(jì)算機(jī)程序的運(yùn)行速度,越來越多的公司、科研機(jī)構(gòu)開始通過結(jié)合中央處理器(CPU)和圖形處理器(GPU)的技術(shù)設(shè)計(jì)高性能的并行應(yīng)用程序。近年來,GPU已經(jīng)廣泛部署在數(shù)據(jù)中心、高性能計(jì)算中心等大型計(jì)算集群中,許多智能手機(jī)、自動(dòng)駕駛汽車、智能攝像頭等嵌入式設(shè)備也集成了GPU。NVIDIA、AMD等GPU廠商提供了CUDA、OpenCL等GPU編程平臺(tái)和語言,讓用戶能夠更加方便地編寫GPU并行程序。但由于GPU與CPU的體系結(jié)構(gòu)存在較大差異,編寫高性能的GPU程序往往需要一定的經(jīng)驗(yàn)和優(yōu)化技巧,這使得普通用戶編寫的程序往往還有較大的優(yōu)化空間。為了充分利用深度學(xué)習(xí)、數(shù)據(jù)挖掘等場(chǎng)景中常見的數(shù)據(jù)稀疏性,本文對(duì)面向稀疏數(shù)據(jù)的GPU程序優(yōu)化技術(shù)進(jìn)行了深入的研究。本文首先提出了一種面向稀疏數(shù)據(jù)的GPU程序優(yōu)化思路,主要包含立即數(shù)替換和稀疏常量?jī)?yōu)化兩種策略,通過對(duì)基于源代碼、目標(biāo)代碼進(jìn)行程序優(yōu)化的過程進(jìn)行分析,闡述了基于目標(biāo)代碼的程序優(yōu)化方法的優(yōu)勢(shì)。為了在目標(biāo)代碼層次進(jìn)行稀疏數(shù)據(jù)的替換,設(shè)計(jì)了一種基于模板的立即數(shù)替換方法,通過在源代碼中設(shè)置... 

【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:81 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向稀疏數(shù)據(jù)的GPU程序優(yōu)化技術(shù)研究


LeNet-5參數(shù)稀疏程度變化趨勢(shì)

準(zhǔn)確率,參數(shù),預(yù)測(cè)結(jié)果,變量


由于參數(shù)是浮點(diǎn)型變量,本實(shí)驗(yàn)假定參數(shù)小于 0.00001 時(shí)將其看作 0 元素來處理,圖4.3 對(duì)這種近似策略的影響進(jìn)行了評(píng)估,(a)中對(duì)比了近似策略和原始訓(xùn)練過程的 Loss 值變化趨勢(shì),(b)中對(duì)比了近似策略和原始訓(xùn)練過程的預(yù)測(cè)結(jié)果準(zhǔn)確率


本文編號(hào):3028419

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3028419.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6baec***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com