天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

一種基于GPU的高性能稀疏卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化

發(fā)布時(shí)間:2024-05-27 05:57
  卷積神經(jīng)網(wǎng)絡(luò)CNN目前作為神經(jīng)網(wǎng)絡(luò)的一個(gè)重要分支,相比于其他神經(jīng)網(wǎng)絡(luò)方法更適合應(yīng)用于圖像特征的學(xué)習(xí)和表達(dá)。隨著CNN的不斷發(fā)展,CNN將面臨更多的挑戰(zhàn)。CNN參數(shù)規(guī)模變得越來越大,這使得CNN對計(jì)算的需求量變得非常大。因此,目前產(chǎn)生了許多種方式對CNN的規(guī)模進(jìn)行壓縮。然而壓縮后的CNN模型往往產(chǎn)生了許多稀疏的數(shù)據(jù)結(jié)構(gòu),這種稀疏結(jié)構(gòu)會影響CNN在GPU上的性能。為了解決該問題,采用直接稀疏卷積算法,來加速GPU處理稀疏數(shù)據(jù)。根據(jù)其算法特點(diǎn)將卷積運(yùn)算轉(zhuǎn)換為稀疏向量與稠密向量內(nèi)積運(yùn)算,并將其在GPU平臺上實(shí)現(xiàn)。本文的優(yōu)化方案充分利用數(shù)據(jù)稀疏性和網(wǎng)絡(luò)結(jié)構(gòu)來分配線程進(jìn)行任務(wù)調(diào)度,利用數(shù)據(jù)局部性來管理內(nèi)存替換,使得在稀疏卷積神經(jīng)網(wǎng)絡(luò)SCNN中的GPU仍能夠高效地處理卷積層運(yùn)算。相比cuBLAS的實(shí)現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.07×~1.23×、1.17×~3.51×、1.32×~5.00×的加速比。相比cuSPARSE的實(shí)現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.31×~1.42×、1.09×~2.00×、1.0...

【文章頁數(shù)】:9 頁

【部分圖文】:

圖1降維展開方式實(shí)現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

圖1降維展開方式實(shí)現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

Figure1Loweringmethodperformsconvolutionoperation圖1降維展開方式實(shí)現(xiàn)卷積運(yùn)算Table1Descriptionofconvolutionparameters表1卷積參數(shù)描述參數(shù)描述N三維輸入特征矩陣批處理任務(wù)的batchsizeM....


圖2直接稀疏卷積Figure2Directsparseconvolution

圖2直接稀疏卷積Figure2Directsparseconvolution

接稀疏卷積去除了輸入特征矩陣中的數(shù)據(jù)重復(fù)復(fù)制。該算法將卷積核矩陣的規(guī)模擴(kuò)展到輸入矩陣的相同大小。對于延展后的卷積核行展開生成向量Wm,其長度為C×H×W。由于有M個(gè)卷積核,對每一個(gè)卷積核進(jìn)行延展后得到了M×(C×H×W)的權(quán)重矩陣。對于該批次任務(wù)下的輸入矩陣以行展開的方式形成列向....


圖3行壓縮存儲格式Figure3CSRformat

圖3行壓縮存儲格式Figure3CSRformat

Figure3CSRformat圖3行壓縮存儲格式的行列指針。相比降維方式,直接稀疏卷積更適合在GPU上實(shí)現(xiàn)SCNN。3設(shè)計(jì)與實(shí)現(xiàn)本節(jié)介紹本文所提方法的具體實(shí)現(xiàn)和優(yōu)化。由于權(quán)重刪減后SCNN產(chǎn)生了大量稀疏數(shù)據(jù)結(jié)構(gòu),而傳統(tǒng)的降維方式并不能保證稀疏矩陣卷積的計(jì)算性能,本文采用全新的直....


圖4權(quán)重延展Figure4Weightstretched

圖4權(quán)重延展Figure4Weightstretched

的降維方式并不能保證稀疏矩陣卷積的計(jì)算性能,本文采用全新的直接稀疏卷積來替代降維方式,彌補(bǔ)性能損失。除此以外,GPU的體系結(jié)構(gòu)特征需要在實(shí)現(xiàn)過程中對線程映射、任務(wù)分配以及內(nèi)存管理進(jìn)行更多的考慮和優(yōu)化。3.1概述直接稀疏卷積的實(shí)現(xiàn)主要由兩部分組成:(1)數(shù)據(jù)預(yù)處理,主要完成對卷積核....



本文編號:3982862

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3982862.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bbfd4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
精品人妻精品一区二区三区| 不卡一区二区高清视频| 免费黄片视频美女一区| 欧美乱视频一区二区三区| 久久精品一区二区少妇| 免费在线成人激情视频| 日本少妇三级三级三级| 亚洲中文字幕剧情在线播放| 日本不卡一本二本三区| 亚洲精品伦理熟女国产一区二区| 欧美日韩免费观看视频| 国产精品一区二区不卡中文| 日韩人妻免费视频一专区| 国内尹人香蕉综合在线| 日韩和欧美的一区二区三区| 欧美日韩在线观看自拍| 国产av一区二区三区四区五区| 欧美一区二区黑人在线| 国产日韩欧美综合视频| 国产成人精品国产亚洲欧洲| 日韩高清一区二区三区四区 | 国产三级视频不卡在线观看| 黄色片国产一区二区三区| 亚洲中文字幕在线观看四区| 中文字幕不卡欧美在线| 国产欧美日韩不卡在线视频| 日本高清加勒比免费在线| 天堂网中文字幕在线视频| 加勒比日本欧美在线观看| 日韩一区二区免费在线观看| 日本加勒比系列在线播放| 日韩精品一区二区三区射精| 中文字幕日韩一区二区不卡| 欧美三级大黄片免费看| 亚洲综合香蕉在线视频| 激情三级在线观看视频| 91亚洲国产—区=区a| 久久精品少妇内射毛片| 人妻少妇av中文字幕乱码高清| 国产精品午夜小视频观看| 精品欧美国产一二三区|