輕量化卷積神經(jīng)網(wǎng)絡(luò)加速器研究

發(fā)布時間：2021-01-07 04:54

　　相較傳統(tǒng)的圖像處理方法,深度神經(jīng)網(wǎng)絡(luò)的效率和準(zhǔn)確率都得到了顯著的提升,在很多應(yīng)用中都可以發(fā)揮明顯的作用。然而,卷積神經(jīng)網(wǎng)絡(luò)計算非常密集,CPU等通用處理器難以對卷積計算進行并行加速,效率十分低下,在應(yīng)用中會產(chǎn)生延遲。而高端的GPU在計算卷積神經(jīng)網(wǎng)絡(luò)時雖然效率尚可,但它的高功耗限制了它在移動端平臺的應(yīng)用。比如自動駕駛和機器人這樣的移動端平臺,對低延遲和低功耗都有很高的要求,CPU和GPU在實現(xiàn)這些應(yīng)用時都不是最佳選擇。而FPGA內(nèi)部集成了大量DSP資源,由于無需指令,它可以充分發(fā)揮浮點計算能力,使得在加速數(shù)據(jù)密集型計算時擁有巨大優(yōu)勢,且與高端的GPU相比時,FPGA的功耗相對低很多。但是,VGG等大型卷積神經(jīng)網(wǎng)絡(luò)由于巨大的參數(shù)量和計算量,很難在資源受限的FPGA上實現(xiàn)。而輕量型網(wǎng)絡(luò)MobileNetV2采用深度可分離卷積代替普通卷積,顯著降低計算量和參數(shù)量,大大降低了對資源的需求,讓我們看到了復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)在移動端平臺上實現(xiàn)的可能性。所以,研究MobileNetV2這種輕量化卷積神經(jīng)網(wǎng)絡(luò)模型的計算加速對于復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)在移動端的實現(xiàn)具有十分重大的意義。在上述背景下,論文設(shè)計并實現(xiàn)...

【文章來源】：西安電子科技大學(xué)陜西省 211工程院校教育部直屬院校

【文章頁數(shù)】：78 頁

【學(xué)位級別】：碩士

【部分圖文】：

第一個通道開始時的仿真圖

仿真圖,信號,地址信號,標(biāo)志位

輸出的地址信號 w_addr 為 4095，即將載入第二組權(quán)重開始下一輪的卷積，所有信號都回歸初始值。圖3.26 第一個通道結(jié)束時的仿真圖第二個通道開始正式得到輸出值的位置如圖 3.27 粗線處，此時進行的通道數(shù)信號 cnt_channel 已經(jīng)從 1 變成 2，其他信號和第一個通道開始時的完全相同，權(quán)重載入結(jié)束的標(biāo)志 weight_finish 和輸入數(shù)據(jù)有效的信號 valid_in 為高，卷積完成的標(biāo)志位信號 conv_finish 為低，卷積輸出數(shù)據(jù)有效的標(biāo)志位信號 write_data_valid 在此時變高，地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖

仿真圖,通道,卷積輸出,地址信號

號 conv_finish 為低，卷積輸出數(shù)據(jù)有效的標(biāo)志位信號 write_data_valid 在此時變高，地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖

本文編號：2961952

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2961952.html

上一篇：面向應(yīng)用的加速器增強型異構(gòu)系統(tǒng)大規(guī)模并行計算關(guān)鍵技術(shù)研究
下一篇：CPU-GPU異構(gòu)體系結(jié)構(gòu)片上網(wǎng)絡(luò)動態(tài)路由緩沖區(qū)分配策略研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

輕量化卷積神經(jīng)網(wǎng)絡(luò)加速器研究