天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

輕量化卷積神經(jīng)網(wǎng)絡(luò)加速器研究

發(fā)布時間:2021-01-07 04:54
  相較傳統(tǒng)的圖像處理方法,深度神經(jīng)網(wǎng)絡(luò)的效率和準(zhǔn)確率都得到了顯著的提升,在很多應(yīng)用中都可以發(fā)揮明顯的作用。然而,卷積神經(jīng)網(wǎng)絡(luò)計算非常密集,CPU等通用處理器難以對卷積計算進行并行加速,效率十分低下,在應(yīng)用中會產(chǎn)生延遲。而高端的GPU在計算卷積神經(jīng)網(wǎng)絡(luò)時雖然效率尚可,但它的高功耗限制了它在移動端平臺的應(yīng)用。比如自動駕駛和機器人這樣的移動端平臺,對低延遲和低功耗都有很高的要求,CPU和GPU在實現(xiàn)這些應(yīng)用時都不是最佳選擇。而FPGA內(nèi)部集成了大量DSP資源,由于無需指令,它可以充分發(fā)揮浮點計算能力,使得在加速數(shù)據(jù)密集型計算時擁有巨大優(yōu)勢,且與高端的GPU相比時,FPGA的功耗相對低很多。但是,VGG等大型卷積神經(jīng)網(wǎng)絡(luò)由于巨大的參數(shù)量和計算量,很難在資源受限的FPGA上實現(xiàn)。而輕量型網(wǎng)絡(luò)MobileNetV2采用深度可分離卷積代替普通卷積,顯著降低計算量和參數(shù)量,大大降低了對資源的需求,讓我們看到了復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)在移動端平臺上實現(xiàn)的可能性。所以,研究MobileNetV2這種輕量化卷積神經(jīng)網(wǎng)絡(luò)模型的計算加速對于復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)在移動端的實現(xiàn)具有十分重大的意義。在上述背景下,論文設(shè)計并實現(xiàn)... 

【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:78 頁

【學(xué)位級別】:碩士

【部分圖文】:

輕量化卷積神經(jīng)網(wǎng)絡(luò)加速器研究


第一個通道開始時的仿真圖

仿真圖,信號,地址信號,標(biāo)志位


輸出的地址信號 w_addr 為 4095,即將載入第二組權(quán)重開始下一輪的卷積,所有信號都回歸初始值。圖3.26 第一個通道結(jié)束時的仿真圖第二個通道開始正式得到輸出值的位置如圖 3.27 粗線處,此時進行的通道數(shù)信號 cnt_channel 已經(jīng)從 1 變成 2,其他信號和第一個通道開始時的完全相同,權(quán)重載入結(jié)束的標(biāo)志 weight_finish 和輸入數(shù)據(jù)有效的信號 valid_in 為高,卷積完成的標(biāo)志位信號 conv_finish 為低,卷積輸出數(shù)據(jù)有效的標(biāo)志位信號 write_data_valid 在此時變高,地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖

仿真圖,通道,卷積輸出,地址信號


號 conv_finish 為低,卷積輸出數(shù)據(jù)有效的標(biāo)志位信號 write_data_valid 在此時變高,地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖


本文編號:2961952

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2961952.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a7a94***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com