基于FPGA的卷積神經網絡定點加速
發(fā)布時間:2023-04-06 18:14
針對卷積神經網絡(CNN)在資源受限的硬件設備上運行功耗高及運行慢的問題,提出一種基于現(xiàn)場可編程門陣列(FPGA)的CNN定點計算加速方法。首先提出一種定點化方法,并且每層卷積設計不同的尺度參數,使用相對散度確定位寬的長度,以減小CNN參數的存儲空間,而且研究不同量化區(qū)間對CNN精度的影響;其次,設計參數復用方法及流水線計算方法來加速卷積計算。為驗證CNN定點化后的加速效果,采用了人臉和船舶兩個數據集進行驗證。結果表明,相較于傳統(tǒng)的浮點卷積計算,所提方法在保證CNN精度損失很小的前提下,當權值參數和輸入特征圖參數量化到7-bit時,在人臉識別CNN模型上的壓縮后的權重參數文件大小約為原來的22%,卷積計算加速比為18.69,同時使FPGA中的乘加器的利用率達94.5%。實驗結果表明了該方法可以提高卷積計算速度,并且能夠高效利用FPGA硬件資源。
【文章頁數】:6 頁
【文章目錄】:
0 引言
1 卷積神經網絡模型參數預處理
1.1 卷積神經網絡
1.2 權值參數預處理
2 CNN模型參數定點化優(yōu)化方法
2.1 權值參數定點化
2.2 輸入參數定點化
3 基于FPGA的定點化CNN加速設計
3.1 參數量化
3.2 參數加載
3.3 輸入模塊
3.4 卷積加速
3.5 輸出模塊
4 實驗與結果分析
4.1 實驗設計
4.2 實驗結果與分析
5 結語
本文編號:3784166
【文章頁數】:6 頁
【文章目錄】:
0 引言
1 卷積神經網絡模型參數預處理
1.1 卷積神經網絡
1.2 權值參數預處理
2 CNN模型參數定點化優(yōu)化方法
2.1 權值參數定點化
2.2 輸入參數定點化
3 基于FPGA的定點化CNN加速設計
3.1 參數量化
3.2 參數加載
3.3 輸入模塊
3.4 卷積加速
3.5 輸出模塊
4 實驗與結果分析
4.1 實驗設計
4.2 實驗結果與分析
5 結語
本文編號:3784166
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3784166.html
教材專著