輕量化卷積神經(jīng)網(wǎng)絡(luò)加速器研究
發(fā)布時間:2021-01-07 04:54
相較傳統(tǒng)的圖像處理方法,深度神經(jīng)網(wǎng)絡(luò)的效率和準確率都得到了顯著的提升,在很多應用中都可以發(fā)揮明顯的作用。然而,卷積神經(jīng)網(wǎng)絡(luò)計算非常密集,CPU等通用處理器難以對卷積計算進行并行加速,效率十分低下,在應用中會產(chǎn)生延遲。而高端的GPU在計算卷積神經(jīng)網(wǎng)絡(luò)時雖然效率尚可,但它的高功耗限制了它在移動端平臺的應用。比如自動駕駛和機器人這樣的移動端平臺,對低延遲和低功耗都有很高的要求,CPU和GPU在實現(xiàn)這些應用時都不是最佳選擇。而FPGA內(nèi)部集成了大量DSP資源,由于無需指令,它可以充分發(fā)揮浮點計算能力,使得在加速數(shù)據(jù)密集型計算時擁有巨大優(yōu)勢,且與高端的GPU相比時,FPGA的功耗相對低很多。但是,VGG等大型卷積神經(jīng)網(wǎng)絡(luò)由于巨大的參數(shù)量和計算量,很難在資源受限的FPGA上實現(xiàn)。而輕量型網(wǎng)絡(luò)MobileNetV2采用深度可分離卷積代替普通卷積,顯著降低計算量和參數(shù)量,大大降低了對資源的需求,讓我們看到了復雜的卷積神經(jīng)網(wǎng)絡(luò)在移動端平臺上實現(xiàn)的可能性。所以,研究MobileNetV2這種輕量化卷積神經(jīng)網(wǎng)絡(luò)模型的計算加速對于復雜的卷積神經(jīng)網(wǎng)絡(luò)在移動端的實現(xiàn)具有十分重大的意義。在上述背景下,論文設(shè)計并實現(xiàn)...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【部分圖文】:
第一個通道開始時的仿真圖
輸出的地址信號 w_addr 為 4095,即將載入第二組權(quán)重開始下一輪的卷積,所有信號都回歸初始值。圖3.26 第一個通道結(jié)束時的仿真圖第二個通道開始正式得到輸出值的位置如圖 3.27 粗線處,此時進行的通道數(shù)信號 cnt_channel 已經(jīng)從 1 變成 2,其他信號和第一個通道開始時的完全相同,權(quán)重載入結(jié)束的標志 weight_finish 和輸入數(shù)據(jù)有效的信號 valid_in 為高,卷積完成的標志位信號 conv_finish 為低,卷積輸出數(shù)據(jù)有效的標志位信號 write_data_valid 在此時變高,地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖
號 conv_finish 為低,卷積輸出數(shù)據(jù)有效的標志位信號 write_data_valid 在此時變高,地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖
本文編號:2961952
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【部分圖文】:
第一個通道開始時的仿真圖
輸出的地址信號 w_addr 為 4095,即將載入第二組權(quán)重開始下一輪的卷積,所有信號都回歸初始值。圖3.26 第一個通道結(jié)束時的仿真圖第二個通道開始正式得到輸出值的位置如圖 3.27 粗線處,此時進行的通道數(shù)信號 cnt_channel 已經(jīng)從 1 變成 2,其他信號和第一個通道開始時的完全相同,權(quán)重載入結(jié)束的標志 weight_finish 和輸入數(shù)據(jù)有效的信號 valid_in 為高,卷積完成的標志位信號 conv_finish 為低,卷積輸出數(shù)據(jù)有效的標志位信號 write_data_valid 在此時變高,地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖
號 conv_finish 為低,卷積輸出數(shù)據(jù)有效的標志位信號 write_data_valid 在此時變高,地址信號 w_addr 從-1 開始不斷累加。圖3.27 第二個通道開始時的仿真圖
本文編號:2961952
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2961952.html
最近更新
教材專著