適用于CNN的高能效可配置卷積加速器的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2023-03-04 10:41
計(jì)算機(jī)視覺在當(dāng)今工業(yè)物聯(lián)網(wǎng)中發(fā)揮著重要的作用,而圖像識(shí)別是計(jì)算機(jī)視覺中最重要的部分之一,卷積神經(jīng)網(wǎng)絡(luò)算法由于其較高的識(shí)別精度成為圖像識(shí)別的首選。在很多圖像識(shí)別應(yīng)用中,由于對(duì)實(shí)時(shí)性有一定要求,所以神經(jīng)網(wǎng)絡(luò)的推理需要在本地硬件上執(zhí)行,如無人機(jī)的碰撞檢測等。并且由于GPU功耗較高,限制了其在功耗與資源有限的嵌入式平臺(tái)上使用,因此需要一種高能效、可配置的卷積加速器來滿足卷積神經(jīng)網(wǎng)絡(luò)算法在嵌入式平臺(tái)上的應(yīng)用需求。本文從卷積層的運(yùn)算模型出發(fā),分析了不同存儲(chǔ)結(jié)構(gòu)的能耗以及卷積層運(yùn)算中多種數(shù)據(jù)復(fù)用方式,并結(jié)合二維計(jì)算單元陣列,提出了一種針對(duì)卷積層運(yùn)算的卷積加速器架構(gòu)。首先,采用了一種可配置的計(jì)算單元陣列,實(shí)現(xiàn)了與卷積運(yùn)算映射的高度匹配,顯著提高了計(jì)算單元利用率;然后,設(shè)計(jì)了一種帶有本地存儲(chǔ)并支持交錯(cuò)運(yùn)算的計(jì)算單元,實(shí)現(xiàn)了計(jì)算單元對(duì)輸入特征圖的復(fù)用和中間結(jié)果的累加,明顯減少了對(duì)輸入特征圖和卷積核數(shù)據(jù)的片外存儲(chǔ)訪問;最后,基于樹型網(wǎng)絡(luò),設(shè)計(jì)了一種支持?jǐn)?shù)據(jù)流處理的專用片上網(wǎng)絡(luò),實(shí)現(xiàn)了計(jì)算單元陣列對(duì)輸入特征圖和卷積核的數(shù)據(jù)共享以及中間結(jié)果的傳輸,滿足了計(jì)算單元陣列與全局緩存之間的數(shù)據(jù)傳輸需求。本文首先基于硬件...
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文內(nèi)容安排
2 卷積層運(yùn)算模型分析
2.1 卷積層運(yùn)算模型
2.2 存儲(chǔ)模式分析
2.3 卷積層數(shù)據(jù)復(fù)用類型分析
2.4 實(shí)現(xiàn)多種數(shù)據(jù)復(fù)用的結(jié)構(gòu)
2.5 本章小結(jié)
3 卷積加速器的設(shè)計(jì)與實(shí)現(xiàn)
3.1 系統(tǒng)整體架構(gòu)及數(shù)據(jù)定點(diǎn)化
3.2 數(shù)據(jù)流的實(shí)際處理
3.3 系統(tǒng)模塊的實(shí)現(xiàn)
3.4 本章小結(jié)
4 卷積加速器的驗(yàn)證與結(jié)果分析
4.1 卷積加速器的功能仿真
4.2 卷積加速器的FPGA驗(yàn)證及ASIC實(shí)現(xiàn)
4.3 系統(tǒng)測試與結(jié)果分析
4.4 不同卷積層參數(shù)下計(jì)算單元使用率分析
4.5 本章小結(jié)
5 總結(jié)與展望
6 致謝
參考文獻(xiàn)
附錄 1 攻讀碩士期間的科研工作
本文編號(hào):3754138
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文內(nèi)容安排
2 卷積層運(yùn)算模型分析
2.1 卷積層運(yùn)算模型
2.2 存儲(chǔ)模式分析
2.3 卷積層數(shù)據(jù)復(fù)用類型分析
2.4 實(shí)現(xiàn)多種數(shù)據(jù)復(fù)用的結(jié)構(gòu)
2.5 本章小結(jié)
3 卷積加速器的設(shè)計(jì)與實(shí)現(xiàn)
3.1 系統(tǒng)整體架構(gòu)及數(shù)據(jù)定點(diǎn)化
3.2 數(shù)據(jù)流的實(shí)際處理
3.3 系統(tǒng)模塊的實(shí)現(xiàn)
3.4 本章小結(jié)
4 卷積加速器的驗(yàn)證與結(jié)果分析
4.1 卷積加速器的功能仿真
4.2 卷積加速器的FPGA驗(yàn)證及ASIC實(shí)現(xiàn)
4.3 系統(tǒng)測試與結(jié)果分析
4.4 不同卷積層參數(shù)下計(jì)算單元使用率分析
4.5 本章小結(jié)
5 總結(jié)與展望
6 致謝
參考文獻(xiàn)
附錄 1 攻讀碩士期間的科研工作
本文編號(hào):3754138
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3754138.html
最近更新
教材專著