基于近似計算與數(shù)據(jù)調(diào)度的CNN加速器設計與優(yōu)化
發(fā)布時間:2021-12-18 08:33
卷積神經(jīng)網(wǎng)絡(Convolution Neural Network,CNN)在深度學習中占據(jù)重要位置,其網(wǎng)絡結構具有較好的魯棒性和容錯能力,且易于進行網(wǎng)絡訓練和優(yōu)化,由于存在乘加運算量大、訪存密集、網(wǎng)絡參數(shù)多樣化等問題,在低功耗嵌入式領域,實現(xiàn)高能效的CNN加速器已成為研究熱點。本文基于卷積神經(jīng)網(wǎng)絡的算法結構特征,通過研究并優(yōu)化了基于近似計算與數(shù)據(jù)調(diào)度的架構設計,在滿足不同應用場景與應用需求的情況下,盡可能降低CNN加速器的功耗。首先,通過對卷積神經(jīng)網(wǎng)絡的冗余性和容錯性特征進行分析,對網(wǎng)絡參數(shù)采用分層量化壓縮的預處理方案,實現(xiàn)計算功耗與訪存量降低的效果。然后,基于已預處理的權重數(shù)據(jù),實現(xiàn)不同分層位寬的近似計算,解決了卷積運算乘法功耗大的問題;另一方面,基于卷積運算的數(shù)據(jù)重用軌跡研究,在運算陣列上提出多輸出加法樹路由互聯(lián)結構,與陣列緊耦合的存儲采用了乒乓緩存結構,對不同尺寸卷積運算,實現(xiàn)了高效靈活的映射方案;然后,通過基于大尺寸矩陣切割優(yōu)化及調(diào)節(jié)陣列供給電壓,解決了存儲和計算陣列之間的數(shù)據(jù)不平衡問題,從而實現(xiàn)高能效的CNN加速器數(shù)據(jù)調(diào)度設計。在TSMC 45nm工藝下,針對不同的卷積神經(jīng)...
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
迭代對數(shù)乘法器仿真波形
計算陣列的功能仿真波形圖
【參考文獻】:
期刊論文
[1]超越隱主題包模型:針對場景類別識別的空間金字塔匹配(英文)[J]. Fu-xiang LU,Jun HUANG. Frontiers of Information Technology & Electronic Engineering. 2015(10)
碩士論文
[1]基于FPGA的深度學習加速器設計與實現(xiàn)[D]. 余奇.中國科學技術大學 2016
本文編號:3542025
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
迭代對數(shù)乘法器仿真波形
計算陣列的功能仿真波形圖
【參考文獻】:
期刊論文
[1]超越隱主題包模型:針對場景類別識別的空間金字塔匹配(英文)[J]. Fu-xiang LU,Jun HUANG. Frontiers of Information Technology & Electronic Engineering. 2015(10)
碩士論文
[1]基于FPGA的深度學習加速器設計與實現(xiàn)[D]. 余奇.中國科學技術大學 2016
本文編號:3542025
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3542025.html
最近更新
教材專著