基于近似計算與數(shù)據(jù)調(diào)度的CNN加速器設計與優(yōu)化

發(fā)布時間：2021-12-18 08:33

　　卷積神經(jīng)網(wǎng)絡（Convolution Neural Network,CNN）在深度學習中占據(jù)重要位置,其網(wǎng)絡結構具有較好的魯棒性和容錯能力,且易于進行網(wǎng)絡訓練和優(yōu)化,由于存在乘加運算量大、訪存密集、網(wǎng)絡參數(shù)多樣化等問題,在低功耗嵌入式領域,實現(xiàn)高能效的CNN加速器已成為研究熱點。本文基于卷積神經(jīng)網(wǎng)絡的算法結構特征,通過研究并優(yōu)化了基于近似計算與數(shù)據(jù)調(diào)度的架構設計,在滿足不同應用場景與應用需求的情況下,盡可能降低CNN加速器的功耗。首先,通過對卷積神經(jīng)網(wǎng)絡的冗余性和容錯性特征進行分析,對網(wǎng)絡參數(shù)采用分層量化壓縮的預處理方案,實現(xiàn)計算功耗與訪存量降低的效果。然后,基于已預處理的權重數(shù)據(jù),實現(xiàn)不同分層位寬的近似計算,解決了卷積運算乘法功耗大的問題;另一方面,基于卷積運算的數(shù)據(jù)重用軌跡研究,在運算陣列上提出多輸出加法樹路由互聯(lián)結構,與陣列緊耦合的存儲采用了乒乓緩存結構,對不同尺寸卷積運算,實現(xiàn)了高效靈活的映射方案;然后,通過基于大尺寸矩陣切割優(yōu)化及調(diào)節(jié)陣列供給電壓,解決了存儲和計算陣列之間的數(shù)據(jù)不平衡問題,從而實現(xiàn)高能效的CNN加速器數(shù)據(jù)調(diào)度設計。在TSMC 45nm工藝下,針對不同的卷積神經(jīng)...

【文章來源】：東南大學江蘇省 211工程院校 985工程院校教育部直屬院校

【文章頁數(shù)】：75 頁

【學位級別】：碩士

【部分圖文】：

迭代對數(shù)乘法器仿真波形

波形圖,功能仿真,陣列,波形圖

計算陣列的功能仿真波形圖

【參考文獻】：
期刊論文
[1]超越隱主題包模型:針對場景類別識別的空間金字塔匹配（英文）[J]. Fu-xiang LU,Jun HUANG. Frontiers of Information Technology & Electronic Engineering. 2015(10)

碩士論文
[1]基于FPGA的深度學習加速器設計與實現(xiàn)[D]. 余奇.中國科學技術大學 2016

本文編號：3542025

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3542025.html

上一篇：基于圖像特征的示波屏識別關鍵技術研究及應用
下一篇：展示廣告點擊率預估方法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于近似計算與數(shù)據(jù)調(diào)度的CNN加速器設計與優(yōu)化