天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于近似計算與數(shù)據(jù)調(diào)度的CNN加速器設計與優(yōu)化

發(fā)布時間:2021-12-18 08:33
  卷積神經(jīng)網(wǎng)絡(Convolution Neural Network,CNN)在深度學習中占據(jù)重要位置,其網(wǎng)絡結構具有較好的魯棒性和容錯能力,且易于進行網(wǎng)絡訓練和優(yōu)化,由于存在乘加運算量大、訪存密集、網(wǎng)絡參數(shù)多樣化等問題,在低功耗嵌入式領域,實現(xiàn)高能效的CNN加速器已成為研究熱點。本文基于卷積神經(jīng)網(wǎng)絡的算法結構特征,通過研究并優(yōu)化了基于近似計算與數(shù)據(jù)調(diào)度的架構設計,在滿足不同應用場景與應用需求的情況下,盡可能降低CNN加速器的功耗。首先,通過對卷積神經(jīng)網(wǎng)絡的冗余性和容錯性特征進行分析,對網(wǎng)絡參數(shù)采用分層量化壓縮的預處理方案,實現(xiàn)計算功耗與訪存量降低的效果。然后,基于已預處理的權重數(shù)據(jù),實現(xiàn)不同分層位寬的近似計算,解決了卷積運算乘法功耗大的問題;另一方面,基于卷積運算的數(shù)據(jù)重用軌跡研究,在運算陣列上提出多輸出加法樹路由互聯(lián)結構,與陣列緊耦合的存儲采用了乒乓緩存結構,對不同尺寸卷積運算,實現(xiàn)了高效靈活的映射方案;然后,通過基于大尺寸矩陣切割優(yōu)化及調(diào)節(jié)陣列供給電壓,解決了存儲和計算陣列之間的數(shù)據(jù)不平衡問題,從而實現(xiàn)高能效的CNN加速器數(shù)據(jù)調(diào)度設計。在TSMC 45nm工藝下,針對不同的卷積神經(jīng)... 

【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:75 頁

【學位級別】:碩士

【部分圖文】:

基于近似計算與數(shù)據(jù)調(diào)度的CNN加速器設計與優(yōu)化


迭代對數(shù)乘法器仿真波形

波形圖,功能仿真,陣列,波形圖


計算陣列的功能仿真波形圖

【參考文獻】:
期刊論文
[1]超越隱主題包模型:針對場景類別識別的空間金字塔匹配(英文)[J]. Fu-xiang LU,Jun HUANG.  Frontiers of Information Technology & Electronic Engineering. 2015(10)

碩士論文
[1]基于FPGA的深度學習加速器設計與實現(xiàn)[D]. 余奇.中國科學技術大學 2016



本文編號:3542025

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3542025.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶69a90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com