天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

低功耗高性能的卷積神經(jīng)網(wǎng)絡(luò)硬件加速器設(shè)計(jì)

發(fā)布時(shí)間:2020-04-10 00:22
【摘要】:卷積神經(jīng)網(wǎng)絡(luò)(Convolution neural networks,CNN)因其在圖像識(shí)別、語音識(shí)別和無人駕駛等方面具有的卓越性能而被國內(nèi)外廣泛研究。隨著其性能和精度的提升,CNN的層數(shù)和計(jì)算量顯著上升。經(jīng)過線性整流函數(shù)后,CNN含有超過50%的零值數(shù)據(jù)。零值數(shù)據(jù)的計(jì)算不會(huì)改變計(jì)算結(jié)果,但是它消耗較高的能耗和計(jì)算周期。因此,零值數(shù)據(jù)的非還原壓縮方法和壓縮數(shù)據(jù)的復(fù)用方法成為目前急需解決的問題。本文以此為研究對(duì)象,從以下三個(gè)方面開展研究工作:(1)多路徑包連接電路提升傳輸效率;(2)非還原壓縮的編譯碼方法降低功耗和計(jì)算周期;(3)編碼行復(fù)用方法提升數(shù)據(jù)的利用效果;(4)基于低功耗高性能的CNN硬件加速器的設(shè)計(jì)。主要工作有:(1)設(shè)計(jì)多路徑包連接電路針對(duì)傳統(tǒng)包連接電路(Packet connect circuit,PCC)的(X,Y)路由算法導(dǎo)致的多播傳輸?shù)墓?jié)點(diǎn)數(shù)量少、傳輸效率低,不能同時(shí)實(shí)現(xiàn)多種傳輸方式等情況,以及無法滿足CNN每一層傳輸數(shù)據(jù)量大、傳輸方式復(fù)雜的要求,本文設(shè)計(jì)多路徑包連接電路提升傳輸效率。多路徑包連接電路采用兩條多播輸入通道和一條單播輸出通道實(shí)現(xiàn)數(shù)據(jù)的輸入-計(jì)算-輸出的相互獨(dú)立,結(jié)合多播和路由接收模塊的判斷機(jī)制實(shí)現(xiàn)多種傳輸方式。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)PCC相比,通道建立時(shí)間降低60.4%,數(shù)據(jù)包傳輸時(shí)間提升2.53x。(2)設(shè)計(jì)非還原壓縮的編譯碼方法針對(duì)傳統(tǒng)編譯碼方法在CNN領(lǐng)域中壓縮率低,傳輸和計(jì)算時(shí)的再還原,以及零值在計(jì)算中仍無法實(shí)際跳過等情況,本文設(shè)計(jì)非還原壓縮的編譯碼方法并實(shí)現(xiàn)其硬件化設(shè)計(jì)。編碼時(shí),該方法根據(jù)卷積計(jì)算的特性,對(duì)輸入數(shù)據(jù)的每一行進(jìn)行0/1編碼,保留每行有效值個(gè)數(shù),提升壓縮率;在譯碼時(shí),該方法根據(jù)有效值個(gè)數(shù)將編碼與對(duì)應(yīng)的有效值發(fā)送進(jìn)入計(jì)算單元,計(jì)算單元根據(jù)編碼進(jìn)行移位譯碼計(jì)算,達(dá)到跳過零計(jì)算的目的,提升計(jì)算速度。實(shí)驗(yàn)結(jié)果表明,總的壓縮率達(dá)到58.91%,其中,單層最高的壓縮率達(dá)到48.64%。(3)設(shè)計(jì)編碼行復(fù)用方法針對(duì)目前尚未有對(duì)壓縮數(shù)據(jù)進(jìn)行數(shù)據(jù)復(fù)用方法的情況,本文提出編碼行復(fù)用方法。該方法充分挖掘壓縮數(shù)據(jù)的數(shù)據(jù)量低的優(yōu)點(diǎn),利用卷積核在輸入特征圖向下滑動(dòng)過程中產(chǎn)生的行數(shù)據(jù)復(fù)用,采用分時(shí)復(fù)用方式提升編碼數(shù)據(jù)的利用率。實(shí)驗(yàn)結(jié)果表明,與Eyeriss的固定行復(fù)用相比,片外存儲(chǔ)的讀寫次數(shù)降低45%。(4)設(shè)計(jì)低功耗高性能的CNN硬件加速器根據(jù)多路徑包連接電路、非還原壓縮編譯碼方法、編碼行復(fù)用方法,本文設(shè)計(jì)低功耗高性能的CNN硬件加速器,設(shè)計(jì)多路徑包連接電路、編碼電路、控制電路、發(fā)送電路、計(jì)算電路,使用配置鏈配置每一層卷積的計(jì)算參數(shù)。實(shí)驗(yàn)結(jié)果表明,計(jì)算速度與Eyeriss相比,加速比為14.8x。
【圖文】:

與非,零值,復(fù)用方式,數(shù)據(jù)類型


圖 2.3AlexNet 中 0 與非 0 在每一層的分布Fig 2.3 Distribution of zero and non-zero in each layer in AlexNet計(jì)算并不會(huì)對(duì)最終的結(jié)果產(chǎn)生影響,因此在整個(gè)計(jì)算中,含忽略;同時(shí)零值會(huì)需要額外的存儲(chǔ)空間,增加硬件的成本產(chǎn)生額外的周期消耗,,因此零值的優(yōu)化將會(huì)為 CNN 硬件化。用方式據(jù)其計(jì)算中的數(shù)據(jù)類型分成三種復(fù)用方式:輸入復(fù)用、輸圖 2.4 所示。n...psum sumn

低功耗高性能的卷積神經(jīng)網(wǎng)絡(luò)硬件加速器設(shè)計(jì)


Eyeriss結(jié)構(gòu)
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP183;TP332

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張啟英;劉亞剛;張淑艷;朱娟;;基于FPGA的硬件加速器設(shè)計(jì)的研究與應(yīng)用[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年17期

2 王穎;;Achronix發(fā)布全球首款Speedcore嵌入式FPGA IP產(chǎn)品[J];中國電子商情(基礎(chǔ)電子);2016年11期

3 王繼東;張會(huì)生;范忠亮;;基于NEDA算法的二維DCT硬件加速器的設(shè)計(jì)實(shí)現(xiàn)[J];微電子學(xué)與計(jì)算機(jī);2008年05期

4 查羿;潘紅兵;;一種負(fù)載均衡的LSTM硬件加速器設(shè)計(jì)[J];南京大學(xué)學(xué)報(bào)(自然科學(xué));2019年05期

5 馬宜科;常曉濤;范東睿;劉志勇;;混合體系結(jié)構(gòu)中有狀態(tài)硬件加速器的優(yōu)化[J];計(jì)算機(jī)學(xué)報(bào);2011年07期

6 Paul Beckmann;;利用硬件加速器提高處理器的性能[J];今日電子;2008年11期

7 Noam Shendar;;Java軟件解決方案是怎樣勝過硬件加速器的?[J];集成電路應(yīng)用;2005年06期

8 沈陽;王倩;王亞男;王磊;;深度學(xué)習(xí)硬件方案綜述[J];廣播電視信息;2017年10期

9 黃海峰;;半導(dǎo)體創(chuàng)新傳喜訊:Achronix推出eFPGA IP產(chǎn)品[J];通信世界;2016年27期

10 徐向權(quán);王正彥;范延濱;;基于FPGA的一種μC/OS-Ⅱ硬件加速器設(shè)計(jì)[J];青島大學(xué)學(xué)報(bào)(工程技術(shù)版);2017年04期

相關(guān)會(huì)議論文 前1條

1 李文杰;姚相同;崔明月;黃凱;;OpenCL在FPGA上的實(shí)現(xiàn)和性能分析[A];第十屆全國信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議�?痆C];2016年

相關(guān)重要報(bào)紙文章 前1條

1 黃漢賓;FPGA(現(xiàn)場(chǎng)可編程門陣列)[N];人民郵電;2017年

相關(guān)博士學(xué)位論文 前2條

1 谷曉忱;并行蒙特卡羅計(jì)算硬件加速器的關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年

2 谷會(huì)濤;視頻和圖像處理中像素匹配運(yùn)算的加速技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 王剛;基于SOPC的Smith-Waterman算法硬件加速器的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2019年

2 張永亮;低功耗高性能的卷積神經(jīng)網(wǎng)絡(luò)硬件加速器設(shè)計(jì)[D];合肥工業(yè)大學(xué);2019年

3 于敬巨;高性能硬件加速器的實(shí)現(xiàn)[D];合肥工業(yè)大學(xué);2017年

4 付志康;Sobel硬件加速器設(shè)計(jì)[D];北方工業(yè)大學(xué);2016年

5 王振;LTE終端加解密硬件加速器的研究與設(shè)計(jì)[D];西安科技大學(xué);2012年

6 薄一帆;高能效混合浮點(diǎn)FFT硬件加速器架構(gòu)與VLSI實(shí)現(xiàn)研究[D];復(fù)旦大學(xué);2014年

7 劉恒;面向多重需求的靈活可配的哈希算法硬件加速器研究[D];浙江大學(xué);2016年

8 桑圣鋒;實(shí)時(shí)操作系統(tǒng)硬件加速器SoC系統(tǒng)的深亞微米ASIC實(shí)現(xiàn)[D];山東科技大學(xué);2011年

9 雷雪;通訊終端安全層中加密算法的硬件實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年

10 賀獻(xiàn)輝;使用UML2.0的可重構(gòu)多媒體硬件加速器設(shè)計(jì)與分析[D];上海交通大學(xué);2007年



本文編號(hào):2621477

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2621477.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8ecf4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美激情一区二区亚洲专区| 老司机精品视频在线免费看| 日本一区二区三区黄色| 精品一区二区三区人妻视频| 乱女午夜精品一区二区三区| 欧美日韩亚洲国产综合网 | 久久热九九这里只有精品| 国产亚洲午夜高清国产拍精品| 午夜国产福利在线播放| 日本在线高清精品人妻| 国产麻豆精品福利在线| 亚洲精品福利入口在线| 在线免费国产一区二区| 日韩免费成人福利在线| 精品人妻一区二区三区四在线| 国产精品久久精品毛片| 日韩精品成区中文字幕| 狠狠做深爱婷婷久久综合| 精品人妻一区二区三区免费看| 大伊香蕉一区二区三区| 国产传媒免费观看视频| 日本高清中文精品在线不卡| 在线免费不卡亚洲国产| 好吊妞在线免费观看视频| 丰满少妇被猛烈插入在线观看| 国产超碰在线观看免费| 日本东京热加勒比一区二区| 亚洲深夜精品福利一区| 人体偷拍一区二区三区| 丝袜人妻夜夜爽一区二区三区| 久久99精品国产麻豆婷婷洗澡| 91天堂素人精品系列全集| 不卡视频免费一区二区三区| 国内午夜精品视频在线观看| 欧美日韩精品一区免费| 色婷婷人妻av毛片一区二区三区| 欧美尤物在线视频91| 一级片黄色一区二区三区| 亚洲精品成人午夜久久| 精品伊人久久大香线蕉综合| 国产超碰在线观看免费|