天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于OpenCL的深度學(xué)習(xí)目標檢測算法加速方法研究

發(fā)布時間:2020-12-26 12:24
  隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)的目標檢測算法也取得了令人矚目的成就,甚至達到了實際應(yīng)用的性能指標。然而,卷積神經(jīng)網(wǎng)絡(luò)具有極高的計算復(fù)雜度,傳統(tǒng)的CPU無法滿足實時性需求。于是,GPU作為通用計算單元被用于加速卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測試,但其高能耗不能滿足嵌入式應(yīng)用的需求。FPGA作為可重構(gòu)邏輯器件,其低功耗的特點使其在邊緣端應(yīng)用部署上具有明顯優(yōu)勢。同時,其低延時的特性也使其很適合執(zhí)行云端流式任務(wù)。因此基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)加速器設(shè)計成為一個研究熱點。然而,面向目標檢測應(yīng)用的FPGA加速器研究目前還比較少。本文基于OpenCL異構(gòu)計算框架,設(shè)計了一種可擴展的深度學(xué)習(xí)目標檢測FPGA加速架構(gòu)。該架構(gòu)可高效地實現(xiàn)YOLOv2算法的硬件加速,也可適用于其他網(wǎng)絡(luò)模型,對不同設(shè)備也具有很好的遷移性。其中,通過多個內(nèi)核級聯(lián)形成的深度流水線能有效緩解帶寬壓力;三個并行度的設(shè)計能滿足高計算密集任務(wù)的需求;基于折疊行緩存的數(shù)據(jù)緩存區(qū)設(shè)計能為架構(gòu)高吞吐率的實現(xiàn)提供支持。此外,本文基于硬件設(shè)計的思想,提出了一系列深度學(xué)習(xí)目標檢測算法的改進方法。其中,對全網(wǎng)絡(luò)進行的8bit定點數(shù)量化,以及對卷積、批... 

【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于OpenCL的深度學(xué)習(xí)目標檢測算法加速方法研究


目標檢測算法最佳性能總覽同c)MSCOCOFlgurel·1Overviewofthes公

均勻分布,激活函數(shù),導(dǎo)數(shù),函數(shù)


函數(shù)和ReLU系列函數(shù)不存在這樣的問題,目前仍被廣泛使用。其中,ELU函數(shù)??是sigmoid函數(shù)和ReLU函數(shù)相結(jié)合的產(chǎn)物,其輸入均值接近零值,能加速收斂,??如圖2-2?b)所示。ReLU存在dead?ReLU問題,即某些神經(jīng)元的參數(shù)永遠不會被更??新。Leaky?ReLU增加了負值斜率,改進了?ReLU的這一問題。PReLU和RReLU??都是對Leaky?ReLU的改進。PReLU中負值部分的斜率根據(jù)數(shù)據(jù)來定,而非預(yù)先??定義。RReLU中負值部分的斜率在訓(xùn)練過程中按均勻分布隨機抽取,在測試時為??定值。ReLU和Leaky?ReLU的函數(shù)及其導(dǎo)數(shù)形式如圖2-2?c)和d)所示。??f(x)?!???/??f'{x)?f?w?丨?/??■■? ̄i—-?乂?????1?.......Z'二-二::二二?-3X1?-2.5?-2S3?-1_5?-J.??-0^^?0.5?15?2.0?2S?3!??-30?-25?-2.0?-1^?-1.0?-0.5?0_5?1.0?1.S?2.0?2.5?3.??,??*1D???0-5?]??-13??a)?Sigmoid?b)?ELU??f(x)?31?/?fW?'I?/??"x)?25!?/?f,w?,?Z??2.0?|?Z?2.0:?Z??H?/?

特征圖,歸一化方法,歸一化,風(fēng)格化


深度學(xué)習(xí)目標檢測算法原理??在圖像風(fēng)格化中,生成結(jié)果主要依賴于單個圖像實例,所以BN對批量進行歸??一化的方法不適合圖像風(fēng)格化應(yīng)用。如圖2-3?c)所示,IN是針對每個實例的每個通??道進行的歸一化。它根據(jù)特征圖中每個通道上的一個面來計算均值和方差。??#?%??c)?Instance?Norm?d)?Group?Norm??圖2-3歸一化方法%??Figure?2-3?Normalization?methods?[57】??(5)

【參考文獻】:
期刊論文
[1]面向卷積神經(jīng)網(wǎng)絡(luò)的FPGA設(shè)計[J]. 盧麗強,鄭思澤,肖傾城,陳德銘,梁云.  中國科學(xué):信息科學(xué). 2019(03)
[2]深度學(xué)習(xí)FPGA加速器的進展與趨勢[J]. 吳艷霞,梁楷,劉穎,崔慧敏.  計算機學(xué)報. 2019(11)

碩士論文
[1]基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)加速方法研究及實現(xiàn)[D]. 仇越.江南大學(xué) 2018
[2]FPGA加速卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的研究與實現(xiàn)[D]. 魏小淞.西安電子科技大學(xué) 2018
[3]基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)并行加速體系架構(gòu)的研究[D]. 殷偉.西安電子科技大學(xué) 2018
[4]面向大數(shù)據(jù)的CPU/GPU/FPGA計算平臺研究[D]. 黃海洋.電子科技大學(xué) 2017



本文編號:2939692

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2939692.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶021da***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com