天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 電子信息論文 >

基于FPGA的深度學習算法加速

發(fā)布時間:2022-11-01 22:23
  在近些年,深度學習算法有著飛速的發(fā)展,其核心為卷積神經網絡。卷積神經網絡應用及其廣泛,在圖像識別分類、自然語言處理、情感分析等領域均有應用。神經網絡的主要實現(xiàn)方式還是在GPU平臺上,各項指標也是在GPU上完成改進的。但是在實際應用中,經常會面臨各種低功耗的場景,此時GPU的巨大功耗成為了神經網絡算法落地的障礙。神經網絡一個很重要的應用領域是目標檢測,在目標檢測算法中,YOLOV2(You Only Look Once)是一個極具代表性的算法,其結構簡單,檢測速度非?。由于在低功耗場景下的特殊需求,神經網絡在嵌入式設備上也有很多的應用,但是有傳統(tǒng)的嵌入式設備絕大部分是基于ARM的平臺,神經網絡在ARM上部署時存在的依據(jù)巨大的問題就是算力不足的問題,所以基于FPGA的硬件加速平臺就應運而生了。FPGA由于其獨特的架構,被廣泛應用于實時信號處理、圖像處理等領域,其并行性也為卷積運算提供了巨大的算力。本文中采用YOLOV2來做為核心算法,先分析了YOLOV2的原理,然后根據(jù)其原理來對算法中的參數(shù)進行量化,以減少運算和傳輸?shù)膸捪?從而加速算法。本設計中,采用ZYNQ系列的FPGA芯片進行算... 

【文章頁數(shù)】:77 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 課題研究的背景及意義
    1.2 課題研究的現(xiàn)狀
    1.3 論文的主要工作和章節(jié)安排
第二章 深度學習算法原理及其硬件實現(xiàn)
    2.1 深度學習算法的簡介
    2.2 從線性回歸到深度神經網絡
    2.3 深度學習算法的結構
        2.3.1 卷積層
        2.3.2 激活函數(shù)
        2.3.3 Normalization層
        2.3.4 Pooling層
        2.3.5 全連接層
    2.4 典型深度學習網絡
        2.4.1 AlexNet
        2.4.2 VGG16
        2.4.3 ResNets
        2.4.4 GoogleNet
        2.4.5 ZF Net
    2.5 深度學習硬件實現(xiàn)
        2.5.1 GPU實現(xiàn)
        2.5.2 ASIC實現(xiàn)
        2.5.3 FPGA實現(xiàn)
    2.6 本章小結
第三章 YOLOV2 算法加速研究
    3.1 YOLOV2 算法的基本理論
        3.1.1 YOLOV2 概述
        3.1.2 算法原理
        3.1.3 網絡結構
        3.1.4 網絡特點
    3.2 網絡數(shù)據(jù)的量化
        3.2.1 量化權重數(shù)據(jù)
        3.2.2 量化偏移數(shù)據(jù)
    3.3 硬件架構優(yōu)化
        3.3.1 運算結構優(yōu)化
        3.3.2 緩存優(yōu)化
    3.4 本章小結
第四章 硬件加速實現(xiàn)與結果分析
    4.1 FPGA基本結構
    4.2 ZCU104 開發(fā)平臺介紹
        4.2.1 ZCU104 硬件平臺介紹
    4.3 PYNQ開發(fā)框架介紹
    4.4 HLS加速基本理論
        4.4.1 HLS開發(fā)流程
        4.4.2 HLS開發(fā)優(yōu)勢
    4.5 加速IP的 HLS實現(xiàn)
        4.5.1 層內并行化實現(xiàn)
        4.5.2 循環(huán)優(yōu)化實現(xiàn)
        4.5.3 數(shù)組優(yōu)化實現(xiàn)
    4.6 硬件系統(tǒng)的構建
        4.6.1 PL部分實現(xiàn)
        4.6.2 軟硬件系統(tǒng)實現(xiàn)
    4.7 結果分析
    4.8 本章小結
第五章 總結與展望
    5.1 全文總結
    5.2 工作展望
致謝
參考文獻
攻讀碩士學位期間取得的成果


【參考文獻】:
期刊論文
[1]加速云:用FPGA提高AI計算力,用IP庫降低開發(fā)難度[J]. 單祥茹.  中國電子商情(基礎電子). 2018(05)
[2]基于異構多核并行加速的嵌入式神經網絡人臉識別方法[J]. 高放,黃樟欽.  計算機科學. 2018(03)
[3]基于FPGA的卷積神經網絡Softmax層實現(xiàn)[J]. 李理,應三叢.  現(xiàn)代計算機(專業(yè)版). 2017(26)
[4]深度學習的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉.  計算機研究與發(fā)展. 2013(09)

博士論文
[1]基于FPGA的卷積神經網絡并行結構研究[D]. 陸志堅.哈爾濱工程大學 2013

碩士論文
[1]基于FPGA的卷積神經網絡加速方法研究及實現(xiàn)[D]. 仇越.江南大學 2018
[2]基于Zynq的深度學習圖像分類識別系統(tǒng)的設計[D]. 黃偉杰.廣東工業(yè)大學 2018
[3]基于FPGA平臺的深度學習應用研究[D]. 董振興.西安電子科技大學 2018
[4]基于FPGA的CNN自動代碼生成設計與實現(xiàn)[D]. 王江峰.天津工業(yè)大學 2018
[5]基于FPGA的卷積神經網絡關鍵技術研究與實現(xiàn)[D]. 鐘楠.北京郵電大學 2018
[6]基于HLS的Tiny-yolo卷積神經網絡加速研究[D]. 張麗麗.重慶大學 2017
[7]基于FPGA的卷積神經網絡手寫數(shù)字識別系統(tǒng)的實現(xiàn)[D]. 王小雪.北京理工大學 2016



本文編號:3700205

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3700205.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶3b24a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com