天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 電子信息論文 >

基于FPGA加速器的SSD目標檢測技術研究與實現(xiàn)

發(fā)布時間:2021-02-17 19:02
  近年來眾多的研究工作已經(jīng)表明神經(jīng)網(wǎng)絡(Neural Network,NN)相較于傳統(tǒng)算法有著顯著的優(yōu)勢,其已經(jīng)被廣泛應用于圖像、語音和視頻識別等領域。但是由于神經(jīng)網(wǎng)絡對硬件平臺的算力和存儲需求巨大,導致實際應用存在困難,F(xiàn)有的CPU平臺無法提供足夠的算力支持,而GPU平臺由于有著很高的計算力和易用的開發(fā)框架成為神經(jīng)網(wǎng)絡的首選平臺。同時,基于FPGA的神經(jīng)網(wǎng)絡加速器也是目前研究的熱點,經(jīng)過特定的硬件設計,FPGA往往可以擁有超過GPU的處理速度,同時兼顧能效比。本文在此背景下,以自動駕駛領域?qū)囕v、行人的實時檢測需求為切入點,探索和研究了神經(jīng)網(wǎng)絡目標檢測算法在FPGA上的并行加速方法。本文首先研究了神經(jīng)網(wǎng)絡目標檢測算法和基于FPGA的神經(jīng)網(wǎng)絡加速器。然后以SSD(Single Shot MultiBox Detector)目標檢測算法和ResNet(Deep Residual Network)網(wǎng)絡為基礎,設計了ResNet18-SSD模型,該模型既保持了VGG-SSD模型準確度,也有效降低了計算和儲存復雜度。針對該模型的推理(Inference)過程,本文設計了基于兩片Xilinx VU... 

【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:95 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
縮略語對照表
第一章 緒論
    1.1 選題背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基于卷積神經(jīng)網(wǎng)絡的目標檢測算法發(fā)展現(xiàn)狀
        1.2.2 神經(jīng)網(wǎng)絡硬件加速器發(fā)展現(xiàn)狀
    1.3 論文主要研究內(nèi)容和組織結(jié)構(gòu)
第二章 Res Net18-SSD算法分析和FPGA硬件加速方法
    2.1 Res Net18-SSD算法分析
        2.1.1 Res Net網(wǎng)絡
        2.1.2 SSD目標檢測算法
        2.1.3 Res Net18-SSD算法拓撲結(jié)構(gòu)
    2.2 基于FPGA的神經(jīng)網(wǎng)絡加速方法
        2.2.1 數(shù)據(jù)量化
        2.2.2 基本計算單元設計
        2.2.3 循環(huán)展開方式
        2.2.4 系統(tǒng)級設計和優(yōu)化
    2.3 本章小結(jié)
第三章 基于FPGA的Res Net18-SSD算法加速方案
    3.1 加速方案整體設計思路
    3.2 數(shù)據(jù)的INT8量化
    3.3 單層卷積硬件設計
        3.3.1 基本計算單元的硬件實現(xiàn)
        3.3.2 循環(huán)展開和數(shù)據(jù)復用
        3.3.3 數(shù)據(jù)流計算及量化方式
    3.4 Res Net旁路層硬件設計
    3.5 pooling層硬件設計
    3.6 sum層硬件設計
    3.7 priorbox層和decodeBBoxes層硬件設計
    3.8 本章小結(jié)
第四章 基于FPGA的加速方案實現(xiàn)與系統(tǒng)驗證
    4.1 開發(fā)平臺搭建
        4.1.1 硬件平臺
        4.1.2 軟件平臺
    4.2 FPGA加速方案整體實現(xiàn)
        4.2.1 PCIe模塊實現(xiàn)
        4.2.2 核心算法實現(xiàn)
        4.2.3 QSFP模塊實現(xiàn)
        4.2.4 上位機程序?qū)崿F(xiàn)
        4.2.5 實際系統(tǒng)展示
    4.3 整體系統(tǒng)驗證與分析
        4.3.1 正確性驗證
        4.3.2 檢測效果
        4.3.3 檢測速度
        4.3.4 時序分析和資源占用率
        4.3.5 功耗
        4.3.6 與其他工作對比
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 工作總結(jié)
    5.2 研究展望
參考文獻
致謝
作者簡介


【參考文獻】:
碩士論文
[1]基于FPGA的卷積神經(jīng)網(wǎng)絡并行加速體系架構(gòu)的研究[D]. 殷偉.西安電子科技大學 2018



本文編號:3038392

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3038392.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶40d03***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com