天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于加速算法及稀疏化卷積神經(jīng)網(wǎng)絡(luò)加速方案研究與設(shè)計

發(fā)布時間:2022-10-20 20:50
  卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNNs)因其極大地提高了圖像識別的準(zhǔn)確率,而在圖像處理領(lǐng)域受到追捧。但是卷積神經(jīng)網(wǎng)絡(luò)帶來了大量卷積操作,其計算成本往往令人難以接受。為了加快執(zhí)行速度,學(xué)術(shù)界提出了多種解決方案。解決方案主要從兩方面出發(fā),一是加速算法,利用高效的卷積加速算法處理卷積層,提升執(zhí)行速度。然而,每種算法都有其優(yōu)點和缺點,并且沒有一種算法可以處理所有情況。第二便是使用硬件加速器,定制加速卷積運算。但目前定制硬件加速器多主要采用傳統(tǒng)的卷積算法,并且缺乏對神經(jīng)網(wǎng)絡(luò)稀疏性的支持,從而喪失了進(jìn)一步改進(jìn)硬件,提升硬件性能的空間。針對目前這兩種方案的缺陷,本文首先提出了應(yīng)對算法特性各異的解決辦法。本課題研究了GPU環(huán)境下各種算法的性能,充分探索不同數(shù)據(jù)結(jié)構(gòu)參數(shù)對算法性能的影響,包括執(zhí)行速度,占用顯存和功耗/能耗隨參數(shù)變化情況。同時深入到GPU底層,跟蹤計算過程中調(diào)用的內(nèi)核函數(shù),從而概括總結(jié)這些算法的特性。最后,根據(jù)實驗結(jié)果,總結(jié)每種算法的適用條件,從而設(shè)計了優(yōu)化算法調(diào)度策略。該策略為卷積神經(jīng)網(wǎng)絡(luò)中不同數(shù)據(jù)結(jié)構(gòu)參數(shù)的卷積層分配最優(yōu)算法。使用該策略,在G... 

【文章頁數(shù)】:73 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 課題背景及研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 算法研究現(xiàn)狀
        1.2.2 加速平臺研究現(xiàn)狀
    1.3 研究內(nèi)容
    1.4 本文組織架構(gòu)
第二章 相關(guān)理論概述
    2.1 卷積神經(jīng)網(wǎng)絡(luò)介紹
    2.2 神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)及參數(shù)
    2.3 卷積加速算法
        2.3.1 直接算法
        2.3.2 通用矩陣乘算法及其改進(jìn)
        2.3.3 快速傅里葉變換算法
        2.3.4 Winograd算法
    2.4 稀疏網(wǎng)絡(luò)
        2.4.1 網(wǎng)絡(luò)剪枝
        2.4.2 數(shù)據(jù)量化
        2.4.3 稀疏Winograd算法
    2.5 本章小結(jié)
第三章 加速算法性能分析與調(diào)度方案設(shè)計
    3.1 實驗方法與實驗環(huán)境
    3.2 加速算法性能對比
        3.2.1 處理批次影響
        3.2.2 輸入尺寸影響
        3.2.3 卷積核數(shù)目影響
        3.2.4 卷積核尺寸影響
        3.2.5 跨步影響
    3.3 加速算法性能瓶頸分析
        3.3.1 通用矩陣乘算法分析
        3.3.2 快速傅里葉變換算法分析
        3.3.3 Winograd算法分析
        3.3.4 直接算法分析
        3.3.5 各個算法功耗分析
    3.4 優(yōu)化算法調(diào)度策略設(shè)計
    3.5 優(yōu)化算法調(diào)度策略實驗評估
        3.5.1 實驗方法
        3.5.2 實驗環(huán)境
        3.5.3 實驗結(jié)果
    3.6 本章小結(jié)
第四章 硬件加速器設(shè)計
    4.1 設(shè)計方案簡介
    4.2 加速器運算模塊設(shè)計
        4.2.1 壓縮編碼
        4.2.2 運算單元
    4.3 加速器buffer模塊設(shè)計
    4.4 加速器性能分析
    4.5 加速器性能評估
        4.5.1 實驗方法
        4.5.2 實驗環(huán)境
        4.5.3 實驗結(jié)果與分析
    4.6 本章小結(jié)
第五章 總結(jié)與展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果



本文編號:3695280

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3695280.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a64ba***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com