天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

基于異構(gòu)智能處理單元的自主可控人工智能處理平臺

發(fā)布時間:2021-05-25 09:38
  人工智能技術(shù)已逐步進入人們的生活,隨著網(wǎng)絡(luò)的廣泛應(yīng)用,人工智能技術(shù)已經(jīng)滲透到各行各業(yè)。隨著人工智能技術(shù)中算法的規(guī)模和復(fù)雜性不斷增加,傳統(tǒng)的計算架構(gòu)已經(jīng)難以滿足當(dāng)前海量的數(shù)據(jù)計算需求,因此,人們開始構(gòu)建新的計算架構(gòu)來提升人工智能處理平臺的性能。為了提高人工智能處理平臺的計算性能,本文首先設(shè)計了國產(chǎn)兆芯-FPGA人工智能處理平臺,本文解決了兆芯CPU與多塊DE10-Standard開發(fā)板數(shù)據(jù)傳輸?shù)膯栴},并通過硬件描述語言設(shè)計了浮點數(shù)矩陣乘法系統(tǒng),最后在此系統(tǒng)中實現(xiàn)了一組浮點矩陣的乘法運算。為了更好的利用國產(chǎn)兆芯-FPGA中硬件資源并實現(xiàn)更高的性能,本文設(shè)計了一種深度流水的OpenCL內(nèi)核加速系統(tǒng)框架,這種框架能夠跨越算法中的不同層執(zhí)行加速操作,而無需重新對FPGA進行編程。本設(shè)計主要針對YOLOv2算法中的卷積層、池化層和歸一化層進行并行加速。由于本文工作是首次針對國產(chǎn)兆芯-FPGA基于OpenCL的YOLOv2算法加速系統(tǒng)的研究,為了與其他基于高端FPGA的設(shè)計進行比較,本文分別在Xilinx Zynq-7000 FPGA的加速系統(tǒng)平臺和本文設(shè)計的加速系統(tǒng)平臺上分別進行手寫體識別的試驗,... 

【文章來源】:中國電子科技集團公司電子科學(xué)研究院北京市

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
注釋表
縮略詞
第一章 緒論
    1.1 引言
    1.2 研究意義
    1.3 研究現(xiàn)狀
        1.3.1 異構(gòu)處理平臺
        1.3.2 人工智能算法
        1.3.3 異構(gòu)編程框架
    1.4 本文研究內(nèi)容
第二章 人工智能處理平臺設(shè)計
    2.1 處理平臺整體架構(gòu)設(shè)計
    2.2 處理平臺的通信方式設(shè)計
    2.3 基于FPGA邏輯的浮點數(shù)矩陣乘法優(yōu)化設(shè)計
    2.4 本章小結(jié)
第三章 基于人工智能處理平臺的優(yōu)化算法實現(xiàn)
    3.1 YOLOv2算法簡介
    3.2 YOLOv2并行計算設(shè)計
        3.2.1 算法加速整體框架
        3.2.2 卷積層加速
        3.2.3 池化層加速
        3.2.4 歸一化層加速
    3.3 本章小結(jié)
第四章 實驗與分析
    4.1 實驗環(huán)境
    4.2 實驗方案
        4.2.1 本平臺未使用并行加速的實驗測試
        4.2.2 本平臺使用并行加速的實驗測試
        4.2.3 其他FPGA平臺加速的實驗測試
    4.3 實驗結(jié)論與分析
    4.4 本章小結(jié)
第五章 結(jié)論與展望
    5.1 研究結(jié)論
    5.2 展望
參考文獻
致謝
在學(xué)期間發(fā)表的學(xué)術(shù)論文及取得的研究成果


【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的場景數(shù)字檢出[J]. 王璠,丁軍航,徐世許.  制造業(yè)自動化. 2019(03)
[2]基于深度學(xué)習(xí)的復(fù)雜背景下茶葉嫩芽檢測算法[J]. 孫肖肖,牟少敏,許永玉,曹旨昊,蘇婷婷.  河北大學(xué)學(xué)報(自然科學(xué)版). 2019(02)
[3]基于TINY-YOLO的嵌入式人臉檢測系統(tǒng)設(shè)計[J]. 游忍,周春燕,劉明華,邵延華,展華益.  工業(yè)控制計算機. 2019(03)
[4]Attention-YOLO:引入注意力機制的YOLO檢測算法[J]. 徐誠極,王曉峰,楊亞東.  計算機工程與應(yīng)用. 2019(06)
[5]基于YOLO的小型動物識別系統(tǒng)設(shè)計[J]. 周文萱,胡龍?zhí)?張敏,方宇濤,李欣鈺.  計算機時代. 2019(03)
[6]基于流水線高斯粒子濾波的無人機姿態(tài)估計算法及FPGA實現(xiàn)[J]. 王義平,王佳輝,薛雅麗.  電光與控制. 2019(02)
[7]基于FPGA的嵌入式通信系統(tǒng)核心模塊設(shè)計[J]. 楊勝利,李超,余亮.  現(xiàn)代電子技術(shù). 2018(22)
[8]基于GPS的智能車自動駕駛系統(tǒng)的研制[J]. 李延斌,牛雷,佟賀.  電子產(chǎn)品世界. 2018(11)
[9]谷歌Tensorflow框架在自動駕駛汽車車輛識別功能中的應(yīng)用[J]. 吳麗華.  汽車實用技術(shù). 2018(20)
[10]PCB板級電路中高效散熱結(jié)構(gòu)的優(yōu)化設(shè)計[J]. 劉維紅,李丹.  半導(dǎo)體光電. 2018(05)

博士論文
[1]CPU-GPGPU共享最后一級緩存架構(gòu)中的數(shù)據(jù)共享優(yōu)化研究[D]. 俞立呈.浙江大學(xué) 2018
[2]混合異構(gòu)架構(gòu)上的生物大數(shù)據(jù)并行計算研究[D]. 蘭海東.山東大學(xué) 2018
[3]非線性協(xié)整時間序列的非參數(shù)方法及其應(yīng)用研究[D]. 舒曉惠.暨南大學(xué) 2010

碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的單目圖像深度估計研究[D]. 朱沛賢.南京郵電大學(xué) 2018
[2]基于異構(gòu)處理器的深度卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)設(shè)計與實現(xiàn)[D]. 姜典坤.北京交通大學(xué) 2018



本文編號:3205116

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3205116.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶be625***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com