天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

可重構(gòu)宏流水加速器的研究與實現(xiàn)

發(fā)布時間:2021-11-18 00:17
  無論在科學(xué)研究領(lǐng)域還是功能應(yīng)用方面,人們對于計算機性能的要求越來越高。傳統(tǒng)處理器難以高效地處理大量特定應(yīng)用,因此需要加速器協(xié)助完成運算。硬件加速器通過空間并行的方式,采用多個處理單元協(xié)同工作加速計算,大幅度提高了性能,但是在系統(tǒng)靈活性和擴展性上有所欠缺。越來越多的研究旨在提高加速系統(tǒng)的可擴展性和靈活性,可重構(gòu)的加速器以及可擴展的加速結(jié)構(gòu)已經(jīng)成為研究熱點。本文實現(xiàn)了可重構(gòu)宏流水加速器,采用空間并行和時間并行兩種加速方式,結(jié)合高性能和可擴展性完成對多種數(shù)字信號處理算法的加速。通過在FPGA器件上的實現(xiàn)以及實驗驗證了該加速器的功能與性能,并且采用理論推導(dǎo)與實驗數(shù)據(jù)相結(jié)合的方式驗證系統(tǒng)的可擴展性。本文的創(chuàng)新點在于:提出了一種新型宏流水Systolic加速器結(jié)構(gòu),將空間并行和時間并行相結(jié)合提高系統(tǒng)吞吐率以及性能;通過算法優(yōu)化、多次復(fù)用數(shù)據(jù)降低了系統(tǒng)帶寬需求;采用可重構(gòu)方式改變加速部件結(jié)構(gòu)、實現(xiàn)對多種數(shù)字信號處理算法(浮點矩陣乘法、卷積、離散余弦變換)的高效加速。該加速器在Virtex-6 XC6VLX240T FPGA上實現(xiàn),能夠穩(wěn)定運行在200MHz的時鐘頻率并獲得51.2 GFLOPS的峰值... 

【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:83 頁

【學(xué)位級別】:碩士

【部分圖文】:

可重構(gòu)宏流水加速器的研究與實現(xiàn)


天河一號超級計算機Fig1-1Tianhe-Isupercomputer

可重構(gòu)處理器,可重構(gòu),細粒度


之間的互聯(lián)方式、幾種加速器結(jié)構(gòu)等,目的在于讓讀者了解可重構(gòu)加速特點,為下文可重構(gòu)宏流水加速器的設(shè)計做好鋪墊。 可重構(gòu)計算的種類劃分上一小節(jié),我們簡單介紹了用于可重構(gòu)計算的 FPGA 器件的基本特點,論一下可重構(gòu)的種類。按照可重構(gòu)的粒度來劃分,可重構(gòu)分為兩種:細粒度(Fine-grained)可粒度(Coarse-grained)可重構(gòu)。細粒度可重構(gòu)為設(shè)計者提供了 bit 級別的任務(wù)劃分方式,并且?guī)缀鯖]有資費。當然,對于規(guī)模較大、較復(fù)雜的計算任務(wù),需要用到許多細粒度處相比可以通過粗粒度可重構(gòu)完成的計算而言,這會導(dǎo)致系統(tǒng)時鐘頻率的下BRASS 研究組設(shè)計的 Garp 可重構(gòu)處理器[12]中包含了一個 MIPS 處理器片上緩存互聯(lián)的可重構(gòu)處理單元。如圖 2-1 所示,這個可重構(gòu)模塊包含理單元 PE(Process Element)陣列。每個 PE 都可以進行可重構(gòu),因此的配置電路,這對于 FPGA 上的邏輯資源也是不小的消耗。

可重構(gòu)結(jié)構(gòu)


上海交通大學(xué)碩士學(xué)位論文度可重構(gòu)在多個 PE 之間采用總線的形式進行互聯(lián),并且每個 Pbit 級別的,而是一個計算單元 ALU、乘累加器甚至是一個 CPU。eRench 的可重構(gòu)結(jié)構(gòu)[16],如圖 2-2 所示,是一個基于 ALU 單元為主機的協(xié)處理器,PipeRench 加速器可以處理 PGP、JPEG 等常ch 的每個 ALU 通過總線的形式進行互聯(lián),并且通過插入寄存器 PipeRench 的可重構(gòu)性在于總線互聯(lián)方式的可配置。

【參考文獻】:
期刊論文
[1]CPU-GPU并行矩陣乘法的實現(xiàn)與性能分析[J]. 程豪,張云泉,張先軼,李玉成.  計算機工程. 2010(13)
[2]并行矩陣乘法算法的研究[J]. 齊景嘉,夏麗華.  黑龍江大學(xué)自然科學(xué)學(xué)報. 2006(03)
[3]分布式并行矩陣乘算法分析[J]. 陳晶,黃曙光.  兵工自動化. 2005(05)
[4]一種面向生物信息學(xué)的可重構(gòu)加速卡的設(shè)計與實現(xiàn)[J]. 張佩珩,劉新春,江先陽.  計算機研究與發(fā)展. 2005(06)

碩士論文
[1]基于PCI Express總線的可重構(gòu)加速平臺的設(shè)計和研究[D]. 孫霖.哈爾濱工程大學(xué) 2009



本文編號:3501853

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3501853.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4a44e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com