天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

一種支持優(yōu)化分塊策略的矩陣乘加速器設(shè)計

發(fā)布時間:2017-09-15 03:09

  本文關(guān)鍵詞:一種支持優(yōu)化分塊策略的矩陣乘加速器設(shè)計


  更多相關(guān)文章: FPGA 非均勻矩陣 矩陣乘法 分塊策略


【摘要】:在許多應(yīng)用領(lǐng)域中,大規(guī)模浮點矩陣乘法往往是最耗時的計算核心之一。在新興的應(yīng)用中經(jīng)常存在至少有一個維度很小的大規(guī)模矩陣,我們把具備這種特性的矩陣稱為非均勻矩陣。由于FPGA上用以存儲中間結(jié)果的片上存儲器容量十分有限,計算大規(guī)模矩陣乘法時往往需要將矩陣劃分成細粒度的子塊計算任務(wù)。當(dāng)加速非均勻矩陣乘法時,由于只支持固定分塊大小,大多數(shù)現(xiàn)有的線性陣列結(jié)構(gòu)的硬件矩陣乘法器將遭受很大的性能下降。為了解決這個問題,提出了一種有效的優(yōu)化分塊策略。在此基礎(chǔ)上,在Xilinx公司的Zynq XC7Z045FPGA芯片上實現(xiàn)了一個支持可變分塊的矩陣乘法器。通過集成224個處理單元,該矩陣乘法器在150 MHz的時鐘頻率下對于實際應(yīng)用中的非均勻矩乘達到了48GFLOPS的實測性能,而所需帶寬僅為4.8GB/s。實驗結(jié)果表明,我們提出的分塊策略相比于傳統(tǒng)的分塊算法實現(xiàn)了高達12%的性能提升。
【作者單位】: 國防科學(xué)技術(shù)大學(xué)計算機學(xué)院;
【關(guān)鍵詞】FPGA 非均勻矩陣 矩陣乘法 分塊策略
【基金】:國家863計劃(2012AA012706) 國家自然科學(xué)基金(61272145)
【分類號】:TP332.22
【正文快照】: 1引言隨著半導(dǎo)體制造工藝的發(fā)展以及集成電路技術(shù)的進步,單芯片上集成了越來越多的晶體管,當(dāng)前FPGA芯片提供了專用的算術(shù)模塊、大量的邏輯資源和存儲資源,以及外部存儲器接口、網(wǎng)絡(luò)接口、外圍接口等,已成為加速應(yīng)用的一種重要方式[1]。浮點矩陣乘運算廣泛存在于現(xiàn)代應(yīng)用中,如

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前8條

1 紀(jì)坤;陳建平;石振國;劉維富;;矩陣三角分解分塊算法的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2010年09期

2 鐘聲偉;關(guān)于診斷G矩陣分塊獨立處理的探討[J];長安大學(xué)學(xué)報(自然科學(xué)版);1993年04期

3 杜偉章,任春麗;關(guān)于“逆p.n.p.矩陣的表征”的注記[J];西安電子科技大學(xué)學(xué)報;1996年04期

4 馮健;倪明;趙建波;;一種基于分布式平臺Hadoop的矩陣相乘算法[J];計算機系統(tǒng)應(yīng)用;2013年12期

5 遲學(xué)斌;分布式系統(tǒng)矩陣并行計算[J];數(shù)值計算與計算機應(yīng)用;1997年04期

6 吳飛;金士堯;;并行優(yōu)化矩陣運算的探索[J];計算機工程與科學(xué);1992年02期

7 張會凌;命題邏輯判定系統(tǒng)中基本真值矩陣的生成算法[J];甘肅聯(lián)合大學(xué)學(xué)報(自然科學(xué)版);2005年01期

8 ;[J];;年期

中國重要會議論文全文數(shù)據(jù)庫 前2條

1 支希哲;孟光;顧致平;;穩(wěn)定性判定陣的分塊確定法[A];1995中國控制與決策學(xué)術(shù)年會論文集[C];1995年

2 吳柏生;李正光;;結(jié)構(gòu)布局修改的重分析方法[A];第九屆全國結(jié)構(gòu)工程學(xué)術(shù)會議論文集第Ⅱ卷[C];2000年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 黃澤軍;關(guān)于矩陣組合分析性質(zhì)的若干結(jié)果[D];華東師范大學(xué);2011年

2 沈長鵬;訂單結(jié)構(gòu)與揀選系統(tǒng)的適配問題研究[D];山東大學(xué);2011年

3 申淑謙;特殊矩陣數(shù)值分析和鞍點問題迭代求解預(yù)處理技術(shù)[D];電子科技大學(xué);2008年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條

1 陳磊;面向多核DSP的高性能并行BLAS3的設(shè)計與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年

2 曾侃圢;基于電阻矩陣定位原理的潰壩模型試驗測量技術(shù)研究[D];重慶交通大學(xué);2015年

3 劉真;基于用戶評分矩陣分塊的魯棒推薦模型研究[D];燕山大學(xué);2013年

4 黃榮;幾類分塊組合選取因子法的非奇H-矩陣判定[D];湘潭大學(xué);2005年

5 符和滿;符號空間一類稠密混沌系統(tǒng)的矩陣刻畫[D];華南師范大學(xué);2005年

6 樓Z蟍;M-矩陣等特殊矩陣及其特殊積[D];陜西師范大學(xué);2004年

7 杜翠真;五階完全正矩陣[D];安徽大學(xué);2005年

8 陳一昭;并行計算在矩陣運算中的應(yīng)用[D];昆明理工大學(xué);2011年

9 張曉青;關(guān)于SDD~+矩陣和H-矩陣算法的研究[D];電子科技大學(xué);2006年

,

本文編號:853941

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/853941.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50939***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
绝望的校花花间淫事2| 国产男女激情在线视频| 麻豆91成人国产在线观看| 五月天丁香婷婷狠狠爱| 欧美日韩精品综合在线| 色婷婷成人精品综合一区| 久久一区内射污污内射亚洲| 亚洲婷婷开心色四房播播| 五月婷婷综合缴情六月| 欧美日韩亚洲巨色人妻| 欧美综合色婷婷欧美激情| 99精品人妻少妇一区二区人人妻| 色婷婷视频在线精品免费观看| 亚洲淫片一区二区三区| 久久成人国产欧美精品一区二区 | 99久久免费看国产精品| 九九九热在线免费视频| 日韩一区二区免费在线观看| 神马午夜福利一区二区| 又色又爽又黄的三级视频| 国产免费一区二区不卡| 亚洲高清中文字幕一区二区三区| 深夜福利欲求不满的人妻| 亚洲国产性生活高潮免费视频| 欧美国产日产在线观看| 欧美日韩乱码一区二区三区| 亚洲中文字幕在线视频频道| 熟妇人妻av中文字幕老熟妇| 91亚洲国产日韩在线| 欧美国产亚洲一区二区三区| 欧美三级精品在线观看| 中文字幕一区二区三区大片| 成人国产激情在线视频| 亚洲天堂一区在线播放| 欧美不卡高清一区二区三区| 日本免费一本一二区三区| 午夜福利在线观看免费| 在线免费国产一区二区三区| 好东西一起分享老鸭窝| 国产精品一区二区视频| 五月婷婷六月丁香在线观看|