一種支持優(yōu)化分塊策略的矩陣乘加速器設(shè)計
本文關(guān)鍵詞:一種支持優(yōu)化分塊策略的矩陣乘加速器設(shè)計
更多相關(guān)文章: FPGA 非均勻矩陣 矩陣乘法 分塊策略
【摘要】:在許多應(yīng)用領(lǐng)域中,大規(guī)模浮點矩陣乘法往往是最耗時的計算核心之一。在新興的應(yīng)用中經(jīng)常存在至少有一個維度很小的大規(guī)模矩陣,我們把具備這種特性的矩陣稱為非均勻矩陣。由于FPGA上用以存儲中間結(jié)果的片上存儲器容量十分有限,計算大規(guī)模矩陣乘法時往往需要將矩陣劃分成細粒度的子塊計算任務(wù)。當(dāng)加速非均勻矩陣乘法時,由于只支持固定分塊大小,大多數(shù)現(xiàn)有的線性陣列結(jié)構(gòu)的硬件矩陣乘法器將遭受很大的性能下降。為了解決這個問題,提出了一種有效的優(yōu)化分塊策略。在此基礎(chǔ)上,在Xilinx公司的Zynq XC7Z045FPGA芯片上實現(xiàn)了一個支持可變分塊的矩陣乘法器。通過集成224個處理單元,該矩陣乘法器在150 MHz的時鐘頻率下對于實際應(yīng)用中的非均勻矩乘達到了48GFLOPS的實測性能,而所需帶寬僅為4.8GB/s。實驗結(jié)果表明,我們提出的分塊策略相比于傳統(tǒng)的分塊算法實現(xiàn)了高達12%的性能提升。
【作者單位】: 國防科學(xué)技術(shù)大學(xué)計算機學(xué)院;
【關(guān)鍵詞】: FPGA 非均勻矩陣 矩陣乘法 分塊策略
【基金】:國家863計劃(2012AA012706) 國家自然科學(xué)基金(61272145)
【分類號】:TP332.22
【正文快照】: 1引言隨著半導(dǎo)體制造工藝的發(fā)展以及集成電路技術(shù)的進步,單芯片上集成了越來越多的晶體管,當(dāng)前FPGA芯片提供了專用的算術(shù)模塊、大量的邏輯資源和存儲資源,以及外部存儲器接口、網(wǎng)絡(luò)接口、外圍接口等,已成為加速應(yīng)用的一種重要方式[1]。浮點矩陣乘運算廣泛存在于現(xiàn)代應(yīng)用中,如
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前8條
1 紀(jì)坤;陳建平;石振國;劉維富;;矩陣三角分解分塊算法的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2010年09期
2 鐘聲偉;關(guān)于診斷G矩陣分塊獨立處理的探討[J];長安大學(xué)學(xué)報(自然科學(xué)版);1993年04期
3 杜偉章,任春麗;關(guān)于“逆p.n.p.矩陣的表征”的注記[J];西安電子科技大學(xué)學(xué)報;1996年04期
4 馮健;倪明;趙建波;;一種基于分布式平臺Hadoop的矩陣相乘算法[J];計算機系統(tǒng)應(yīng)用;2013年12期
5 遲學(xué)斌;分布式系統(tǒng)矩陣并行計算[J];數(shù)值計算與計算機應(yīng)用;1997年04期
6 吳飛;金士堯;;并行優(yōu)化矩陣運算的探索[J];計算機工程與科學(xué);1992年02期
7 張會凌;命題邏輯判定系統(tǒng)中基本真值矩陣的生成算法[J];甘肅聯(lián)合大學(xué)學(xué)報(自然科學(xué)版);2005年01期
8 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 支希哲;孟光;顧致平;;穩(wěn)定性判定陣的分塊確定法[A];1995中國控制與決策學(xué)術(shù)年會論文集[C];1995年
2 吳柏生;李正光;;結(jié)構(gòu)布局修改的重分析方法[A];第九屆全國結(jié)構(gòu)工程學(xué)術(shù)會議論文集第Ⅱ卷[C];2000年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 黃澤軍;關(guān)于矩陣組合分析性質(zhì)的若干結(jié)果[D];華東師范大學(xué);2011年
2 沈長鵬;訂單結(jié)構(gòu)與揀選系統(tǒng)的適配問題研究[D];山東大學(xué);2011年
3 申淑謙;特殊矩陣數(shù)值分析和鞍點問題迭代求解預(yù)處理技術(shù)[D];電子科技大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 陳磊;面向多核DSP的高性能并行BLAS3的設(shè)計與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年
2 曾侃圢;基于電阻矩陣定位原理的潰壩模型試驗測量技術(shù)研究[D];重慶交通大學(xué);2015年
3 劉真;基于用戶評分矩陣分塊的魯棒推薦模型研究[D];燕山大學(xué);2013年
4 黃榮;幾類分塊組合選取因子法的非奇H-矩陣判定[D];湘潭大學(xué);2005年
5 符和滿;符號空間一類稠密混沌系統(tǒng)的矩陣刻畫[D];華南師范大學(xué);2005年
6 樓Z蟍;M-矩陣等特殊矩陣及其特殊積[D];陜西師范大學(xué);2004年
7 杜翠真;五階完全正矩陣[D];安徽大學(xué);2005年
8 陳一昭;并行計算在矩陣運算中的應(yīng)用[D];昆明理工大學(xué);2011年
9 張曉青;關(guān)于SDD~+矩陣和H-矩陣算法的研究[D];電子科技大學(xué);2006年
,本文編號:853941
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/853941.html