FitenBLAS:面向FT1000微處理器的高性能線性代數(shù)庫
發(fā)布時間:2019-09-17 12:40
【摘要】:BLAS庫是基本線性代數(shù)子程序庫,是許多大型科學與工程計算的核心計算程序,FitenBLAS庫是在多核多線FT1000微處理器上開發(fā)的基本線性代數(shù)庫,其研制對FT1000微處理器在科學與工程計算中的應用具有重要意義.根據(jù)多級存儲結(jié)構(gòu)和寄存器的數(shù)目,設計了向量與向量、矩陣與向量和矩陣與矩陣運算的多級循環(huán)展開方法,采用指令調(diào)度、數(shù)據(jù)預取等通用優(yōu)化技術(shù),優(yōu)化BLAS庫串行程序.對于BLAS3子程序,設計了矩陣乘無冗余數(shù)據(jù)拷貝分塊算法,采用指令重排、訪存與計算的重疊、分塊等技術(shù)優(yōu)化矩陣乘子程序,基于矩陣乘子程序?qū)崿F(xiàn)了其他BLAS3子程序.研制了匯編線性代數(shù)程庫FitenBLAS,其核心子程序矩陣乘的雙精度計算性能達到6.91Gflops,是峰值性能的86.4%.
【作者單位】: 國防科技大學并行與分布處理重點實驗室;
【基金】:國家自然科學基金資助項目(60970033) 國家高技術(shù)研究發(fā)展計劃(863計劃)資助項目(2012AA01A301)~~
【分類號】:TP332
本文編號:2536860
【作者單位】: 國防科技大學并行與分布處理重點實驗室;
【基金】:國家自然科學基金資助項目(60970033) 國家高技術(shù)研究發(fā)展計劃(863計劃)資助項目(2012AA01A301)~~
【分類號】:TP332
【共引文獻】
相關(guān)期刊論文 前4條
1 劉仲;田希;陳磊;;支持原位計算的高效三角矩陣乘法向量化方法[J];國防科技大學學報;2014年06期
2 李焱;張云泉;;異構(gòu)平臺上性能自適應FFT框架[J];計算機研究與發(fā)展;2014年03期
3 鄒燕燕;安虹;崔慧敏;周軍蕊;;矩陣形狀無關(guān)的并行編譯優(yōu)化[J];小型微型計算機系統(tǒng);2014年07期
4 劉剛;張恒;毛睿;陸克中;;面向龍芯3B1500體系結(jié)構(gòu)的DGEMM函數(shù)優(yōu)化[J];小型微型計算機系統(tǒng);2014年07期
相關(guān)博士學位論文 前2條
1 張志敏;化學計量學算法實現(xiàn)的軟件開發(fā)基礎研究[D];中南大學;2012年
2 賈海鵬;面向GPU計算平臺的若干并行優(yōu)化關(guān)鍵技術(shù)研究[D];中國海洋大學;2012年
,本文編號:2536860
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2536860.html
最近更新
教材專著