選擇稀疏矩陣乘法最優(yōu)存儲(chǔ)格式的研究
【圖文】:
模桑粒劍危危?(Ndiags×M).(1)我們對(duì)這2個(gè)參數(shù)在子矩陣集DIA_mats上測(cè)試其SpMV性能(如圖3、圖4所示).1)對(duì)角線條數(shù)(Ndiags):DIA-SpMV中寫(xiě)Y的次數(shù)為Ndiags,隨著對(duì)角線條數(shù)增多,對(duì)向量Y的重復(fù)讀寫(xiě)次數(shù)增加,對(duì)SpMV性能造成影響.圖3給出了Ndiags與DIA-SpMV性能的關(guān)系.圖3中Fig.3TheinfluenceofNdiagsonDIA-SpMV.圖3Ndiags對(duì)DIA-SpMV性能的影響Fig.4TheinfluenceofER_DIAonDIA-SpMV.圖4ER_DIA對(duì)DIA格式SpMV性能的影響橫坐標(biāo)為Ndiags的數(shù)目,分為9個(gè)取值區(qū)間;縱坐標(biāo)為矩陣所占比例.其中“GOOD”指DIA為最優(yōu)格式的矩陣所占比例,可知所有的GOOD矩陣集合即表3中的“good_DIA_mats”;而“BAD”指DIA未能獲得最好性能的矩陣比例.從圖3看出,當(dāng)對(duì)角線條數(shù)大于300時(shí),DIA格式基本在絕大多數(shù)矩陣上不再獲得最高性能.結(jié)論1.當(dāng)稀疏矩陣的對(duì)角線條數(shù)較少時(shí),SpMV使用DIA格式具有性能優(yōu)勢(shì).2)DIA格式中非零元所占比例(ER_DIA):即使一條對(duì)角線上只有一個(gè)非零元,DIA格式也需要存儲(chǔ)整條對(duì)角線,,包含存儲(chǔ)額外的零元素.大量的補(bǔ)零操作降低了非零元所占比例,增加了SpMV的額外計(jì)算,從而影響其性能.ER_DIA與DIA-SpMV的性能如
能(如圖3、圖4所示).1)對(duì)角線條數(shù)(Ndiags):DIA-SpMV中寫(xiě)Y的次數(shù)為Ndiags,隨著對(duì)角線條數(shù)增多,對(duì)向量Y的重復(fù)讀寫(xiě)次數(shù)增加,對(duì)SpMV性能造成影響.圖3給出了Ndiags與DIA-SpMV性能的關(guān)系.圖3中Fig.3TheinfluenceofNdiagsonDIA-SpMV.圖3Ndiags對(duì)DIA-SpMV性能的影響Fig.4TheinfluenceofER_DIAonDIA-SpMV.圖4ER_DIA對(duì)DIA格式SpMV性能的影響橫坐標(biāo)為Ndiags的數(shù)目,分為9個(gè)取值區(qū)間;縱坐標(biāo)為矩陣所占比例.其中“GOOD”指DIA為最優(yōu)格式的矩陣所占比例,可知所有的GOOD矩陣集合即表3中的“good_DIA_mats”;而“BAD”指DIA未能獲得最好性能的矩陣比例.從圖3看出,當(dāng)對(duì)角線條數(shù)大于300時(shí),DIA格式基本在絕大多數(shù)矩陣上不再獲得最高性能.結(jié)論1.當(dāng)稀疏矩陣的對(duì)角線條數(shù)較少時(shí),SpMV使用DIA格式具有性能優(yōu)勢(shì).2)DIA格式中非零元所占比例(ER_DIA):即使一條對(duì)角線上只有一個(gè)非零元,DIA格式也需要存儲(chǔ)整條對(duì)角線,包含存儲(chǔ)額外的零元素.大量的補(bǔ)零操作降低了非零元所占比例,增加了SpMV的額外計(jì)算,從而影響其性能.ER_DIA與DIA-SpMV的性能如圖4所示.可知,當(dāng)矩陣中非零元所占比例過(guò)。ǎ迹玻埃ィ⿻r(shí),DIA格式的SpMV不會(huì)取得較好的性能.結(jié)論
【作者單位】: 計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室(中國(guó)科學(xué)院計(jì)算技術(shù)研究所);中國(guó)科學(xué)院大學(xué);
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61272134,61033009,61003062,60925009) 國(guó)家“九七三”重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃基金項(xiàng)目(2011CB302502,2012CB316502)
【分類號(hào)】:TP333;TP311.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 宋慶增;顧軍華;;稀疏矩陣向量乘的FPGA設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2011年23期
【共引文獻(xiàn)】
相關(guān)期刊論文 前1條
1 彭宇;仲雪潔;王少軍;;基于FPGA線性方程組的存儲(chǔ)優(yōu)化設(shè)計(jì)[J];計(jì)算機(jī)工程;2013年04期
相關(guān)博士學(xué)位論文 前2條
1 陳銳;CSAMT三維交錯(cuò)采樣有限差分?jǐn)?shù)值模擬并行算法研究[D];中國(guó)地質(zhì)大學(xué)(北京);2012年
2 張芡;大規(guī)模稀疏線性系統(tǒng)的稀疏近似逆預(yù)處理技術(shù)[D];清華大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 張承暢;嚴(yán)單貴;楊力生;齊懷龍;楊宏;;基于XCF32P的多FPGA配置方案[J];計(jì)算機(jī)工程;2010年15期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王敏;;稀疏矩陣快速轉(zhuǎn)置算法的分析與優(yōu)化[J];計(jì)算機(jī)應(yīng)用與軟件;2010年08期
2 田翔;周凡;陳耀武;劉莉;陳耀;;基于FPGA的實(shí)時(shí)雙精度浮點(diǎn)矩陣乘法器設(shè)計(jì)[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2008年09期
3 袁娥;張?jiān)迫?孫相征;;RAM(h)模型下SpMV存儲(chǔ)訪問(wèn)復(fù)雜度的分析[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年03期
4 盧s
本文編號(hào):2520436
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2520436.html