天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多核平臺(tái)SpMV并行技術(shù)研究

發(fā)布時(shí)間:2020-07-14 16:43
【摘要】: 目前各個(gè)領(lǐng)域都有大量的多核體系結(jié)構(gòu)處理器投入使用,從手機(jī)芯片到超級(jí)計(jì)算機(jī),多核體系結(jié)構(gòu)都占據(jù)著越來(lái)越重要的地位。多核已經(jīng)成為了當(dāng)今處理器體系結(jié)構(gòu)發(fā)展的主流和趨勢(shì)。在高性能計(jì)算領(lǐng)域,多核處理器平臺(tái)的潛力并未充分發(fā)掘出來(lái)。為了使得具有更高并行度需求的應(yīng)用能充分利用多核處理器提供的強(qiáng)大計(jì)算能力,非常有必要對(duì)不同應(yīng)用中的各類(lèi)算法針對(duì)多核結(jié)構(gòu)進(jìn)行研究。稀疏矩陣向量乘(Sparse Matrix-Vector Multiplication, SpMV)作為多類(lèi)科學(xué)計(jì)算過(guò)程不可缺少的一部分,其計(jì)算效率對(duì)科學(xué)計(jì)算程序的最終性能有著重要的影響。 本文以SpMV為例,研究數(shù)值算法在多核平臺(tái)上的性能優(yōu)化過(guò)程,主要的工作如下: 1、研究了現(xiàn)有的SpMV優(yōu)化的方法,分析了各種方法的特點(diǎn)及適用范圍,重點(diǎn)關(guān)注了數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)和線(xiàn)程優(yōu)化兩方面; 2、研究了多核處理器的體系結(jié)構(gòu),分析體系結(jié)構(gòu)中對(duì)并行計(jì)算性能的重要影響因素,尤其是存儲(chǔ)結(jié)構(gòu)對(duì)并行計(jì)算性能的影響; 3、設(shè)計(jì)了一種線(xiàn)程與處理器內(nèi)核問(wèn)的綁定方案,詳細(xì)闡述了具體的方法及該方案的實(shí)際意義; 4、提出了一種線(xiàn)程劃分方案:該方案可增強(qiáng)線(xiàn)程間的數(shù)據(jù)共享關(guān)系,同時(shí)結(jié)合線(xiàn)程綁定技術(shù),可提高SpMV的二級(jí)緩存命中率,進(jìn)而提高SpMV的計(jì)算效率; 以國(guó)際上公認(rèn)的矩陣測(cè)試集為基準(zhǔn)程序,同時(shí)利用PAPI工具訪(fǎng)問(wèn)硬件性能計(jì)數(shù)器,獲取程序的二級(jí)緩存失效等性能數(shù)據(jù),對(duì)本文提出的方案進(jìn)行了實(shí)驗(yàn)驗(yàn)證;數(shù)值試驗(yàn)表明,合理的線(xiàn)程綁定可以提升程序執(zhí)行的性能;而本文提出的線(xiàn)程劃分方案,也提高了SpMV計(jì)算性能。
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2009
【分類(lèi)號(hào)】:TP332
【圖文】:

核圖,多核,處理器,多核結(jié)構(gòu)


目目6核 /999核 核 核圖1一 12009年11月Top500中各類(lèi)處理器數(shù)量及比例多核處理器經(jīng)歷了十幾年的發(fā)展中經(jīng)歷了自19%年的首個(gè)多核結(jié)構(gòu)原型,到2001年IBM推出第一個(gè)商用多核處理器POWER4,再到2005年Intel和AMD多核處理器的大規(guī)模應(yīng)用,最后成為了現(xiàn)在多核成為市場(chǎng)主流。在這個(gè)過(guò)程中,多核處理器的應(yīng)用范圍已覆蓋了多媒體計(jì)算、嵌入式設(shè)備、個(gè)人計(jì)算機(jī)、商用服務(wù)器和高性能計(jì)算機(jī)等眾多領(lǐng)域。由此我們可以很清楚地看到,無(wú)論是應(yīng)用領(lǐng)域,還是科研領(lǐng)域,我們已經(jīng)完全地走進(jìn)了多核時(shí)代。第4頁(yè)

示意圖,存儲(chǔ)格式,示意圖,向量


二止一一二丁二二---一m+l門(mén)d:r.mPI圖2一 1CSR存儲(chǔ)格式示意圖圖中每一行中的非零元素用一種陰影表示。矩陣A中的所有非零元素按行依次排列壓縮為一個(gè)稠密向量val,再由一個(gè)與val相對(duì)應(yīng)的整數(shù)向量ind與之對(duì)應(yīng),ind中與val對(duì)應(yīng)位置存放val中元素屬于A的哪一列。另外,附加ptr向量,分別指出A的每一行元素在向量val中的起始位置。這樣,由于在稀疏矩陣A中非零元素相對(duì)較少,所以相對(duì)于原始的矩陣A,用于存放矩陣的向量val

示意圖,存儲(chǔ)格式,示意圖,矩形


二幾幾幾幾幾二_______l吶OOCr圖2一 2BCSR存儲(chǔ)格式示意圖圖中每個(gè)3x2的矩形塊對(duì)應(yīng)同一個(gè)行、列坐標(biāo),即BCSR存儲(chǔ)時(shí)的最小單元。圖中黑點(diǎn)表示非零元素,val中存儲(chǔ)的是每個(gè)小矩形塊中元素的數(shù)值,col中對(duì)應(yīng)存儲(chǔ)了每個(gè)小矩形塊的列坐標(biāo),row則存儲(chǔ)了以矩形塊為最小單位的每行中第一個(gè)矩形塊對(duì)應(yīng)col數(shù)組中的位置?梢钥闯,某些矩形塊中包含部分零元素,這就是BCSR格式引入的新的開(kāi)銷(xiāo),即為了使得某些相對(duì)較為分散的非零元素湊足一個(gè)矩形塊,需要引入部分零元素。在決定作為最小單位的矩形塊大小時(shí)

【共引文獻(xiàn)】

相關(guān)期刊論文 前1條

1 白洪濤;歐陽(yáng)丹彤;李熙銘;李亭;何麗莉;;基于GPU的稀疏矩陣向量乘優(yōu)化[J];計(jì)算機(jī)科學(xué);2010年08期

相關(guān)博士學(xué)位論文 前1條

1 白洪濤;基于GPU的高性能并行算法研究[D];吉林大學(xué);2010年



本文編號(hào):2755224

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2755224.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)5afa7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com