面向GPU的并行稀疏對(duì)角矩陣矢量乘算法研究及應(yīng)用
【學(xué)位授予單位】:南京師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP301.6;TP332
【圖文】:
隨著通用圖形處理單兀(Graphics邋Processing邋Unit,邋GPU)編程模型和開逡逑發(fā)工具鏈的成熟,GRJ給通用計(jì)算,特別是高性能計(jì)算帶來了前所未有的機(jī)遇。GPU逡逑的設(shè)計(jì)理念與CPU有很大不同如圖1.1所示。在GPU中,絕大部分資源用于計(jì)逡逑算,當(dāng)前,GPU的計(jì)算能力和帶寬都比CPU高出一個(gè)數(shù)量級(jí),主流GPU的計(jì)算能逡逑力已達(dá)到6T0PS,存儲(chǔ)帶寬達(dá)到500GB/S。因此本論文的運(yùn)算都是面向GPU架構(gòu)的。逡逑II邋|i邐U邋I邋I邋I邋I邋I邋I邋I邋I邋i邋1邋I邋I邋ITT1逡逑邐u邐I邋I邐M邐I邐I邐I邋I邐M邐[邐i邐rm逡逑II邐U邐II邐I邋I邐I邐I邐11邐1邋I邐I邐I邐I邋il邋i逡逑邐IL邐邐邋u邐i邋i邐i邋I邐i邐I邐m邐i邋i邐i邐i邐i ̄m逡逑邐邋M邋I邋li邋II邋I邋I邋II邋II邋I邋II邋II逡逑0控制調(diào)節(jié)器邐brf丨!丨!邋!邋!邋!丨」I邋i丨丨.llj逡逑,__邐bi邋II邋1邋i邋1邋II邋1邋I邋I邋I邋1邋ITT1逡逑^邋木邏輯單兀邋邐-邐-邐U邋M邋I邋il邋II邋I邋11邋I邋11邋11邋1逡逑緩存邐邐邐邐逡逑?邋DRAM逡逑CPU邐GPU逡逑圖1.1邋CPU和GPU的體系結(jié)構(gòu)逡逑稀疏對(duì)角矩陣是一種特殊的稀疏矩陣,它的非零元素集中在少量的對(duì)角線上。且逡逑在許多領(lǐng)域有著廣泛的應(yīng)用。例如,在計(jì)算流體力學(xué)和電磁學(xué)等領(lǐng)域中的許多問題,逡逑采用有限差分法(Finite邋Difference邋Method
DIA邋(HDI)格式來減少零元素的填充。在HDI格式中,原始矩陣被劃分成若干個(gè)具逡逑有相同行數(shù)量的矩陣塊,且每個(gè)獨(dú)立矩陣塊采用DIA格式存儲(chǔ)。由于DIA格式的使逡逑用,HDI格式無法解決矩陣中對(duì)角線存在偏移的情況。綜合上述研宄來看,對(duì)于圖1.2逡逑的稀疏對(duì)角矩陣存在的情況,現(xiàn)有算法都存在著一定的不足。因此,本論文對(duì)稀疏對(duì)逡逑角矩陣進(jìn)一步進(jìn)行研宄,基于CUDA邋(ComputeUnifiedDeviceArchitecture),通過提逡逑出一種自適應(yīng)的并行稀疏對(duì)角矩陣矢量乘算法,完美解決了稀疏對(duì)角矩陣中存在散點(diǎn)、逡逑長斷行或者對(duì)角線偏離主對(duì)角線較遠(yuǎn)等情況問題。逡逑另外,在均勻網(wǎng)格上離散偏微分方程組時(shí),對(duì)于每個(gè)網(wǎng)格節(jié)點(diǎn)上具有高自由度的逡逑結(jié)構(gòu)化網(wǎng)格問題產(chǎn)生的矩陣,其非零元素結(jié)構(gòu)往往具有一定規(guī)律,呈現(xiàn)如圖1.3的樣逡逑式。圖1.3中的稀疏矩陣被稱為稀疏塊對(duì)角矩陣。逡逑顯然,DIA格式不適合這種稀疏塊對(duì)角矩陣的存儲(chǔ)。CSR和ELL雖然能有效存逡逑2逡逑
??邐??????'?邋■長斷行逡逑圖1.2稀疏對(duì)角矩陣實(shí)例逡逑為此,Yuan邋等[5]2010邋年提出了邋DDD-NAlVE邋和邋DDD-SPLIT邋算法。DDD-NAiVE逡逑算法依次存儲(chǔ)對(duì)角線上元素,對(duì)于含有稠密對(duì)角線矩陣具有較好的效率,但無法解決逡逑對(duì)角線存在長斷行情況。DDD-SPLIT算法利用對(duì)角線將稀疏矩陣分塊,通過壓縮相逡逑同元素節(jié)省存儲(chǔ)空間。然而,這兩種算法均未給出并行解決方案。Sun等W在2011年逡逑提出了邋CRSD邋(Compressed邋Row邋Segment邋with邋Diagonal邋Pattern)格式,相比邋DIA,含巨逡逑大大減少零元素的填充。在CRSD中,通過定義對(duì)角線模式表示對(duì)角線分布,將對(duì)角逡逑線分到不同組,進(jìn)而將矩陣分成若干行段;如果行段中對(duì)角線上元素具有相同模式,逡逑則將此類行段看成一個(gè)存儲(chǔ)和操作單元
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張友惠;;分塊次對(duì)角矩陣的定義及性質(zhì)[J];湖南科技學(xué)院學(xué)報(bào);2008年04期
2 錢愛林,吳又勝;對(duì)稱雙邊對(duì)角矩陣的特征值問題[J];河西學(xué)院學(xué)報(bào);2005年05期
3 刁新軍;黃廷祝;曾翎;冉瑞生;;五對(duì)角矩陣的分解及其逆元素的快速算法[J];電子科技大學(xué)學(xué)報(bào);2005年06期
4 吳燕翔,王良恩,邱挺;二對(duì)角矩陣法及其在催化精餾塔模擬計(jì)算中的應(yīng)用[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年01期
5 黃鏡新;模糊錯(cuò)誤二類5對(duì)角矩陣方程求解[J];廣東工業(yè)大學(xué)學(xué)報(bào);1998年S1期
6 周小莊,胡錫炎;實(shí)對(duì)稱五對(duì)角矩陣及其特征反問題[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);1996年01期
7 吳長勤,張銀云;灰對(duì)角矩陣的一些性質(zhì)[J];安徽農(nóng)業(yè)技術(shù)師范學(xué)院學(xué)報(bào);1997年04期
8 周志華;吳漢金;李永元;侯懷德;;上機(jī)圖及配色效應(yīng)圖內(nèi)部轉(zhuǎn)換的數(shù)學(xué)模型[J];中國紡織大學(xué)學(xué)報(bào);1988年03期
9 錢岷江;;基于雙線性變換從S域到Z域的對(duì)角矩陣算法[J];現(xiàn)代機(jī)械;1988年04期
10 王秀玉,姜興武,李慧玲;對(duì)稱雙邊對(duì)角矩陣的性質(zhì)及廣義逆[J];東北師大學(xué)報(bào)(自然科學(xué)版);2005年03期
相關(guān)會(huì)議論文 前4條
1 黃鏡新;;二類4模糊錯(cuò)誤對(duì)角矩陣方程求解[A];1998年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];1998年
2 王健;陳丙珍;何小榮;;化工過程模擬與優(yōu)化的新進(jìn)展——并行計(jì)算方法[A];過程系統(tǒng)工程2001年會(huì)論文集[C];2001年
3 毛希安;;二維NOE譜幅度矩陣的數(shù)學(xué)特性[A];第七屆全國波譜學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];1992年
4 梁冬梅;馬玉臣;;多體格林函數(shù)方法研究二元砷化物的光電特性[A];中國化學(xué)會(huì)第十二屆全國量子化學(xué)會(huì)議論文摘要集[C];2014年
相關(guān)重要報(bào)紙文章 前1條
1 教育部考試中心命題一部、社會(huì)考試處;考研細(xì)看命題變化[N];中國教育報(bào);2002年
相關(guān)博士學(xué)位論文 前1條
1 聶璽;陣列信號(hào)二維測(cè)向算法研究[D];電子科技大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 夏羿飛;面向GPU的并行稀疏對(duì)角矩陣矢量乘算法研究及應(yīng)用[D];南京師范大學(xué);2019年
2 李志勇;基于對(duì)角矩陣的溫濕度模糊解耦控制系統(tǒng)的研究[D];石家莊鐵道大學(xué);2018年
3 藺彥玲;幾類特殊矩陣求其逆的快速算法研究[D];陜西科技大學(xué);2017年
4 鄭永梅;實(shí)對(duì)稱五對(duì)角矩陣的逆特征值問題[D];南京航空航天大學(xué);2009年
5 郭晶晶;圖的無符號(hào)拉普拉斯特征值[D];浙江師范大學(xué);2013年
6 劉婷;塊五對(duì)角線性方程求解[D];華東師范大學(xué);2009年
7 沈諾;關(guān)于某些三對(duì)角矩陣的研究[D];山東師范大學(xué);2014年
8 焦江磊;基于異構(gòu)系統(tǒng)的多對(duì)角矩陣并行計(jì)算研究[D];哈爾濱工程大學(xué);2016年
9 白翠霞;線性脈沖微分系統(tǒng)的漸近解[D];天津大學(xué);2009年
10 刁新軍;五對(duì)角矩陣和廣義等對(duì)角優(yōu)勢(shì)矩陣的數(shù)值分析[D];電子科技大學(xué);2004年
本文編號(hào):2746746
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2746746.html