面向GPU的并行稀疏對角矩陣矢量乘算法研究及應(yīng)用
【學(xué)位授予單位】:南京師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP301.6;TP332
【圖文】:
隨著通用圖形處理單兀(Graphics邋Processing邋Unit,邋GPU)編程模型和開逡逑發(fā)工具鏈的成熟,GRJ給通用計算,特別是高性能計算帶來了前所未有的機遇。GPU逡逑的設(shè)計理念與CPU有很大不同如圖1.1所示。在GPU中,絕大部分資源用于計逡逑算,當(dāng)前,GPU的計算能力和帶寬都比CPU高出一個數(shù)量級,主流GPU的計算能逡逑力已達(dá)到6T0PS,存儲帶寬達(dá)到500GB/S。因此本論文的運算都是面向GPU架構(gòu)的。逡逑II邋|i邐U邋I邋I邋I邋I邋I邋I邋I邋I邋i邋1邋I邋I邋ITT1逡逑邐u邐I邋I邐M邐I邐I邐I邋I邐M邐[邐i邐rm逡逑II邐U邐II邐I邋I邐I邐I邐11邐1邋I邐I邐I邐I邋il邋i逡逑邐IL邐邐邋u邐i邋i邐i邋I邐i邐I邐m邐i邋i邐i邐i邐i ̄m逡逑邐邋M邋I邋li邋II邋I邋I邋II邋II邋I邋II邋II逡逑0控制調(diào)節(jié)器邐brf丨!丨!邋!邋!邋!丨」I邋i丨丨.llj逡逑,__邐bi邋II邋1邋i邋1邋II邋1邋I邋I邋I邋1邋ITT1逡逑^邋木邏輯單兀邋邐-邐-邐U邋M邋I邋il邋II邋I邋11邋I邋11邋11邋1逡逑緩存邐邐邐邐逡逑?邋DRAM逡逑CPU邐GPU逡逑圖1.1邋CPU和GPU的體系結(jié)構(gòu)逡逑稀疏對角矩陣是一種特殊的稀疏矩陣,它的非零元素集中在少量的對角線上。且逡逑在許多領(lǐng)域有著廣泛的應(yīng)用。例如,在計算流體力學(xué)和電磁學(xué)等領(lǐng)域中的許多問題,逡逑采用有限差分法(Finite邋Difference邋Method
DIA邋(HDI)格式來減少零元素的填充。在HDI格式中,原始矩陣被劃分成若干個具逡逑有相同行數(shù)量的矩陣塊,且每個獨立矩陣塊采用DIA格式存儲。由于DIA格式的使逡逑用,HDI格式無法解決矩陣中對角線存在偏移的情況。綜合上述研宄來看,對于圖1.2逡逑的稀疏對角矩陣存在的情況,現(xiàn)有算法都存在著一定的不足。因此,本論文對稀疏對逡逑角矩陣進(jìn)一步進(jìn)行研宄,基于CUDA邋(ComputeUnifiedDeviceArchitecture),通過提逡逑出一種自適應(yīng)的并行稀疏對角矩陣矢量乘算法,完美解決了稀疏對角矩陣中存在散點、逡逑長斷行或者對角線偏離主對角線較遠(yuǎn)等情況問題。逡逑另外,在均勻網(wǎng)格上離散偏微分方程組時,對于每個網(wǎng)格節(jié)點上具有高自由度的逡逑結(jié)構(gòu)化網(wǎng)格問題產(chǎn)生的矩陣,其非零元素結(jié)構(gòu)往往具有一定規(guī)律,呈現(xiàn)如圖1.3的樣逡逑式。圖1.3中的稀疏矩陣被稱為稀疏塊對角矩陣。逡逑顯然,DIA格式不適合這種稀疏塊對角矩陣的存儲。CSR和ELL雖然能有效存逡逑2逡逑
??邐??????'?邋■長斷行逡逑圖1.2稀疏對角矩陣實例逡逑為此,Yuan邋等[5]2010邋年提出了邋DDD-NAlVE邋和邋DDD-SPLIT邋算法。DDD-NAiVE逡逑算法依次存儲對角線上元素,對于含有稠密對角線矩陣具有較好的效率,但無法解決逡逑對角線存在長斷行情況。DDD-SPLIT算法利用對角線將稀疏矩陣分塊,通過壓縮相逡逑同元素節(jié)省存儲空間。然而,這兩種算法均未給出并行解決方案。Sun等W在2011年逡逑提出了邋CRSD邋(Compressed邋Row邋Segment邋with邋Diagonal邋Pattern)格式,相比邋DIA,含巨逡逑大大減少零元素的填充。在CRSD中,通過定義對角線模式表示對角線分布,將對角逡逑線分到不同組,進(jìn)而將矩陣分成若干行段;如果行段中對角線上元素具有相同模式,逡逑則將此類行段看成一個存儲和操作單元
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張友惠;;分塊次對角矩陣的定義及性質(zhì)[J];湖南科技學(xué)院學(xué)報;2008年04期
2 錢愛林,吳又勝;對稱雙邊對角矩陣的特征值問題[J];河西學(xué)院學(xué)報;2005年05期
3 刁新軍;黃廷祝;曾翎;冉瑞生;;五對角矩陣的分解及其逆元素的快速算法[J];電子科技大學(xué)學(xué)報;2005年06期
4 吳燕翔,王良恩,邱挺;二對角矩陣法及其在催化精餾塔模擬計算中的應(yīng)用[J];福州大學(xué)學(xué)報(自然科學(xué)版);2000年01期
5 黃鏡新;模糊錯誤二類5對角矩陣方程求解[J];廣東工業(yè)大學(xué)學(xué)報;1998年S1期
6 周小莊,胡錫炎;實對稱五對角矩陣及其特征反問題[J];湖南大學(xué)學(xué)報(自然科學(xué)版);1996年01期
7 吳長勤,張銀云;灰對角矩陣的一些性質(zhì)[J];安徽農(nóng)業(yè)技術(shù)師范學(xué)院學(xué)報;1997年04期
8 周志華;吳漢金;李永元;侯懷德;;上機圖及配色效應(yīng)圖內(nèi)部轉(zhuǎn)換的數(shù)學(xué)模型[J];中國紡織大學(xué)學(xué)報;1988年03期
9 錢岷江;;基于雙線性變換從S域到Z域的對角矩陣算法[J];現(xiàn)代機械;1988年04期
10 王秀玉,姜興武,李慧玲;對稱雙邊對角矩陣的性質(zhì)及廣義逆[J];東北師大學(xué)報(自然科學(xué)版);2005年03期
相關(guān)會議論文 前4條
1 黃鏡新;;二類4模糊錯誤對角矩陣方程求解[A];1998年中國智能自動化學(xué)術(shù)會議論文集(上冊)[C];1998年
2 王健;陳丙珍;何小榮;;化工過程模擬與優(yōu)化的新進(jìn)展——并行計算方法[A];過程系統(tǒng)工程2001年會論文集[C];2001年
3 毛希安;;二維NOE譜幅度矩陣的數(shù)學(xué)特性[A];第七屆全國波譜學(xué)學(xué)術(shù)會議論文摘要集[C];1992年
4 梁冬梅;馬玉臣;;多體格林函數(shù)方法研究二元砷化物的光電特性[A];中國化學(xué)會第十二屆全國量子化學(xué)會議論文摘要集[C];2014年
相關(guān)重要報紙文章 前1條
1 教育部考試中心命題一部、社會考試處;考研細(xì)看命題變化[N];中國教育報;2002年
相關(guān)博士學(xué)位論文 前1條
1 聶璽;陣列信號二維測向算法研究[D];電子科技大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 夏羿飛;面向GPU的并行稀疏對角矩陣矢量乘算法研究及應(yīng)用[D];南京師范大學(xué);2019年
2 李志勇;基于對角矩陣的溫濕度模糊解耦控制系統(tǒng)的研究[D];石家莊鐵道大學(xué);2018年
3 藺彥玲;幾類特殊矩陣求其逆的快速算法研究[D];陜西科技大學(xué);2017年
4 鄭永梅;實對稱五對角矩陣的逆特征值問題[D];南京航空航天大學(xué);2009年
5 郭晶晶;圖的無符號拉普拉斯特征值[D];浙江師范大學(xué);2013年
6 劉婷;塊五對角線性方程求解[D];華東師范大學(xué);2009年
7 沈諾;關(guān)于某些三對角矩陣的研究[D];山東師范大學(xué);2014年
8 焦江磊;基于異構(gòu)系統(tǒng)的多對角矩陣并行計算研究[D];哈爾濱工程大學(xué);2016年
9 白翠霞;線性脈沖微分系統(tǒng)的漸近解[D];天津大學(xué);2009年
10 刁新軍;五對角矩陣和廣義等對角優(yōu)勢矩陣的數(shù)值分析[D];電子科技大學(xué);2004年
本文編號:2746746
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2746746.html