GPU加速的矩陣計(jì)算的研究
本文關(guān)鍵詞:GPU加速的矩陣計(jì)算的研究
更多相關(guān)文章: 矩陣最大特征值 可逆矩陣逆矩陣 CUDA GPU
【摘要】:高性能計(jì)算領(lǐng)域的很多問(wèn)題都在研究并行算法的實(shí)現(xiàn),而矩陣計(jì)算又是高性能計(jì)算中應(yīng)用非常廣泛的內(nèi)容。隨著需求的日益增加,串行算法已經(jīng)無(wú)法滿足研究的需求,集群會(huì)有部分性能的提升,但是集群低耦合的局限性導(dǎo)致它的可移植性差,計(jì)算量增加帶來(lái)了高昂的設(shè)備成本和大的耗電量。圖形處理器GPU(Graphic Process Unit)有著強(qiáng)大的并行處理能力,出色的浮點(diǎn)計(jì)算能力,大存儲(chǔ)帶寬和低成本,廣泛用于求解大規(guī)模矩陣計(jì)算問(wèn)題上。本文針對(duì)三個(gè)典型的矩陣問(wèn)題進(jìn)行研究:正矩陣近似最大特征值,普通矩陣近似最大特征值和可逆矩陣求逆矩陣。首先目前求解正矩陣近似最大特征值問(wèn)題最有效的算法是串行實(shí)現(xiàn)的,本文在CUDA架構(gòu)下實(shí)現(xiàn)了相似變換方法求解正矩陣的最大特征值的并行算法(PA-ST:Parallel-Similarity Transformation),取得了30.028的最大加速比。其次目前求解一般矩陣近似最大特征值的并行QR算法更適用于求出矩陣所有特征值。因此我們借助于CUDA架構(gòu)實(shí)現(xiàn)了求解普通矩陣的近似最大特征值的并行加速(PA-A:Pareallel-Approximate)。獲得的加速比范圍是為15.424~101.714。最后對(duì)于可逆矩陣求逆矩陣問(wèn)題,目前有效的算法都是串行思想。隨著矩陣規(guī)模的增加,串行方法的計(jì)算無(wú)疑是非常耗時(shí)的�?紤]到上面的情況,本文首次實(shí)現(xiàn)了全選主元高斯約旦法求實(shí)矩陣逆矩陣的GPU并行算法(PA-Gauss For Real Matrix)和復(fù)矩陣逆矩陣的的GPU并行算法(PA-Gauss For Complex Matrix)。分別獲得了100435和36508的最大加速比。我們對(duì)算法核心步驟進(jìn)行并行化,并且做了相應(yīng)的CUDA優(yōu)化。實(shí)驗(yàn)結(jié)果均表明在矩陣大小持續(xù)變大的情況下,加速比也跟著對(duì)應(yīng)的上升,而迭代不斷加大的情況下我們的加速比并沒(méi)有什么明顯的變化,因此我們的算法對(duì)于更大規(guī)模矩陣的迭代問(wèn)題仍然有效。
【學(xué)位授予單位】:黑龍江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP38
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉曉平;王啟駿;陳皓;張乃釗;;基于距離的點(diǎn)光源軟陰影GPU生成方法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年12期
2 郭云;康濤;徐涵;;基于優(yōu)化存儲(chǔ)的嵌入式GPU的字符顯示[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2012年10期
3 本刊編輯部;;加州大學(xué)圣地亞哥分校使用GPU超級(jí)計(jì)算機(jī)實(shí)現(xiàn)千萬(wàn)億次級(jí)地震模擬[J];科研信息化技術(shù)與應(yīng)用;2013年02期
4 陸筱霞;段光明;李思昆;;基于GPU的遙感紋理壓縮解壓算法[J];系統(tǒng)仿真學(xué)報(bào);2009年S1期
5 詹總謙;盧亮;;基于GPU并行處理技術(shù)的影像畸變差修正[J];測(cè)繪信息與工程;2011年02期
6 許建;林泳;秦勇;黃翰;;基于GPU的并行協(xié)同過(guò)濾算法[J];計(jì)算機(jī)應(yīng)用研究;2013年09期
7 技術(shù)宅;;GPU通用計(jì)算解密[J];電腦愛(ài)好者;2014年02期
8 張浩;李利軍;林嵐;;GPU的通用計(jì)算應(yīng)用研究[J];計(jì)算機(jī)與數(shù)字工程;2005年12期
9 AZ521;;GPU的革命 解析通用計(jì)算技術(shù)[J];電腦迷;2009年15期
10 丁鵬;賈月樂(lè);張靜;張巖;;GPU結(jié)構(gòu)與通用計(jì)算探析[J];技術(shù)與市場(chǎng);2009年09期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前4條
1 夏青;岳利群;;基于GPU編程的海浪仿真技術(shù)研究[A];2007系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2007年
2 劉小虎;胡耀國(guó);符偉;;大規(guī)模有限元系統(tǒng)的GPU加速計(jì)算研究[A];中國(guó)計(jì)算力學(xué)大會(huì)'2010(CCCM2010)暨第八屆南方計(jì)算力學(xué)學(xué)術(shù)會(huì)議(SCCM8)論文集[C];2010年
3 張迪;黃偉;羅琦;王侃;;波形板干燥器內(nèi)液滴數(shù)值模擬的GPU并行加速[A];第十六屆全國(guó)流體力學(xué)數(shù)值方法研討會(huì)2013論文集[C];2013年
4 李慧;付志一;;基于GPU計(jì)算的有限元總剛組成方法探索[A];北京力學(xué)會(huì)第17屆學(xué)術(shù)年會(huì)論文集[C];2011年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前7條
1 本報(bào)記者 劉燕;GPU加速是手機(jī)瀏覽器方向[N];科技日?qǐng)?bào);2012年
2 ;GPU,智能手機(jī)好推手[N];電腦報(bào);2013年
3 諸玲珍;NVIDIA推0.13微米GPU[N];中國(guó)電子報(bào);2002年
4 網(wǎng)絡(luò)世界記者 周源;曙光三款GPU服務(wù)器問(wèn)世[N];網(wǎng)絡(luò)世界;2013年
5 小溪 編譯;NVIDIA唱響GPU統(tǒng)一架構(gòu)時(shí)代序曲[N];計(jì)算機(jī)世界;2006年
6 ;GPU市場(chǎng)Q2創(chuàng)八年最大增幅[N];計(jì)算機(jī)世界;2009年
7 沈陽(yáng) 劉鏑;GPU:給顯卡一顆驛動(dòng)的“芯”[N];電腦報(bào);2001年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 陳鋼;眾核GPU體系結(jié)構(gòu)相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2011年
2 白洪濤;基于GPU的高性能并行算法研究[D];吉林大學(xué);2010年
3 劉華海;節(jié)點(diǎn)內(nèi)多CPU多GPU協(xié)同并行繪制關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
4 林一松;面向GPU的低功耗軟件優(yōu)化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李佳功;基于GPU的脈沖星相干消色散技術(shù)的研究和應(yīng)用[D];昆明理工大學(xué);2015年
2 劉園園;基于GPU的顆粒增強(qiáng)復(fù)合材料損傷演化的宏細(xì)觀跨尺度模擬[D];昆明理工大學(xué);2015年
3 李璐;基于GPU的并行SVM算法的改進(jìn)及其應(yīng)用[D];南京信息工程大學(xué);2015年
4 梅世冬;實(shí)時(shí)陰影繪制方法研究及GPU加速[D];華中師范大學(xué);2010年
5 李軍;基于GPU的大規(guī)模場(chǎng)景實(shí)時(shí)陰影繪制[D];湖南大學(xué);2011年
6 韋婷;基于GPU的自然場(chǎng)景渲染優(yōu)化技術(shù)研究[D];廣西大學(xué);2013年
7 晏福興;基于GPU的軟陰影技術(shù)的研究[D];杭州電子科技大學(xué);2009年
8 明星;基于GPU的醫(yī)學(xué)圖像三維重建算法及其應(yīng)用[D];華中科技大學(xué);2009年
9 馬鳴飛;基于GPU加速的三維超聲成像系統(tǒng)[D];哈爾濱工業(yè)大學(xué);2011年
10 李茂前;基于GPU加速的光子映射渲染算法研究與實(shí)現(xiàn)[D];浙江工商大學(xué);2015年
,本文編號(hào):1195829
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1195829.html