天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

異構(gòu)平臺(tái)中并行矩量法的加速技術(shù)

發(fā)布時(shí)間:2018-06-27 21:48

  本文選題:矩量法 + 異構(gòu)平臺(tái); 參考:《微波學(xué)報(bào)》2014年S1期


【摘要】:本文主要研究了在CPU/GPU異構(gòu)集群上的并行矩量法的加速技術(shù)。本文設(shè)計(jì)出一種MPI/CUDA軟件編程架構(gòu),解決了CPU/GPU異構(gòu)集群上并行LU分解跨節(jié)點(diǎn)計(jì)算的難題。此架構(gòu)基于矩陣分塊二維循環(huán)分布的數(shù)據(jù)分配策略,利用MPI實(shí)現(xiàn)計(jì)算節(jié)點(diǎn)之間的通信,同時(shí)利用GPU加速矩陣更新過(guò)程。為了突破GPU顯存對(duì)LU分解的矩陣規(guī)模的限制,本文進(jìn)一步研究了"顯存—內(nèi)存"核外算法。為了優(yōu)化算法性能,本文提出了基于"CUDA流"技術(shù)和"異步通信"技術(shù)的設(shè)計(jì)方案,實(shí)現(xiàn)了GPU通信與計(jì)算的重疊,有效隱藏了GPU通信時(shí)間,獲到了明顯的加速效果。
[Abstract]:This paper mainly studies the acceleration technique of parallel mom on CPU / GPU heterogeneous clusters. In this paper, a MPI / CUDA software programming architecture is designed to solve the problem of parallel LU decomposition across nodes on CPU / GPU heterogeneous clusters. Based on the data allocation strategy of matrix block two-dimensional cyclic distribution, MPI is used to realize the communication between computing nodes, and GPU is used to accelerate the matrix updating process. In order to break through the limitation of GPU memory on the matrix size of LU decomposition, this paper further studies the "memory" out-of-core algorithm. In order to optimize the performance of the algorithm, this paper proposes a design scheme based on "CUDA stream" technology and "asynchronous communication" technology, which realizes the overlap of GPU communication and computation, effectively hides the GPU communication time, and achieves obvious acceleration effect.
【作者單位】: 西安電子科技大學(xué)電子工程學(xué)院;
【分類號(hào)】:TP332;TP338.6

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 馬韜;陳明生;吳先良;劉藝;齊琪;;基于GPU加速的高階矩量法研究與應(yīng)用[J];微波學(xué)報(bào);2013年04期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王愷;劉民選;艾海濱;張力;;基于GPU的快速影像匹配[J];測(cè)繪科學(xué);2014年02期

2 劉鵬;何雯;肖巍巍;;基于GPGPU技術(shù)快速提取數(shù)字表面模型[J];測(cè)繪地理信息;2014年02期

3 朱Ym;;基于CUDA的三維數(shù)據(jù)場(chǎng)可視化加速技術(shù)研究[J];常熟理工學(xué)院學(xué)報(bào);2014年02期

4 袁峰;李曉暉;張明明;周濤發(fā);高道明;洪東良;劉曉明;汪啟年;朱將波;;隱伏礦體三維綜合信息成礦預(yù)測(cè)方法[J];地質(zhì)學(xué)報(bào);2014年04期

5 唐任遠(yuǎn);吳東陽(yáng);謝德馨;;單元級(jí)別并行有限元法求解工程渦流場(chǎng)的關(guān)鍵問(wèn)題研究[J];電工技術(shù)學(xué)報(bào);2014年05期

6 洪亮;周松濤;羅伊;石婷婷;胡飛;;海量遙感數(shù)據(jù)的GPU通用加速計(jì)算技術(shù)[J];地理空間信息;2014年03期

7 尤晶晶;王韶霞;;淺談優(yōu)化圖像壓縮的算法技術(shù)實(shí)現(xiàn)[J];河北民族師范學(xué)院學(xué)報(bào);2014年02期

8 李杰;劉灝;常磊;;高速數(shù)據(jù)采集曲線的快速繪制方法[J];電腦編程技巧與維護(hù);2014年19期

9 孔浩;劉金義;;基于GPGPU的離散數(shù)據(jù)挖掘研究[J];電子設(shè)計(jì)工程;2014年18期

10 李杰;劉灝;馬恩財(cái);劉明鋒;;基于GPU的JPEG壓縮算法實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2014年26期

相關(guān)博士學(xué)位論文 前10條

1 張知竹;三維特征線方法的并行與加速方法研究[D];清華大學(xué);2013年

2 賈海鵬;面向GPU計(jì)算平臺(tái)的若干并行優(yōu)化關(guān)鍵技術(shù)研究[D];中國(guó)海洋大學(xué);2012年

3 寧江凡;破碎的圖形建模與繪制技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

4 張勇;固體非均勻混合介質(zhì)頻域介電特性測(cè)量理論與方法研究[D];長(zhǎng)安大學(xué);2014年

5 崔樹林;基于GPU的并行矢量數(shù)據(jù)分析與索引技術(shù)研究[D];中國(guó)科學(xué)院研究生院(東北地理與農(nóng)業(yè)生態(tài)研究所);2014年

6 王東凱;淺海OBC資料自由表面多次波壓制方法研究[D];中國(guó)海洋大學(xué);2014年

7 袁健美;多貝西小波密度泛函的并行算法及其應(yīng)用[D];湘潭大學(xué);2014年

8 林義閩;未知環(huán)境中智能機(jī)器人的視覺導(dǎo)航技術(shù)研究[D];北京郵電大學(xué);2014年

9 陳湘驥;基于多尺度相似學(xué)習(xí)的圖像超分辨率重建算法研究[D];華南理工大學(xué);2014年

10 任超鋒;航空視頻影像的正射影像制作關(guān)鍵技術(shù)研究[D];武漢大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 王子丹;基于遺傳算法的可逆邏輯綜合方法及其CUDA并行化實(shí)現(xiàn)[D];東華大學(xué);2014年

2 余列祥;基于GPU加速的邊界面法的研究[D];湖南大學(xué);2013年

3 趙權(quán);激光間接驅(qū)動(dòng)靶丸輻射對(duì)稱性GPU并行算法研究[D];華中科技大學(xué);2013年

4 陳明龍;基于CUDA蛋白質(zhì)結(jié)構(gòu)比對(duì)算法的優(yōu)化研究[D];華中科技大學(xué);2013年

5 楊賽勇;基于CUDA加速的并行人臉檢測(cè)[D];華中科技大學(xué);2013年

6 蔣維;基于CUDA的紅外小目標(biāo)檢測(cè)算法的快速實(shí)現(xiàn)[D];華中科技大學(xué);2013年

7 李林;基于CUDA的視頻圖像文字檢測(cè)與去除研究[D];華中科技大學(xué);2013年

8 張平;基于CUDA的TLD視覺跟蹤算法研究[D];北京交通大學(xué);2014年

9 吳磊;基于CUDA的紅外圖像處理算法設(shè)計(jì)[D];華中科技大學(xué);2013年

10 鄧巍;基于GPU的視頻監(jiān)控?cái)?shù)據(jù)檢測(cè)技術(shù)研究[D];華中科技大學(xué);2013年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 張慶科;楊波;王琳;朱福祥;;基于GPU的現(xiàn)代并行優(yōu)化算法[J];計(jì)算機(jī)科學(xué);2012年04期

2 杜子靜;張玉;趙勛旺;梁昌洪;;并行高階矩量法分析艦隊(duì)RCS和其它電磁特性[J];微波學(xué)報(bào);2011年04期

【相似文獻(xiàn)】

相關(guān)期刊論文 前2條

1 張玉,王萌,梁昌洪,謝擁軍;PC集群系統(tǒng)中MPI并行矩量法研究[J];電子與信息學(xué)報(bào);2005年04期

2 ;[J];;年期

,

本文編號(hào):2075387

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2075387.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶41bd4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com