異構平臺中并行矩量法的加速技術
本文選題:矩量法 + 異構平臺; 參考:《微波學報》2014年S1期
【摘要】:本文主要研究了在CPU/GPU異構集群上的并行矩量法的加速技術。本文設計出一種MPI/CUDA軟件編程架構,解決了CPU/GPU異構集群上并行LU分解跨節(jié)點計算的難題。此架構基于矩陣分塊二維循環(huán)分布的數(shù)據(jù)分配策略,利用MPI實現(xiàn)計算節(jié)點之間的通信,同時利用GPU加速矩陣更新過程。為了突破GPU顯存對LU分解的矩陣規(guī)模的限制,本文進一步研究了"顯存—內(nèi)存"核外算法。為了優(yōu)化算法性能,本文提出了基于"CUDA流"技術和"異步通信"技術的設計方案,實現(xiàn)了GPU通信與計算的重疊,有效隱藏了GPU通信時間,獲到了明顯的加速效果。
[Abstract]:This paper mainly studies the acceleration technique of parallel mom on CPU / GPU heterogeneous clusters. In this paper, a MPI / CUDA software programming architecture is designed to solve the problem of parallel LU decomposition across nodes on CPU / GPU heterogeneous clusters. Based on the data allocation strategy of matrix block two-dimensional cyclic distribution, MPI is used to realize the communication between computing nodes, and GPU is used to accelerate the matrix updating process. In order to break through the limitation of GPU memory on the matrix size of LU decomposition, this paper further studies the "memory" out-of-core algorithm. In order to optimize the performance of the algorithm, this paper proposes a design scheme based on "CUDA stream" technology and "asynchronous communication" technology, which realizes the overlap of GPU communication and computation, effectively hides the GPU communication time, and achieves obvious acceleration effect.
【作者單位】: 西安電子科技大學電子工程學院;
【分類號】:TP332;TP338.6
【參考文獻】
相關期刊論文 前1條
1 馬韜;陳明生;吳先良;劉藝;齊琪;;基于GPU加速的高階矩量法研究與應用[J];微波學報;2013年04期
【共引文獻】
相關期刊論文 前10條
1 王愷;劉民選;艾海濱;張力;;基于GPU的快速影像匹配[J];測繪科學;2014年02期
2 劉鵬;何雯;肖巍巍;;基于GPGPU技術快速提取數(shù)字表面模型[J];測繪地理信息;2014年02期
3 朱Ym;;基于CUDA的三維數(shù)據(jù)場可視化加速技術研究[J];常熟理工學院學報;2014年02期
4 袁峰;李曉暉;張明明;周濤發(fā);高道明;洪東良;劉曉明;汪啟年;朱將波;;隱伏礦體三維綜合信息成礦預測方法[J];地質(zhì)學報;2014年04期
5 唐任遠;吳東陽;謝德馨;;單元級別并行有限元法求解工程渦流場的關鍵問題研究[J];電工技術學報;2014年05期
6 洪亮;周松濤;羅伊;石婷婷;胡飛;;海量遙感數(shù)據(jù)的GPU通用加速計算技術[J];地理空間信息;2014年03期
7 尤晶晶;王韶霞;;淺談優(yōu)化圖像壓縮的算法技術實現(xiàn)[J];河北民族師范學院學報;2014年02期
8 李杰;劉灝;常磊;;高速數(shù)據(jù)采集曲線的快速繪制方法[J];電腦編程技巧與維護;2014年19期
9 孔浩;劉金義;;基于GPGPU的離散數(shù)據(jù)挖掘研究[J];電子設計工程;2014年18期
10 李杰;劉灝;馬恩財;劉明鋒;;基于GPU的JPEG壓縮算法實現(xiàn)[J];電腦知識與技術;2014年26期
相關博士學位論文 前10條
1 張知竹;三維特征線方法的并行與加速方法研究[D];清華大學;2013年
2 賈海鵬;面向GPU計算平臺的若干并行優(yōu)化關鍵技術研究[D];中國海洋大學;2012年
3 寧江凡;破碎的圖形建模與繪制技術研究[D];國防科學技術大學;2013年
4 張勇;固體非均勻混合介質(zhì)頻域介電特性測量理論與方法研究[D];長安大學;2014年
5 崔樹林;基于GPU的并行矢量數(shù)據(jù)分析與索引技術研究[D];中國科學院研究生院(東北地理與農(nóng)業(yè)生態(tài)研究所);2014年
6 王東凱;淺海OBC資料自由表面多次波壓制方法研究[D];中國海洋大學;2014年
7 袁健美;多貝西小波密度泛函的并行算法及其應用[D];湘潭大學;2014年
8 林義閩;未知環(huán)境中智能機器人的視覺導航技術研究[D];北京郵電大學;2014年
9 陳湘驥;基于多尺度相似學習的圖像超分辨率重建算法研究[D];華南理工大學;2014年
10 任超鋒;航空視頻影像的正射影像制作關鍵技術研究[D];武漢大學;2014年
相關碩士學位論文 前10條
1 王子丹;基于遺傳算法的可逆邏輯綜合方法及其CUDA并行化實現(xiàn)[D];東華大學;2014年
2 余列祥;基于GPU加速的邊界面法的研究[D];湖南大學;2013年
3 趙權;激光間接驅動靶丸輻射對稱性GPU并行算法研究[D];華中科技大學;2013年
4 陳明龍;基于CUDA蛋白質(zhì)結構比對算法的優(yōu)化研究[D];華中科技大學;2013年
5 楊賽勇;基于CUDA加速的并行人臉檢測[D];華中科技大學;2013年
6 蔣維;基于CUDA的紅外小目標檢測算法的快速實現(xiàn)[D];華中科技大學;2013年
7 李林;基于CUDA的視頻圖像文字檢測與去除研究[D];華中科技大學;2013年
8 張平;基于CUDA的TLD視覺跟蹤算法研究[D];北京交通大學;2014年
9 吳磊;基于CUDA的紅外圖像處理算法設計[D];華中科技大學;2013年
10 鄧巍;基于GPU的視頻監(jiān)控數(shù)據(jù)檢測技術研究[D];華中科技大學;2013年
【二級參考文獻】
相關期刊論文 前2條
1 張慶科;楊波;王琳;朱福祥;;基于GPU的現(xiàn)代并行優(yōu)化算法[J];計算機科學;2012年04期
2 杜子靜;張玉;趙勛旺;梁昌洪;;并行高階矩量法分析艦隊RCS和其它電磁特性[J];微波學報;2011年04期
【相似文獻】
相關期刊論文 前2條
1 張玉,王萌,梁昌洪,謝擁軍;PC集群系統(tǒng)中MPI并行矩量法研究[J];電子與信息學報;2005年04期
2 ;[J];;年期
,本文編號:2075387
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2075387.html