基于異構計算的三維FDTD并行算法及其在電磁仿真中的應用
【圖文】:
Yee網(wǎng)格在三維空間中與其他六個網(wǎng)格相鄰,如圖1所示。位于棱邊的電場值由四個Yee網(wǎng)格共享,位于網(wǎng)格面中心的磁場值由兩個Yee網(wǎng)格共享。Figure1YeegridoftheFDTDalgorithm圖1FDTD算法的Yee網(wǎng)格CUDA編程模型的grid善于處理二維數(shù)據(jù),而需要求解的電磁目標為三維結構。本文采用了最直接的切片方法(SlicingMethod)將三維空間映射到二維,并以點構成面,以面構成體的方式來實現(xiàn)三維結構的仿真。如圖2所示,線程與三維空間中的Yee單元在位置上一一對應,x對應實際空間中的j,y對應k,并在jk平面遞增。線程所計算的點在同一個平面,相鄰的多個平面就組成了三維物理空間,便于完成三維電磁場仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads圖2Yee網(wǎng)格與CUDA線程的對應關系為了提高全局存儲器的訪存效率,本文對切片每一層都用CudaMallocPitch函數(shù)分配冗余存儲空間。Fermi計算架構64KB的片上存儲器可以配置成48KB的共享內(nèi)存和16KB的L1Cache,也可以配置成16KB的共享內(nèi)存和48KB的L1Cache。由于共享內(nèi)存需要顯式的代碼實現(xiàn),因此,本文采用低代價的L1Cache來提高數(shù)據(jù)訪問命中率。之前的嘗試也證實了采用共享內(nèi)存相對于采用L1Cache并沒有提升算法性能。3.2FDTD算法實現(xiàn)流程圖對于整個算法流程,計算機采用異構架構,GPU以協(xié)處理器的方式與CPU協(xié)同工作,程
維結構。本文采用了最直接的切片方法(SlicingMethod)將三維空間映射到二維,并以點構成面,以面構成體的方式來實現(xiàn)三維結構的仿真。如圖2所示,線程與三維空間中的Yee單元在位置上一一對應,x對應實際空間中的j,y對應k,并在jk平面遞增。線程所計算的點在同一個平面,相鄰的多個平面就組成了三維物理空間,便于完成三維電磁場仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads圖2Yee網(wǎng)格與CUDA線程的對應關系為了提高全局存儲器的訪存效率,本文對切片每一層都用CudaMallocPitch函數(shù)分配冗余存儲空間。Fermi計算架構64KB的片上存儲器可以配置成48KB的共享內(nèi)存和16KB的L1Cache,也可以配置成16KB的共享內(nèi)存和48KB的L1Cache。由于共享內(nèi)存需要顯式的代碼實現(xiàn),因此,本文采用低代價的L1Cache來提高數(shù)據(jù)訪問命中率。之前的嘗試也證實了采用共享內(nèi)存相對于采用L1Cache并沒有提升算法性能。3.2FDTD算法實現(xiàn)流程圖對于整個算法流程,計算機采用異構架構,GPU以協(xié)處理器的方式與CPU協(xié)同工作,程序的流程圖如圖3所示。主機端主要負責物理目標以及集總參數(shù)電路建模、模型媒質(zhì)參量初始化、內(nèi)存分配、媒質(zhì)網(wǎng)格剖分、場量和更新系數(shù)初始化,,將內(nèi)存中計算所用的三維電磁場數(shù)據(jù)變量等傳遞到顯存,激活內(nèi)核進行電磁場加速仿真,并維持電磁場在時間上的推進。設備端執(zhí)行核函數(shù),更新場域,完成全局場域以及CPML區(qū)域的場值計算。由2
【相似文獻】
相關期刊論文 前5條
1 許楨;;關于CPU+GPU異構計算的研究與分析[J];科技信息;2010年17期
2 金滔,徐煒民;網(wǎng)絡并行方式的PVM異構計算環(huán)境[J];上海大學學報(自然科學版);1996年02期
3 曾國蓀,周定康,黃明和;異構計算開發(fā)最大循環(huán)并行性(英文)[J];江西師范大學學報(自然科學版);2000年04期
4 魚濱,華慶一;基于CORBA的分布式異構計算環(huán)境的分析與實踐[J];西北大學學報(自然科學版);2000年02期
5 ;[J];;年期
相關會議論文 前2條
1 陳虎;陳思桐;李觀釗;羅偉良;甄真;張林亞;干蕓蕓;賴路雙;奚建清;;異構計算平臺上列存儲數(shù)據(jù)庫的并行查詢技術研究[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年
2 林新華;顧一眾;;上海交通大學高性能計算建設理念與實踐[A];中國高等教育學會教育信息化分會第十二次學術年會論文集[C];2014年
相關重要報紙文章 前9條
1 本報記者 霍光;走出異構計算的認識誤區(qū)[N];中國計算機報;2009年
2 本報記者 霍光;異構計算兩大引擎再次加速[N];中國計算機報;2009年
3 ;計算:從工作到生活[N];中國計算機報;2010年
4 姑蘇飄雪;異構計算,PC效率的提升之道[N];電腦報;2012年
5 本報記者 李萬予;Altera披露新異構計算核心[N];中國計算機報;2013年
6 本報記者 王星;異構計算引領軟件開發(fā)創(chuàng)新[N];電腦報;2012年
7 本報記者 霍光;計算未來[N];中國計算機報;2012年
8 ;“芯”融聚 謀未來[N];中國電腦教育報;2011年
9 李映;MIPS能否從“芯”再出發(fā)[N];中國電子報;2012年
相關博士學位論文 前1條
1 張丹;面向異構體系結構的任務流化技術研究[D];解放軍信息工程大學;2012年
相關碩士學位論文 前10條
1 范興山;基于異構計算的矩陣廣義逆算法研究及實現(xiàn)[D];電子科技大學;2014年
2 蒲宇亮;基于異構計算系統(tǒng)的圖像信息提取關鍵算法研究與實現(xiàn)[D];電子科技大學;2016年
3 彭玉炳;基于異構計算的CNN并行框架的設計與實現(xiàn)[D];電子科技大學;2016年
4 紀劍雄;基于異構計算系統(tǒng)中動態(tài)任務分配的蜂群算法研究[D];華東師范大學;2008年
5 周斯波;異構計算環(huán)境下的地圖代數(shù)空間分析并行方法研究[D];中國地質(zhì)大學;2013年
6 朱偉;異構計算環(huán)境下高性能網(wǎng)絡模擬任務劃分[D];江南大學;2014年
7 張勝輝;基于FPGA加速的異構計算多結點系統(tǒng)實時硬件任務調(diào)度與管理[D];華東交通大學;2013年
8 何東陽;適用異構計算環(huán)境中監(jiān)控軟件系統(tǒng)的研究與實踐[D];東華大學;2012年
9 周子航;基于OpenCL異構計算的數(shù)學圖像繪制[D];廣州大學;2013年
10 江文;異構計算環(huán)境下任務調(diào)度算法的研究[D];湖南大學;2010年
本文編號:2558968
本文鏈接:http://sikaile.net/kejilunwen/wulilw/2558968.html