基于異構(gòu)計算的三維FDTD并行算法及其在電磁仿真中的應(yīng)用
【圖文】:
Yee網(wǎng)格在三維空間中與其他六個網(wǎng)格相鄰,如圖1所示。位于棱邊的電場值由四個Yee網(wǎng)格共享,位于網(wǎng)格面中心的磁場值由兩個Yee網(wǎng)格共享。Figure1YeegridoftheFDTDalgorithm圖1FDTD算法的Yee網(wǎng)格CUDA編程模型的grid善于處理二維數(shù)據(jù),而需要求解的電磁目標(biāo)為三維結(jié)構(gòu)。本文采用了最直接的切片方法(SlicingMethod)將三維空間映射到二維,并以點構(gòu)成面,以面構(gòu)成體的方式來實現(xiàn)三維結(jié)構(gòu)的仿真。如圖2所示,線程與三維空間中的Yee單元在位置上一一對應(yīng),x對應(yīng)實際空間中的j,y對應(yīng)k,并在jk平面遞增。線程所計算的點在同一個平面,相鄰的多個平面就組成了三維物理空間,便于完成三維電磁場仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads圖2Yee網(wǎng)格與CUDA線程的對應(yīng)關(guān)系為了提高全局存儲器的訪存效率,本文對切片每一層都用CudaMallocPitch函數(shù)分配冗余存儲空間。Fermi計算架構(gòu)64KB的片上存儲器可以配置成48KB的共享內(nèi)存和16KB的L1Cache,也可以配置成16KB的共享內(nèi)存和48KB的L1Cache。由于共享內(nèi)存需要顯式的代碼實現(xiàn),因此,本文采用低代價的L1Cache來提高數(shù)據(jù)訪問命中率。之前的嘗試也證實了采用共享內(nèi)存相對于采用L1Cache并沒有提升算法性能。3.2FDTD算法實現(xiàn)流程圖對于整個算法流程,計算機(jī)采用異構(gòu)架構(gòu),GPU以協(xié)處理器的方式與CPU協(xié)同工作,程
維結(jié)構(gòu)。本文采用了最直接的切片方法(SlicingMethod)將三維空間映射到二維,并以點構(gòu)成面,以面構(gòu)成體的方式來實現(xiàn)三維結(jié)構(gòu)的仿真。如圖2所示,線程與三維空間中的Yee單元在位置上一一對應(yīng),x對應(yīng)實際空間中的j,y對應(yīng)k,并在jk平面遞增。線程所計算的點在同一個平面,相鄰的多個平面就組成了三維物理空間,便于完成三維電磁場仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads圖2Yee網(wǎng)格與CUDA線程的對應(yīng)關(guān)系為了提高全局存儲器的訪存效率,本文對切片每一層都用CudaMallocPitch函數(shù)分配冗余存儲空間。Fermi計算架構(gòu)64KB的片上存儲器可以配置成48KB的共享內(nèi)存和16KB的L1Cache,也可以配置成16KB的共享內(nèi)存和48KB的L1Cache。由于共享內(nèi)存需要顯式的代碼實現(xiàn),因此,本文采用低代價的L1Cache來提高數(shù)據(jù)訪問命中率。之前的嘗試也證實了采用共享內(nèi)存相對于采用L1Cache并沒有提升算法性能。3.2FDTD算法實現(xiàn)流程圖對于整個算法流程,計算機(jī)采用異構(gòu)架構(gòu),GPU以協(xié)處理器的方式與CPU協(xié)同工作,程序的流程圖如圖3所示。主機(jī)端主要負(fù)責(zé)物理目標(biāo)以及集總參數(shù)電路建模、模型媒質(zhì)參量初始化、內(nèi)存分配、媒質(zhì)網(wǎng)格剖分、場量和更新系數(shù)初始化,,將內(nèi)存中計算所用的三維電磁場數(shù)據(jù)變量等傳遞到顯存,激活內(nèi)核進(jìn)行電磁場加速仿真,并維持電磁場在時間上的推進(jìn)。設(shè)備端執(zhí)行核函數(shù),更新場域,完成全局場域以及CPML區(qū)域的場值計算。由2
【相似文獻(xiàn)】
相關(guān)期刊論文 前5條
1 許楨;;關(guān)于CPU+GPU異構(gòu)計算的研究與分析[J];科技信息;2010年17期
2 金滔,徐煒民;網(wǎng)絡(luò)并行方式的PVM異構(gòu)計算環(huán)境[J];上海大學(xué)學(xué)報(自然科學(xué)版);1996年02期
3 曾國蓀,周定康,黃明和;異構(gòu)計算開發(fā)最大循環(huán)并行性(英文)[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2000年04期
4 魚濱,華慶一;基于CORBA的分布式異構(gòu)計算環(huán)境的分析與實踐[J];西北大學(xué)學(xué)報(自然科學(xué)版);2000年02期
5 ;[J];;年期
相關(guān)會議論文 前2條
1 陳虎;陳思桐;李觀釗;羅偉良;甄真;張林亞;干蕓蕓;賴路雙;奚建清;;異構(gòu)計算平臺上列存儲數(shù)據(jù)庫的并行查詢技術(shù)研究[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
2 林新華;顧一眾;;上海交通大學(xué)高性能計算建設(shè)理念與實踐[A];中國高等教育學(xué)會教育信息化分會第十二次學(xué)術(shù)年會論文集[C];2014年
相關(guān)重要報紙文章 前9條
1 本報記者 霍光;走出異構(gòu)計算的認(rèn)識誤區(qū)[N];中國計算機(jī)報;2009年
2 本報記者 霍光;異構(gòu)計算兩大引擎再次加速[N];中國計算機(jī)報;2009年
3 ;計算:從工作到生活[N];中國計算機(jī)報;2010年
4 姑蘇飄雪;異構(gòu)計算,PC效率的提升之道[N];電腦報;2012年
5 本報記者 李萬予;Altera披露新異構(gòu)計算核心[N];中國計算機(jī)報;2013年
6 本報記者 王星;異構(gòu)計算引領(lǐng)軟件開發(fā)創(chuàng)新[N];電腦報;2012年
7 本報記者 霍光;計算未來[N];中國計算機(jī)報;2012年
8 ;“芯”融聚 謀未來[N];中國電腦教育報;2011年
9 李映;MIPS能否從“芯”再出發(fā)[N];中國電子報;2012年
相關(guān)博士學(xué)位論文 前1條
1 張丹;面向異構(gòu)體系結(jié)構(gòu)的任務(wù)流化技術(shù)研究[D];解放軍信息工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 范興山;基于異構(gòu)計算的矩陣廣義逆算法研究及實現(xiàn)[D];電子科技大學(xué);2014年
2 蒲宇亮;基于異構(gòu)計算系統(tǒng)的圖像信息提取關(guān)鍵算法研究與實現(xiàn)[D];電子科技大學(xué);2016年
3 彭玉炳;基于異構(gòu)計算的CNN并行框架的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2016年
4 紀(jì)劍雄;基于異構(gòu)計算系統(tǒng)中動態(tài)任務(wù)分配的蜂群算法研究[D];華東師范大學(xué);2008年
5 周斯波;異構(gòu)計算環(huán)境下的地圖代數(shù)空間分析并行方法研究[D];中國地質(zhì)大學(xué);2013年
6 朱偉;異構(gòu)計算環(huán)境下高性能網(wǎng)絡(luò)模擬任務(wù)劃分[D];江南大學(xué);2014年
7 張勝輝;基于FPGA加速的異構(gòu)計算多結(jié)點系統(tǒng)實時硬件任務(wù)調(diào)度與管理[D];華東交通大學(xué);2013年
8 何東陽;適用異構(gòu)計算環(huán)境中監(jiān)控軟件系統(tǒng)的研究與實踐[D];東華大學(xué);2012年
9 周子航;基于OpenCL異構(gòu)計算的數(shù)學(xué)圖像繪制[D];廣州大學(xué);2013年
10 江文;異構(gòu)計算環(huán)境下任務(wù)調(diào)度算法的研究[D];湖南大學(xué);2010年
本文編號:2558968
本文鏈接:http://sikaile.net/kejilunwen/wulilw/2558968.html