基于異構(gòu)計(jì)算的電磁仿真并行算法研究
發(fā)布時(shí)間:2017-07-16 06:12
本文關(guān)鍵詞:基于異構(gòu)計(jì)算的電磁仿真并行算法研究
更多相關(guān)文章: 計(jì)算電磁學(xué) 時(shí)域有限差分法 異構(gòu)計(jì)算 圖形處理器 計(jì)算統(tǒng)一設(shè)備架構(gòu)
【摘要】:時(shí)域有限差分(Finite Difference Time Domain, FDTD)法是求解電磁學(xué)麥克斯韋方程組的重要方法之一,一直以來(lái)獲得了廣泛的使用。時(shí)域有限差分法直接將含時(shí)間變量的麥克斯韋微分方程在Yee氏網(wǎng)格空間中采用中心差分方法轉(zhuǎn)換為差分方程。為了保證解的穩(wěn)定性,抑制數(shù)值色散,FDTD的空間步長(zhǎng)和時(shí)間步長(zhǎng)不宜過(guò)大。尤其在求解電大尺寸問(wèn)題時(shí),FDTD方法是非常耗時(shí)和耗內(nèi)存的。FDTD算法具有天然可并行性,采用并行計(jì)算的方法可以縮短計(jì)算時(shí)間,提高計(jì)算速度。近年來(lái),隨著硬件技術(shù)的快速發(fā)展,圖形處理器(Graphic Processing Unit, GPU)的實(shí)際浮點(diǎn)運(yùn)算性能遠(yuǎn)遠(yuǎn)超過(guò)同期的CPU,并且價(jià)格低廉。隨著計(jì)算統(tǒng)一設(shè)備架構(gòu)(Compute Unified Device Architecture, CUD A)模型的出現(xiàn),使用圖形處理器進(jìn)行并行程序的開(kāi)發(fā)變得非常簡(jiǎn)潔高效。本文以“天河一號(hào)”(TH-1A)超級(jí)計(jì)算機(jī)為平臺(tái),采用CUDA開(kāi)發(fā)工具,完成了三維FDTD高性能加速計(jì)算。論文主要完成工作如下:(1)在平臺(tái)上,首次將TH-1A超級(jí)計(jì)算機(jī)系統(tǒng)的應(yīng)用拓展到電磁計(jì)算領(lǐng)域。本次研究采用湖南大學(xué)超級(jí)計(jì)算機(jī)中心的超算系統(tǒng)為平臺(tái),利用其高LINPACK性能峰值和異構(gòu)協(xié)同并行的特性,實(shí)現(xiàn)了三維FDTD并行算法。(2)在算法優(yōu)化上,采用頁(yè)鎖定內(nèi)存來(lái)存儲(chǔ)需要在主機(jī)端使用的場(chǎng)量,減少數(shù)據(jù)傳輸消耗;將場(chǎng)量采用低代價(jià)的L1 cache緩存,提高數(shù)據(jù)訪(fǎng)問(wèn)命中率。優(yōu)化后的三維F DTD并行算法,相比未進(jìn)行優(yōu)化的異構(gòu)并行算法加速比提升了4倍左右。(3)在算法評(píng)價(jià)體系上,從不同方面對(duì)設(shè)計(jì)的三維FDTD并行算法進(jìn)行了比較分析,進(jìn)一步從多個(gè)方面說(shuō)明了算法的高速率特性。(4)在電磁應(yīng)用上,擴(kuò)充了三維FDTD并行算法在電磁計(jì)算方面的實(shí)際應(yīng)用。5對(duì)帶阻濾波器進(jìn)行仿真計(jì)算,實(shí)驗(yàn)結(jié)果表明,與串行算法相比,加速比達(dá)到55倍,計(jì)算誤差在10-4范圍內(nèi)。
【關(guān)鍵詞】:計(jì)算電磁學(xué) 時(shí)域有限差分法 異構(gòu)計(jì)算 圖形處理器 計(jì)算統(tǒng)一設(shè)備架構(gòu)
【學(xué)位授予單位】:湖南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:O441;TP338.6
【目錄】:
- 摘要5-6
- Abstract6-11
- 第1章 引言11-22
- 1.1 電磁計(jì)算方法及其應(yīng)用11-16
- 1.1.1 有限元法12-13
- 1.1.2 矩量法13-14
- 1.1.3 時(shí)域有限差分法14-16
- 1.2 論文的研究背景及意義16-17
- 1.3 研究狀況與進(jìn)展17-19
- 1.4 主要工作與創(chuàng)新19-20
- 1.5 論文的組織框架20-22
- 第2章 并行計(jì)算及通用圖形處理器技術(shù)22-42
- 2.1 并行計(jì)算技術(shù)22-27
- 2.1.1 并行計(jì)算硬件環(huán)境22-24
- 2.1.2 并行計(jì)算軟件編程模型24-27
- 2.2 并行計(jì)算的性能評(píng)估27-29
- 2.2.1 并行程序執(zhí)行時(shí)間27-28
- 2.2.2 并行加速比和并行效率28
- 2.2.3 算法的可擴(kuò)展性28-29
- 2.3 通用圖形處理技術(shù)29-31
- 2.3.1 圖形處理器29-30
- 2.3.2 并行程序開(kāi)發(fā)30-31
- 2.4 CUDA的硬件架構(gòu)31-34
- 2.4.1 Fermi架構(gòu)31-33
- 2.4.2 kepler架構(gòu)33-34
- 2.5 CUDA編程模型34-41
- 2.5.1 主機(jī)與設(shè)備34-35
- 2.5.2 線(xiàn)程層次35-37
- 2.5.3 硬件映射37-38
- 2.5.4 軟件體系38-39
- 2.5.5 存儲(chǔ)體系39-41
- 2.6 小結(jié)41-42
- 第3章 時(shí)域有限差分算法42-60
- 3.1 Maxwell方程組及其FDTD形式42-47
- 3.1.1 Maxwell方程組和Yee元胞42-43
- 3.1.2 三維空間的FDTD43-45
- 3.1.3 介質(zhì)表面電磁參數(shù)45-47
- 3.2 數(shù)值穩(wěn)定性和色散47-48
- 3.3 激勵(lì)源48-49
- 3.3.1 時(shí)諧場(chǎng)源48
- 3.3.2 脈沖源48-49
- 3.4 吸收邊界條件49-55
- 3.4.1 Mur吸收邊界49-50
- 3.4.2 完全匹配層吸收邊界50-54
- 3.4.3 卷積完全匹配層54-55
- 3.5 實(shí)際應(yīng)用中的三維FDTD并行算法55-59
- 3.5.1 實(shí)際應(yīng)用中介質(zhì)表面電磁參數(shù)的選取55-56
- 3.5.2 實(shí)際應(yīng)用中CPML參數(shù)分布56-58
- 3.5.3 經(jīng)典理論與應(yīng)用分析58-59
- 3.7 小結(jié)59-60
- 第4章 基于CUDA的三維CPML-FDTD并行算法仿真及應(yīng)用60-79
- 4.1 三維CPML-FDTD并行算法60-63
- 4.1.1 并行算法設(shè)計(jì)60-61
- 4.1.2 并行算法優(yōu)化61-63
- 4.2 三維CPML-FDTD并行算法實(shí)現(xiàn)63-66
- 4.3 三維CPML-FDTD并行算法的應(yīng)用66-72
- 4.3.1 電路算例67-68
- 4.3.2 帶阻濾波器算例68-72
- 4.4 程序功能和性能驗(yàn)證72-78
- 4.4.1 實(shí)驗(yàn)環(huán)境72-73
- 4.4.2 評(píng)價(jià)指標(biāo)73
- 4.4.3 實(shí)驗(yàn)結(jié)果分析73-78
- 4.5 小結(jié)78-79
- 總結(jié)與展望79-81
- 參考文獻(xiàn)81-86
- 致謝86-87
- 附錄A 攻讀碩士學(xué)位期間所發(fā)表的主要學(xué)術(shù)論文目錄87-88
- 附錄B 攻讀碩士學(xué)位期間所參加的科研項(xiàng)目目錄88
本文編號(hào):547335
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/547335.html
最近更新
教材專(zhuān)著