EFG法及其拓?fù)鋬?yōu)化的GPU并行計(jì)算研究
發(fā)布時(shí)間:2017-09-29 20:33
本文關(guān)鍵詞:EFG法及其拓?fù)鋬?yōu)化的GPU并行計(jì)算研究
更多相關(guān)文章: EFG法 拓?fù)鋬?yōu)化 GPU CUDA 并行加速 PCG法 交叉節(jié)點(diǎn)對
【摘要】:EFG(Element-Free Galerkin)法不僅擺脫了網(wǎng)格的束縛,而且具有計(jì)算穩(wěn)定性好、收斂速度快以及精度高等優(yōu)點(diǎn),另EFG法拓?fù)鋬?yōu)化可有效解決有限元法拓?fù)鋬?yōu)化中出現(xiàn)的重構(gòu)網(wǎng)格等問題,并可有效消除棋盤格現(xiàn)象,所以EFG法及其拓?fù)鋬?yōu)化吸引了越來越多學(xué)者們的關(guān)注。不過由于EFG法具有計(jì)算效率低的缺點(diǎn),嚴(yán)重束縛了它們在大規(guī)模問題中的研究及應(yīng)用。與此同時(shí),隨著GPU(Graphic Processing Unit)并行計(jì)算的迅速發(fā)展,其現(xiàn)已被廣泛應(yīng)用于眾多領(lǐng)域。因此,本文針對EFG法計(jì)算效率低和耗時(shí)長等缺點(diǎn),開展EFG法及其拓?fù)鋬?yōu)化的GPU并行計(jì)算研究,主要內(nèi)容有:(1)三維EFG結(jié)構(gòu)分析方法的研究及應(yīng)用。引入三角形單元(2D)或四面體單元(3D)代替EFG法傳統(tǒng)算法中的四邊形單元(2D)或六面體單元(3D)作為背景積分網(wǎng)格,并采用Hammer積分取代傳統(tǒng)算法中的Gauss積分實(shí)現(xiàn)EFG中的積分計(jì)算,推導(dǎo)出相關(guān)公式且通過數(shù)值算例驗(yàn)證了該方案的可行性。(2)EFG法的GPU并行計(jì)算研究。首先基于交叉節(jié)點(diǎn)對思想,提出了一種總體剛度矩陣、總體懲罰剛度矩陣和預(yù)處理矩陣的聯(lián)合組裝方案及其GPU并行算法;其次提出了一種耦合GPU和PCG(Preconditioned Conjugate Gradient)法的EFG法加速算法,并給出了該加速算法的相關(guān)公式推導(dǎo)過程及流程圖;而后通過數(shù)值算例,研究了PCG法求解EFG法總體離散控制方程的收斂速度及計(jì)算耗時(shí),并探討了求解域離散節(jié)點(diǎn)數(shù)及GPU線程塊大小對加速比的影響。(3)EFG法拓?fù)鋬?yōu)化的GPU并行計(jì)算研究。首先基于交叉節(jié)點(diǎn)對思想,提出了一種目標(biāo)函數(shù)靈敏度的并行算法,并結(jié)合CUDA架構(gòu)(Compute Unified Device Architecture)設(shè)計(jì)了目標(biāo)函數(shù)靈敏度和OC(Optimization Criterion)法的GPU并行算法;然后提出了一種EFG法拓?fù)鋬?yōu)化的GPU并行算法并給出了該算法流程圖。通過數(shù)值算例驗(yàn)證了上述算法的可行性及有效性,獲得了24倍的加速比,且探討了設(shè)計(jì)域離散節(jié)點(diǎn)數(shù)對加速比及優(yōu)化結(jié)果的影響。本文利用GPU并行計(jì)算顯著縮短了EFG法及其拓?fù)鋬?yōu)化的計(jì)算時(shí)間,提高了其計(jì)算效率,該研究對EFG法及其拓?fù)鋬?yōu)化應(yīng)用于工程問題具有重要的理論參考價(jià)值和工程實(shí)際意義。
【關(guān)鍵詞】:EFG法 拓?fù)鋬?yōu)化 GPU CUDA 并行加速 PCG法 交叉節(jié)點(diǎn)對
【學(xué)位授予單位】:湘潭大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP338.6
【目錄】:
- 摘要4-5
- Abstract5-9
- 主要符號(hào)對照表9-10
- 第1章 緒論10-17
- 1.1 研究背景及意義10-11
- 1.2 GPU并行計(jì)算研究現(xiàn)狀11-12
- 1.3 EFG法及其拓?fù)鋬?yōu)化研究現(xiàn)狀12-15
- 1.4 主要研究內(nèi)容15-17
- 第2章 EFG法算法改進(jìn)及CUDA架構(gòu)17-29
- 2.1 EFG法17-18
- 2.2 算法改進(jìn)18-24
- 2.2.0 積分方案18-20
- 2.2.1 節(jié)點(diǎn)影響域計(jì)算20-21
- 2.2.2 局部搜索格子法21-23
- 2.2.3 稀疏矩陣的壓縮存儲(chǔ)23-24
- 2.3 CUDA架構(gòu)24-28
- 2.3.1 編程模型24-25
- 2.3.2 線程結(jié)構(gòu)25-26
- 2.3.3 存儲(chǔ)器模型26-27
- 2.3.4 程序優(yōu)化27-28
- 2.4 本章小結(jié)28-29
- 第3章 EFG法的GPU并行計(jì)算研究29-46
- 3.1 系數(shù)矩陣組裝29-32
- 3.1.1 逐節(jié)點(diǎn)對法29-31
- 3.1.2 總體懲罰剛度矩陣31-32
- 3.1.3 系數(shù)矩陣的GPU并行組裝32
- 3.2 總體離散系統(tǒng)方程求解32-37
- 3.2.1 CG法33-34
- 3.2.2 PCG法34-37
- 3.3 計(jì)算流程37
- 3.4 數(shù)值算例37-42
- 3.5 PCG法求解EFG法42-43
- 3.6 加速比及其影響因素43-44
- 3.7 本章小結(jié)44-46
- 第4章 EFG法拓?fù)鋬?yōu)化的GPU并行計(jì)算研究46-63
- 4.1 EFG法拓?fù)鋬?yōu)化46-50
- 4.1.1 數(shù)學(xué)模型46-47
- 4.1.2 0C準(zhǔn)則47-49
- 4.1.3 靈敏度分析49-50
- 4.2 目標(biāo)函數(shù)靈敏度的并行算法50-54
- 4.2.1 算法改進(jìn)50-52
- 4.2.2 GPU并行算法52-54
- 4.3 OC法的GPU并行算法54-55
- 4.4 并行流程55-56
- 4.5 數(shù)值算例56-59
- 4.6 節(jié)點(diǎn)數(shù)對加速比的影響59
- 4.7 節(jié)點(diǎn)數(shù)對優(yōu)化結(jié)果的影響59-61
- 4.8 本章小結(jié)61-63
- 總結(jié)與展望63-65
- 參考文獻(xiàn)65-71
- 致謝71-72
- 附錄(攻讀碩士學(xué)位期間已發(fā)表論文及參與項(xiàng)目)72
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 蔡新;李洪煊;武穎利;朱杰;;工程結(jié)構(gòu)優(yōu)化設(shè)計(jì)研究進(jìn)展[J];河海大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
,本文編號(hào):944119
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/944119.html
最近更新
教材專著