面向眾核系統(tǒng)的塊Gauss-Seidel/Jacobi預條件子空間迭代法
發(fā)布時間:2025-02-08 18:52
大規(guī)?茖W與工程計算應用對計算需求的不斷增長,推動著高性能計算機系統(tǒng)計算能力邁向E級。未來E級系統(tǒng)在提供巨大計算能力的同時,也將給傳統(tǒng)數(shù)值并行算法帶來巨大挑戰(zhàn)和機遇。NKS(Newton-Krylov-Schwarz)算法作為求解大規(guī)模非線性方程組的求解器,在并行計算領(lǐng)域具有廣泛應用。面向未來的E級系統(tǒng),NKS算法將會產(chǎn)生全局通信瓶頸和無法充分利用異構(gòu)眾核架構(gòu)并行性等問題,這對算法性能和可擴展性造成巨大影響;谶@一問題,研究了面向眾核系統(tǒng)的塊Gauss-Seidel/Jacobi預條件子空間迭代法,主要包括以下三個方面:1、針對Krylov子空間迭代法中存在的全局通信瓶頸,基于LogP模型建立了一套全新的算法性能模型,該模型定量分析得出了Krylov子空間迭代法在大規(guī)模節(jié)點的情況下產(chǎn)生的全局通信瓶頸。在此基礎(chǔ)上,提出并實現(xiàn)了對PETSc高性能計算工具箱中GMRES、Chebyshev、Richardson、TCQMR四種Krylov子空間算法中包含的向量內(nèi)積、范數(shù)和標準化步驟進行非阻塞式通信優(yōu)化策略。在天河二號超級計算機平臺上對MPIAllreduce和MPI
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4031822
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2.14個處理器上運行GMRES的通信過程示意圖
圖2.14個處理器上運行GMRES的通信過程示意圖2.2Krylov子空間迭代法的性能建模2.2.1基于LogP模型的性能建模針對KSMs算法中的三個核心模塊(即SpMV,向量內(nèi)積和向量更新操作),考慮建立一套基于LogP模型的性能模型,以達到定量分....
圖2.2阻塞發(fā)送和阻塞接收過程示意圖
國防科技大學研究生院專業(yè)學位碩士學位論文3.1非阻塞通信標準說明非阻塞通信之前,首先需要簡單介紹MPI中的阻塞通信。阻塞發(fā)送和阻塞接收,如圖2.2所示,在調(diào)用MPI中的阻塞通信并成功返需傳遞的消息已經(jīng)成功發(fā)出或接收,且緩沖區(qū)的數(shù)據(jù)已經(jīng)傳遞完畢返回后,緩沖區(qū)可被釋放;....
圖2.3非阻塞發(fā)送和非阻塞接收過程示意圖
圖2.4THExpress-2互聯(lián)網(wǎng)絡(luò)架構(gòu)與拓撲
圖2.4THExpress-2互聯(lián)網(wǎng)絡(luò)架構(gòu)與拓撲2性能結(jié)果MPI標準中的MPI<sub>A</sub>llreduce和MPI<sub>I</sub>allreduce接口,在天河二上測試得到的數(shù)據(jù)如圖2.5。其中,采用的MPI實現(xiàn)為MPICH傳輸?shù)?...
本文編號:4031822
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4031822.html
最近更新
教材專著