基于申威處理器的PETSc異構(gòu)并行算法設(shè)計(jì)和研究
【學(xué)位單位】:湖南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP332
【部分圖文】:
近似度排序)、BLAS 和 LAPACK、CUSP(一個(gè)基于 CUDA GPUS 的 C++模稀疏矩陣函數(shù)庫)、ESSL(用于 IBM 的數(shù)學(xué)庫快速稀疏直接 LU 分解)、FFTW歐美最快的傅里葉變換)等等。就此來看 PETSc 工具箱的研究已經(jīng)滲入到各個(gè)他的函數(shù)庫中,它們相輔相成。許多用戶也利用 PETSc 工具箱進(jìn)行應(yīng)用開發(fā)并具體的良好的效果例如:地震陷周期地殼形變模擬的 DFDMOD 并行多物理有限元程序[7],DEFMOD 是一個(gè)較小的,但完全非結(jié)構(gòu)化且并行的多物理有限元代碼,包括 2D 或者 3D、隱式者顯式等,用于模擬地殼變形的時(shí)間尺度范圍從毫秒到數(shù)千年。它可以用來模擬由于地震和火山破裂、粘彈性松弛、冰川后回彈、孔隙彈性彈、水文(UN)加載、地下水庫的流體注入和/或撤出等動(dòng)態(tài)和準(zhǔn)靜態(tài)過程引的變形。FIDMOD 是用 FORTRAN 95 編寫的,并使用 PETSC 的稀疏數(shù)據(jù)結(jié)構(gòu)和求解。在 PCS 或 HPC 集群上,可以使用(穩(wěn)定)線性三、四、四重或十六進(jìn)制元來解決問題。到目前為止,只支持規(guī)定的負(fù)載。部分結(jié)果如圖 1.1 所示:
圖 1.2 W7—X 聚變模擬結(jié)果德國格賴夫斯瓦爾德 W7-X 聚變實(shí)驗(yàn)中平行流的 Fokk-普朗克動(dòng)力學(xué)計(jì)算[8],中 Fokk-普朗克動(dòng)力學(xué)的解法計(jì)算簡稱 SFINCS,SIFCS 是一種計(jì)算非軸對稱或?qū)ΨQ環(huán)形等離子體中的新古典效應(yīng)的代碼,如星狀體和托卡馬克。該代碼解決每個(gè)物種的分布函數(shù)的漂移動(dòng)力學(xué)方程。除了新古典通量、流動(dòng)和自舉電流之,還可以獲得其他時(shí)刻,例如通量表面上的密度變化,或者分布函數(shù)本身; PETSc 函數(shù)庫開發(fā),它的模擬結(jié)果如圖 1.2 所示。因此,就目前來看,PETSc 工具箱的研究和應(yīng)用的范圍十分廣泛。對于我們應(yīng)用研究,充分的去了解和學(xué)習(xí) PETSc 工具箱的底層實(shí)現(xiàn)顯得十分有必要。.2.2 神威·太湖之光研究現(xiàn)狀超級(jí)計(jì)算機(jī)是世界上大國科技競爭的角逐點(diǎn)之一,我國一直在大力發(fā)展超級(jí)算機(jī)的研究,從最早的銀河系列到天河系列再到神威系列,彰顯了我國對大型級(jí)計(jì)算機(jī)的重視。正因如此,也涌現(xiàn)了一大批前仆后繼的科研工作者對超級(jí)計(jì)
圖 3.4 異構(gòu)編譯3.5 主從核設(shè)計(jì)引發(fā)的思考申威處理器的主核和從核的異構(gòu)體系結(jié)構(gòu)設(shè)計(jì)給予了編程人員更加靈活的編程方式和算法設(shè)計(jì)空間,通過主從核的異構(gòu)體系結(jié)構(gòu)設(shè)計(jì)也引發(fā)了一些直觀的思考:1)首先最直觀也是最重要的是當(dāng)程序單節(jié)點(diǎn)運(yùn)行時(shí)主從核的加速效果如何,而多節(jié)點(diǎn)的 MPI 可擴(kuò)展性又如何?2)從核進(jìn)行 DMA 批量訪問主存時(shí),意味著數(shù)據(jù)的傳輸,那么數(shù)據(jù)傳輸?shù)拇笮槎嗌俦容^合適,多大的數(shù)據(jù)量才能保證最好的性能呢?3)從核個(gè)數(shù)為 64 個(gè),那么在進(jìn)行主核與從核之間的數(shù)據(jù)傳輸時(shí),從核的個(gè)數(shù)對傳輸?shù)挠绊懭绾危?)從核可以用 DMA 方式批量從主存獲得數(shù)據(jù),也可以通過離散的直接訪問主存方式獲取數(shù)據(jù),對于一些程序從核需要隨機(jī)不連續(xù)的訪存,這樣的訪存
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 鄭方;張昆;鄔貴明;高紅光;唐勇;呂暉;過鋒;李宏亮;謝向輝;陳左寧;;面向高性能計(jì)算的眾核處理器結(jié)構(gòu)級(jí)高能效技術(shù)[J];計(jì)算機(jī)學(xué)報(bào);2014年10期
2 王濤;;“天河二號(hào)”超級(jí)計(jì)算機(jī)[J];科學(xué);2013年04期
3 徐瑩;徐磊;姜愷;;三維Navier-Stokes方程分步法的并行算法在異構(gòu)平臺(tái)上實(shí)現(xiàn)初探[J];計(jì)算機(jī)工程與科學(xué);2012年09期
4 呂明洲;陳耀武;;基于異構(gòu)多核處理器的H.264并行編碼算法[J];計(jì)算機(jī)工程;2012年16期
5 蔣建春;汪同慶;曾素華;;求解異構(gòu)并行系統(tǒng)任務(wù)分配的混合離散粒子群算法[J];控制與決策;2011年09期
6 李樹;田東風(fēng);鄧力;;中子中子碰撞產(chǎn)生超高能中子問題模擬[J];計(jì)算物理;2010年05期
7 蔣韻聯(lián);孫廣中;許胤龍;;并行異構(gòu)系統(tǒng)中的一種高效任務(wù)調(diào)度算法[J];計(jì)算機(jī)工程;2007年11期
8 陸林生;董超群;李志輝;;多相空間數(shù)值模擬并行化研究[J];計(jì)算機(jī)科學(xué);2003年03期
相關(guān)博士學(xué)位論文 前1條
1 肖漢;基于CPU+GPU的影像匹配高效能異構(gòu)并行計(jì)算研究[D];武漢大學(xué);2011年
相關(guān)碩士學(xué)位論文 前1條
1 宋志方;面向天河二號(hào)異構(gòu)眾核平臺(tái)的CFD模擬與性能優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
本文編號(hào):2832250
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2832250.html