天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

基于申威處理器的PETSc異構(gòu)并行算法設(shè)計(jì)和研究

發(fā)布時(shí)間:2020-10-02 09:50
   隨著科學(xué)技術(shù)的不斷發(fā)展,世界上的各國都在大力研制自己的超級(jí)計(jì)算機(jī),超級(jí)計(jì)算的性能排名也彰顯了一個(gè)國家的綜合國力。近年來,我國的超級(jí)計(jì)算機(jī)的性能排名一直高居世界第一,離不開國家的大力支持和投入。在該前提下,國家并行計(jì)算機(jī)工程技術(shù)研究中心自主研發(fā)了申威眾核處理器,并以此為基礎(chǔ)芯片搭建了目前世界上性能最好的超級(jí)計(jì)算機(jī)——神威·太湖之光。為加快國產(chǎn)自主設(shè)計(jì)的超級(jí)計(jì)算機(jī)更快、更好地投入大科學(xué)的數(shù)值計(jì)算中,需要科研工作者對國產(chǎn)申為眾核處理器的體系結(jié)構(gòu)有深入理解,所以本文的第一個(gè)工作是對申威眾核處理器架構(gòu)的研究和學(xué)習(xí),并對神威·太湖之光的總體架構(gòu)進(jìn)行理解。PETSc工具箱由美國能源部支持開發(fā),廣泛用于大規(guī)模的偏微分方程的求解,是大規(guī)?茖W(xué)數(shù)值計(jì)算的基礎(chǔ)庫。在許多的超級(jí)計(jì)算機(jī)的應(yīng)用中都需要調(diào)用通用的共性數(shù)學(xué)庫,其中PETSc函數(shù)庫就是這一類數(shù)學(xué)庫,PETSc函數(shù)庫已經(jīng)在CPU+GPU異構(gòu)體系中得到充分的運(yùn)用,但是在國產(chǎn)的眾核異構(gòu)芯片上的運(yùn)用基礎(chǔ)為零,要想實(shí)現(xiàn)其在國產(chǎn)眾核異構(gòu)芯片上的運(yùn)用,首先需要深入了解PETSc函數(shù)庫的軟件結(jié)構(gòu),所以本文的第二個(gè)工作是對PETSc函數(shù)庫的學(xué)習(xí)和研究。在完成對硬件和軟件的學(xué)習(xí)和研究后,本文的第三個(gè)工作是根據(jù)軟件特點(diǎn)和硬件特點(diǎn)來實(shí)現(xiàn)整個(gè)PETSc函數(shù)庫的移植,并根據(jù)研究需要,對PETSc函數(shù)庫中部分的核心函數(shù)進(jìn)行優(yōu)化,運(yùn)行時(shí),最多用到神威·太湖之光8192個(gè)計(jì)算節(jié)點(diǎn),最后的實(shí)驗(yàn)結(jié)果表明:部分核心函數(shù)的并行算法在優(yōu)化后,單節(jié)點(diǎn)的加速比最大達(dá)到16.4,基本達(dá)到理論加速比;在輸入規(guī)模較大的多節(jié)點(diǎn)MPI可擴(kuò)展性測試中,8192個(gè)節(jié)點(diǎn)的運(yùn)行時(shí)間與256個(gè)節(jié)點(diǎn)的運(yùn)行時(shí)間之比為32,,且加速比隨著異構(gòu)處理器數(shù)目的線性增加接近線性增加,表明PETSc核心函數(shù)并行算法在神威·太湖之光超級(jí)計(jì)算機(jī)上具有良好的可擴(kuò)展性。
【學(xué)位單位】:湖南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP332
【部分圖文】:

程序模擬


近似度排序)、BLAS 和 LAPACK、CUSP(一個(gè)基于 CUDA GPUS 的 C++模稀疏矩陣函數(shù)庫)、ESSL(用于 IBM 的數(shù)學(xué)庫快速稀疏直接 LU 分解)、FFTW歐美最快的傅里葉變換)等等。就此來看 PETSc 工具箱的研究已經(jīng)滲入到各個(gè)他的函數(shù)庫中,它們相輔相成。許多用戶也利用 PETSc 工具箱進(jìn)行應(yīng)用開發(fā)并具體的良好的效果例如:地震陷周期地殼形變模擬的 DFDMOD 并行多物理有限元程序[7],DEFMOD 是一個(gè)較小的,但完全非結(jié)構(gòu)化且并行的多物理有限元代碼,包括 2D 或者 3D、隱式者顯式等,用于模擬地殼變形的時(shí)間尺度范圍從毫秒到數(shù)千年。它可以用來模擬由于地震和火山破裂、粘彈性松弛、冰川后回彈、孔隙彈性彈、水文(UN)加載、地下水庫的流體注入和/或撤出等動(dòng)態(tài)和準(zhǔn)靜態(tài)過程引的變形。FIDMOD 是用 FORTRAN 95 編寫的,并使用 PETSC 的稀疏數(shù)據(jù)結(jié)構(gòu)和求解。在 PCS 或 HPC 集群上,可以使用(穩(wěn)定)線性三、四、四重或十六進(jìn)制元來解決問題。到目前為止,只支持規(guī)定的負(fù)載。部分結(jié)果如圖 1.1 所示:

模擬結(jié)果


圖 1.2 W7—X 聚變模擬結(jié)果德國格賴夫斯瓦爾德 W7-X 聚變實(shí)驗(yàn)中平行流的 Fokk-普朗克動(dòng)力學(xué)計(jì)算[8],中 Fokk-普朗克動(dòng)力學(xué)的解法計(jì)算簡稱 SFINCS,SIFCS 是一種計(jì)算非軸對稱或?qū)ΨQ環(huán)形等離子體中的新古典效應(yīng)的代碼,如星狀體和托卡馬克。該代碼解決每個(gè)物種的分布函數(shù)的漂移動(dòng)力學(xué)方程。除了新古典通量、流動(dòng)和自舉電流之,還可以獲得其他時(shí)刻,例如通量表面上的密度變化,或者分布函數(shù)本身; PETSc 函數(shù)庫開發(fā),它的模擬結(jié)果如圖 1.2 所示。因此,就目前來看,PETSc 工具箱的研究和應(yīng)用的范圍十分廣泛。對于我們應(yīng)用研究,充分的去了解和學(xué)習(xí) PETSc 工具箱的底層實(shí)現(xiàn)顯得十分有必要。.2.2 神威·太湖之光研究現(xiàn)狀超級(jí)計(jì)算機(jī)是世界上大國科技競爭的角逐點(diǎn)之一,我國一直在大力發(fā)展超級(jí)算機(jī)的研究,從最早的銀河系列到天河系列再到神威系列,彰顯了我國對大型級(jí)計(jì)算機(jī)的重視。正因如此,也涌現(xiàn)了一大批前仆后繼的科研工作者對超級(jí)計(jì)

異構(gòu)


圖 3.4 異構(gòu)編譯3.5 主從核設(shè)計(jì)引發(fā)的思考申威處理器的主核和從核的異構(gòu)體系結(jié)構(gòu)設(shè)計(jì)給予了編程人員更加靈活的編程方式和算法設(shè)計(jì)空間,通過主從核的異構(gòu)體系結(jié)構(gòu)設(shè)計(jì)也引發(fā)了一些直觀的思考:1)首先最直觀也是最重要的是當(dāng)程序單節(jié)點(diǎn)運(yùn)行時(shí)主從核的加速效果如何,而多節(jié)點(diǎn)的 MPI 可擴(kuò)展性又如何?2)從核進(jìn)行 DMA 批量訪問主存時(shí),意味著數(shù)據(jù)的傳輸,那么數(shù)據(jù)傳輸?shù)拇笮槎嗌俦容^合適,多大的數(shù)據(jù)量才能保證最好的性能呢?3)從核個(gè)數(shù)為 64 個(gè),那么在進(jìn)行主核與從核之間的數(shù)據(jù)傳輸時(shí),從核的個(gè)數(shù)對傳輸?shù)挠绊懭绾危?)從核可以用 DMA 方式批量從主存獲得數(shù)據(jù),也可以通過離散的直接訪問主存方式獲取數(shù)據(jù),對于一些程序從核需要隨機(jī)不連續(xù)的訪存,這樣的訪存

【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 鄭方;張昆;鄔貴明;高紅光;唐勇;呂暉;過鋒;李宏亮;謝向輝;陳左寧;;面向高性能計(jì)算的眾核處理器結(jié)構(gòu)級(jí)高能效技術(shù)[J];計(jì)算機(jī)學(xué)報(bào);2014年10期

2 王濤;;“天河二號(hào)”超級(jí)計(jì)算機(jī)[J];科學(xué);2013年04期

3 徐瑩;徐磊;姜愷;;三維Navier-Stokes方程分步法的并行算法在異構(gòu)平臺(tái)上實(shí)現(xiàn)初探[J];計(jì)算機(jī)工程與科學(xué);2012年09期

4 呂明洲;陳耀武;;基于異構(gòu)多核處理器的H.264并行編碼算法[J];計(jì)算機(jī)工程;2012年16期

5 蔣建春;汪同慶;曾素華;;求解異構(gòu)并行系統(tǒng)任務(wù)分配的混合離散粒子群算法[J];控制與決策;2011年09期

6 李樹;田東風(fēng);鄧力;;中子中子碰撞產(chǎn)生超高能中子問題模擬[J];計(jì)算物理;2010年05期

7 蔣韻聯(lián);孫廣中;許胤龍;;并行異構(gòu)系統(tǒng)中的一種高效任務(wù)調(diào)度算法[J];計(jì)算機(jī)工程;2007年11期

8 陸林生;董超群;李志輝;;多相空間數(shù)值模擬并行化研究[J];計(jì)算機(jī)科學(xué);2003年03期

相關(guān)博士學(xué)位論文 前1條

1 肖漢;基于CPU+GPU的影像匹配高效能異構(gòu)并行計(jì)算研究[D];武漢大學(xué);2011年

相關(guān)碩士學(xué)位論文 前1條

1 宋志方;面向天河二號(hào)異構(gòu)眾核平臺(tái)的CFD模擬與性能優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年



本文編號(hào):2832250

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2832250.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶35b48***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com