天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

“神威·太湖之光”上某流體力學(xué)應(yīng)用的任務(wù)圖并行化研究

發(fā)布時(shí)間:2025-03-29 23:26
  近幾年來,眾核處理器的不斷發(fā)展,對并行編程模型在并行編程簡單化、高并行效率方面提出了高的要求,成為了高性能計(jì)算領(lǐng)域的研究熱點(diǎn)!吧裢ぬ狻笔俏覈灾餮邪l(fā)的高性能眾核平臺(tái),申威眾核處理器支持加速線程庫和OpenACC并行編程模型。其中,加速線程庫采用修飾符(Modifier)的方式來對局部數(shù)據(jù)存儲(chǔ)器(Local Data Memory,LDM)空間中的常量或者變量進(jìn)行定義,用戶直接對線程和LDM空間進(jìn)行分配和管理,編程層次較低。申威并行編程模型OpenACC以編譯制導(dǎo)的方式實(shí)現(xiàn)應(yīng)用程序并行化,并提供對中間代碼的二次開發(fā)解決方案,解決僅靠編譯制導(dǎo)方式存在的計(jì)算性能局限問題,但申威OpenACC并未發(fā)掘不同任務(wù)之間的LDM數(shù)據(jù)重用。AceMesh任務(wù)調(diào)度系統(tǒng)在多核眾核平臺(tái)實(shí)現(xiàn)針對網(wǎng)格應(yīng)用的并行調(diào)度。通過API接口的方式自動(dòng)發(fā)掘結(jié)構(gòu)化網(wǎng)格應(yīng)用中存在的數(shù)據(jù)驅(qū)動(dòng)任務(wù)圖的并行性,并提供多種手段發(fā)掘任務(wù)圖執(zhí)行中的數(shù)據(jù)局部性,克服多核、眾核平臺(tái)帶來的編程挑戰(zhàn)。本文基于“神威·太湖之光”的申威眾核處理器,在對某流體力學(xué)應(yīng)用的OpenACC并行版本分析研究的基礎(chǔ)上,實(shí)現(xiàn)該流體力學(xué)應(yīng)用的任務(wù)圖并行優(yōu)化,并...

【文章頁數(shù)】:62 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1申威眾核處理器兩級(jí)并行模式??Fig.2.1The?Two-level?Parallel?Mode?of?Sunway?Many-core?Processor??

圖2.1申威眾核處理器兩級(jí)并行模式??Fig.2.1The?Two-level?Parallel?Mode?of?Sunway?Many-core?Processor??

MPI并行,位置空間繼續(xù)挖掘更細(xì)粒度的并行,在位置空間采用任務(wù)圖并行,??實(shí)現(xiàn)“基于消息傳遞編程模型的MPI進(jìn)程級(jí)并行+基于任務(wù)圖調(diào)度并行的眾核線??程級(jí)并行”的兩級(jí)并行方式。如圖2.1所示,兩級(jí)并行模式能充分挖掘在“神威?太??湖之光”系統(tǒng)上的并行計(jì)算能力。??2D數(shù)組??'?....


圖2.2申威眾核處理器結(jié)構(gòu)圖??Fig.2.2The?Architecture?of?Sunway?Many-core?Processor??

圖2.2申威眾核處理器結(jié)構(gòu)圖??Fig.2.2The?Architecture?of?Sunway?Many-core?Processor??

2.?2.1?“神威?太湖之光”結(jié)構(gòu)??“祌威太湖之光”整機(jī)使用了?40960個(gè)采用異構(gòu)架構(gòu)的我國自主研發(fā)的??“中國芯”[48?51]——申威眾核處理器。申威眾核處理器結(jié)構(gòu)如圖2.2、2.3所示。??每個(gè)申威眾核處理器主要由4個(gè)異構(gòu)群組成,每個(gè)異構(gòu)群均采用主從核結(jié)??構(gòu),其中兩....


圖2.4申威26010存儲(chǔ)模型示意圖??Fig.2.4?SW26010?Storage?Model?Diagram??

圖2.4申威26010存儲(chǔ)模型示意圖??Fig.2.4?SW26010?Storage?Model?Diagram??

片上融合異構(gòu)眾核體系結(jié)構(gòu),device可直接訪問主存空間,并在device內(nèi)提供??加速線程私有的高速緩沖(LDM,Local?Data?Memory),加速計(jì)算需要存放到LDM??的數(shù)據(jù)由device控制傳輸。本系統(tǒng)支持的存儲(chǔ)模型如圖2.4所示。??「??????????主搬6....


圖2.5?AceMesh任務(wù)調(diào)度系統(tǒng)的結(jié)構(gòu)圖??

圖2.5?AceMesh任務(wù)調(diào)度系統(tǒng)的結(jié)構(gòu)圖??

圖2.5?AceMesh任務(wù)調(diào)度系統(tǒng)的結(jié)構(gòu)圖??Fig.2.5?General?process?of?collaborative?filtering??圖2.5是AceMesh任務(wù)調(diào)度系統(tǒng)的結(jié)構(gòu)圖。本調(diào)度系統(tǒng)包括四層:??最上層提供對外的接口,包括任務(wù)粒度的描述、數(shù)據(jù)流信息、任務(wù)....



本文編號(hào):4037819

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4037819.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶52029***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com