面向國產(chǎn)異構(gòu)眾核系統(tǒng)的Parallel C語言設(shè)計(jì)與實(shí)現(xiàn)
文內(nèi)圖片:
圖片說明: 766JournalofSoftware軟件學(xué)報(bào)Vol.28,No.4,April2017開發(fā)硬件數(shù)百萬到10億量級(jí)規(guī)模處理器核心的并發(fā)度,能表示多種類型、不同層次的并行性;(2)要能有效支持系統(tǒng)復(fù)雜的存儲(chǔ)結(jié)構(gòu)、局部性描述和高效的數(shù)據(jù)移動(dòng).2國產(chǎn)異構(gòu)眾核系統(tǒng)面向高性能計(jì)算的眾核處理器包括Intel的MIC[17]、Nvidia和AMD的GPU[18,19]、Godson-T[20]、申威眾核處理器等.申威眾核處理器的結(jié)構(gòu)如圖1所示[21],每顆處理器包含4個(gè)core-groups(CGs),每個(gè)CG包含1個(gè)MPE(managementprocessingelement,簡稱主核)、1個(gè)8×8的computingprocessingelement(CPE,簡稱從核)cluster和1個(gè)memorycontroller(MC),4個(gè)CG通過片上網(wǎng)絡(luò)(NoC)互連,處理器通過Systeminterface(SI)連接外部設(shè)備.申威眾核處理器的主核和從核共享memory,從核采用輕量級(jí)的核心設(shè)計(jì),配備由軟件管理的高速存儲(chǔ)器SPM(scratchpadmemory)[22],支持通過DMA(directmemoryaccess)方式在memory和SPM間批量傳輸數(shù)據(jù).Fig.1ArchitectureofthenewSunwayprocessor圖1申威眾核處理器結(jié)構(gòu)基于申威眾核處理器的異構(gòu)眾核系統(tǒng)架構(gòu)如圖2所示,運(yùn)算系統(tǒng)采用申威眾核處理器構(gòu)建,通過中心交換網(wǎng)絡(luò)和管理網(wǎng)絡(luò)與存儲(chǔ)系統(tǒng)和管理系統(tǒng)連接,系統(tǒng)的登陸界面和存儲(chǔ)空間采用單一映像組織,為用戶提供統(tǒng)一的視圖.國產(chǎn)異構(gòu)眾核系統(tǒng)運(yùn)算系統(tǒng)存儲(chǔ)系統(tǒng)中心交換網(wǎng)絡(luò)(InfiniBand)管理網(wǎng)(GigaNet)管理系統(tǒng)遠(yuǎn)程網(wǎng)絡(luò)用戶終端Fig.2Architectureofdomesticheterogenousmany-coresystem圖2異構(gòu)眾核系統(tǒng)結(jié)構(gòu)
文內(nèi)圖片:
圖片說明: 何王全等:面向國產(chǎn)異構(gòu)眾核系統(tǒng)的ParallelC語言設(shè)計(jì)與實(shí)現(xiàn)7673面向異構(gòu)眾核系統(tǒng)的并行編程模型眾核系統(tǒng)的顯著特征是計(jì)算資源眾多、并行層次比多核系統(tǒng)更為復(fù)雜,編程和優(yōu)化的難度也比多核系統(tǒng)大,需要在并行編程模型和語言設(shè)計(jì)上有所突破,滿足不同層次人員的編程需要.針對(duì)申威眾核處理器異構(gòu)并行、共享主存的架構(gòu)特征,我們提出了多模式并行編程模型,包括異構(gòu)融合的加速運(yùn)算模型和按同構(gòu)方式編程的自主運(yùn)算模型,并且在此基礎(chǔ)上設(shè)計(jì)實(shí)現(xiàn)了統(tǒng)一架構(gòu)的并行編程語言ParallelC.異構(gòu)融合的加速運(yùn)算模型如圖3所示,該模型有如下特點(diǎn).1)ParallelC的進(jìn)程(類似MPI進(jìn)程)運(yùn)行于眾核處理器的主核,負(fù)責(zé)管理控制、通信、I/O等復(fù)雜的操作,大量的加速線程運(yùn)行于眾核處理器的從核,負(fù)責(zé)加速核心計(jì)算代碼;2)進(jìn)程和加速線程共享memory,與x86+GPU或x86+MIC上的編程模型相比,無需在兩種存儲(chǔ)器之間通過PCI-E或其他接口進(jìn)行數(shù)據(jù)傳輸,編程方便、效率也更高;3)在節(jié)點(diǎn)內(nèi),可以通過共享擴(kuò)展描述,方便地實(shí)現(xiàn)共享編程,提高節(jié)點(diǎn)內(nèi)數(shù)據(jù)交換的效率;4)在進(jìn)程之間,通過消息進(jìn)行數(shù)據(jù)交換,并支持多級(jí)局部性描述,使ParallelC可高效擴(kuò)充到大規(guī)模環(huán)境.該模型支持消息、共享和加速運(yùn)算的任意組合,可有效描述異構(gòu)系統(tǒng)多維度的并行,解決MPI+X模型要求用戶掌握2~3種編程語言的問題.Fig.3Acceleratedcomputingmodel圖3異構(gòu)融合的加速運(yùn)算模型設(shè)計(jì)按同構(gòu)方式編程的自主運(yùn)算模型有兩個(gè)目的.一是讓程序員以熟悉的多核方式編程,最大限度地屏蔽異構(gòu)眾核系統(tǒng)的復(fù)雜性;二是兼容ParallelC在多核環(huán)境下的遺產(chǎn)代碼.自主運(yùn)算模型如圖4所示,程序員只需按傳統(tǒng)多核方式進(jìn)行編程,由編譯系統(tǒng)將同構(gòu)、單維度并行描述映射到異構(gòu)、多維度并行的體系結(jié)構(gòu),ParallelC進(jìn)程運(yùn)行于從核上,通信、I/O、系統(tǒng)調(diào)用等復(fù)雜的功能則由主?
【作者單位】: 江南計(jì)算技術(shù)研究所;
【基金】:國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973)(2016YFB0200502) 國家高技術(shù)研究發(fā)展計(jì)劃(863)(2012AA010903,2015AA 01A301) 計(jì)算機(jī)體系結(jié)構(gòu)國家重點(diǎn)實(shí)驗(yàn)室基金(CARCH201403)~~
【分類號(hào)】:TP312.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 Haohuan FU;Junfeng LIAO;Jinzhe YANG;Lanning WANG;Zhenya SONG;Xiaomeng HUANG;Chao YANG;Wei XUE;Fangfang LIU;Fangli QIAO;Wei ZHAO;Xunqiang YIN;Chaofeng HOU;Chenglong ZHANG;Wei GE;Jian ZHANG;Yangang WANG;Chunbo ZHOU;Guangwen YANG;;The Sunway Taihu Light supercomputer:system and applications[J];Science China(Information Sciences);2016年07期
2 Wei Wu;Fengbin Qi;Wangquan He;Shanshan Wang;;CUDA's Mapped Memory to Support I/O Functions on GPU[J];Tsinghua Science and Technology;2013年06期
3 范東睿;袁楠;張軍超;周永彬;林偉;宋風(fēng)龍;葉笑春;黃河;余磊;龍國平;張浩;劉磊;;Godson-T:An Efficient Many-Core Architecture for Parallel Program Executions[J];Journal of Computer Science & Technology;2009年06期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 許漢君;劉林龍;楊海濤;繆雪龍;;燃燒室?guī)缀蜟FD自動(dòng)優(yōu)化程序開發(fā)[J];現(xiàn)代車用動(dòng)力;2017年02期
2 趙美婷;劉軼;劉銳;宋凱達(dá);錢德沛;;基于申威眾核處理器的HOG特征提取算法并行加速[J];計(jì)算機(jī)工程與科學(xué);2017年04期
3 何王全;劉勇;方燕飛;魏迪;漆鋒濱;;面向國產(chǎn)異構(gòu)眾核系統(tǒng)的Parallel C語言設(shè)計(jì)與實(shí)現(xiàn)[J];軟件學(xué)報(bào);2017年04期
4 胡森森;計(jì)衛(wèi)星;王一拙;陳旭;付文飛;石峰;;片上多核處理器Cache一致性協(xié)議優(yōu)化研究綜述[J];軟件學(xué)報(bào);2017年04期
5 侯超峰;高國賢;徐驥;;納米材料制備及物性測量的虛擬過程工程初探[J];計(jì)算機(jī)與應(yīng)用化學(xué);2016年09期
6 石嵩;寧永波;李宏亮;鄭方;;陣列眾核結(jié)構(gòu)上的一種多層分區(qū)Hash連接算法[J];計(jì)算機(jī)科學(xué);2016年03期
7 石嵩;李宏亮;朱巍;;陣列眾核處理器上的高效歸并排序算法[J];計(jì)算機(jī)研究與發(fā)展;2016年02期
8 閆喬;覃志東;王紹宇;閆紅曼;;同構(gòu)多核/眾核處理器任務(wù)分配自適應(yīng)模擬退火算法[J];計(jì)算機(jī)科學(xué);2014年06期
9 吳志敏;呂慧偉;陳明宇;;一個(gè)針對(duì)并行模擬引擎的性能評(píng)測實(shí)例[J];計(jì)算機(jī)科學(xué);2013年03期
10 張輪凱;宋風(fēng)龍;王達(dá);;一種針對(duì)片上眾核結(jié)構(gòu)共享末級(jí)緩存的改進(jìn)的LFU替換算法[J];計(jì)算機(jī)應(yīng)用與軟件;2013年01期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 楊學(xué)軍;廖湘科;盧凱;胡慶豐;宋君強(qiáng);蘇金樹;;The TianHe-1A Supercomputer: Its Hardware and Software[J];Journal of Computer Science & Technology;2011年03期
2 楊永增,喬方利,趙偉,滕涌,袁業(yè)立;球坐標(biāo)系下MASNUM海浪數(shù)值模式的建立及其應(yīng)用[J];海洋學(xué)報(bào)(中文版);2005年02期
,本文編號(hào):2513060
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2513060.html