天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

面向國產(chǎn)異構(gòu)眾核系統(tǒng)的Parallel C語言設(shè)計與實現(xiàn)

發(fā)布時間:2019-07-11 09:45
【摘要】:異構(gòu)眾核架構(gòu)具有超高的性能功耗比,已成為超級計算機體系結(jié)構(gòu)的重要發(fā)展方向.但眾核系統(tǒng)更為復雜的并行層次和存儲層次,給編程和優(yōu)化帶來了極大的挑戰(zhàn).因此,研究面向眾核系統(tǒng)的并行編程技術(shù),對于降低國產(chǎn)眾核系統(tǒng)并行應(yīng)用的編程難度、提升并行程序的性能都具有重要的意義.提出統(tǒng)一架構(gòu)的多模式并行編程模型,包括異構(gòu)融合的加速運算模型和按同構(gòu)方式編程的自主運算模型,根據(jù)編程模型設(shè)計了Parallel C語言,能夠有效地描述國產(chǎn)眾核系統(tǒng)的異構(gòu)并行性.與其他眾核系統(tǒng)上MPI+X的使用模式相比,編程和系統(tǒng)優(yōu)化都具有全局視角,在多級局部性描述、單邊消息、兼容已有多核應(yīng)用等方面具有特色;基于Open64構(gòu)建了Parallel C編譯系統(tǒng),全面支持加速運算模型和自主運算模型,提出并實現(xiàn)了數(shù)據(jù)布局與自動DMA、編譯指導的線程代理和拓撲位置感知的集合通信等優(yōu)化.Micro Benchmark和實際應(yīng)用在神威太湖之光計算機系統(tǒng)上的測試數(shù)據(jù)結(jié)果表明:Parallel C語言和編譯系統(tǒng)具有良好的性能和可擴展性,能夠有效支撐大型應(yīng)用.
文內(nèi)圖片:申威眾核處理器結(jié)構(gòu)
圖片說明: 766JournalofSoftware軟件學報Vol.28,No.4,April2017開發(fā)硬件數(shù)百萬到10億量級規(guī)模處理器核心的并發(fā)度,能表示多種類型、不同層次的并行性;(2)要能有效支持系統(tǒng)復雜的存儲結(jié)構(gòu)、局部性描述和高效的數(shù)據(jù)移動.2國產(chǎn)異構(gòu)眾核系統(tǒng)面向高性能計算的眾核處理器包括Intel的MIC[17]、Nvidia和AMD的GPU[18,19]、Godson-T[20]、申威眾核處理器等.申威眾核處理器的結(jié)構(gòu)如圖1所示[21],每顆處理器包含4個core-groups(CGs),每個CG包含1個MPE(managementprocessingelement,簡稱主核)、1個8×8的computingprocessingelement(CPE,簡稱從核)cluster和1個memorycontroller(MC),4個CG通過片上網(wǎng)絡(luò)(NoC)互連,處理器通過Systeminterface(SI)連接外部設(shè)備.申威眾核處理器的主核和從核共享memory,從核采用輕量級的核心設(shè)計,配備由軟件管理的高速存儲器SPM(scratchpadmemory)[22],支持通過DMA(directmemoryaccess)方式在memory和SPM間批量傳輸數(shù)據(jù).Fig.1ArchitectureofthenewSunwayprocessor圖1申威眾核處理器結(jié)構(gòu)基于申威眾核處理器的異構(gòu)眾核系統(tǒng)架構(gòu)如圖2所示,運算系統(tǒng)采用申威眾核處理器構(gòu)建,通過中心交換網(wǎng)絡(luò)和管理網(wǎng)絡(luò)與存儲系統(tǒng)和管理系統(tǒng)連接,系統(tǒng)的登陸界面和存儲空間采用單一映像組織,為用戶提供統(tǒng)一的視圖.國產(chǎn)異構(gòu)眾核系統(tǒng)運算系統(tǒng)存儲系統(tǒng)中心交換網(wǎng)絡(luò)(InfiniBand)管理網(wǎng)(GigaNet)管理系統(tǒng)遠程網(wǎng)絡(luò)用戶終端Fig.2Architectureofdomesticheterogenousmany-coresystem圖2異構(gòu)眾核系統(tǒng)結(jié)構(gòu)
文內(nèi)圖片:異構(gòu)融合的加速運算模型
圖片說明: 何王全等:面向國產(chǎn)異構(gòu)眾核系統(tǒng)的ParallelC語言設(shè)計與實現(xiàn)7673面向異構(gòu)眾核系統(tǒng)的并行編程模型眾核系統(tǒng)的顯著特征是計算資源眾多、并行層次比多核系統(tǒng)更為復雜,編程和優(yōu)化的難度也比多核系統(tǒng)大,需要在并行編程模型和語言設(shè)計上有所突破,滿足不同層次人員的編程需要.針對申威眾核處理器異構(gòu)并行、共享主存的架構(gòu)特征,我們提出了多模式并行編程模型,包括異構(gòu)融合的加速運算模型和按同構(gòu)方式編程的自主運算模型,并且在此基礎(chǔ)上設(shè)計實現(xiàn)了統(tǒng)一架構(gòu)的并行編程語言ParallelC.異構(gòu)融合的加速運算模型如圖3所示,該模型有如下特點.1)ParallelC的進程(類似MPI進程)運行于眾核處理器的主核,負責管理控制、通信、I/O等復雜的操作,大量的加速線程運行于眾核處理器的從核,負責加速核心計算代碼;2)進程和加速線程共享memory,與x86+GPU或x86+MIC上的編程模型相比,無需在兩種存儲器之間通過PCI-E或其他接口進行數(shù)據(jù)傳輸,編程方便、效率也更高;3)在節(jié)點內(nèi),可以通過共享擴展描述,方便地實現(xiàn)共享編程,提高節(jié)點內(nèi)數(shù)據(jù)交換的效率;4)在進程之間,通過消息進行數(shù)據(jù)交換,并支持多級局部性描述,使ParallelC可高效擴充到大規(guī)模環(huán)境.該模型支持消息、共享和加速運算的任意組合,可有效描述異構(gòu)系統(tǒng)多維度的并行,解決MPI+X模型要求用戶掌握2~3種編程語言的問題.Fig.3Acceleratedcomputingmodel圖3異構(gòu)融合的加速運算模型設(shè)計按同構(gòu)方式編程的自主運算模型有兩個目的.一是讓程序員以熟悉的多核方式編程,最大限度地屏蔽異構(gòu)眾核系統(tǒng)的復雜性;二是兼容ParallelC在多核環(huán)境下的遺產(chǎn)代碼.自主運算模型如圖4所示,程序員只需按傳統(tǒng)多核方式進行編程,由編譯系統(tǒng)將同構(gòu)、單維度并行描述映射到異構(gòu)、多維度并行的體系結(jié)構(gòu),ParallelC進程運行于從核上,通信、I/O、系統(tǒng)調(diào)用等復雜的功能則由主?
【作者單位】: 江南計算技術(shù)研究所;
【基金】:國家重點基礎(chǔ)研究發(fā)展計劃(973)(2016YFB0200502) 國家高技術(shù)研究發(fā)展計劃(863)(2012AA010903,2015AA 01A301) 計算機體系結(jié)構(gòu)國家重點實驗室基金(CARCH201403)~~
【分類號】:TP312.1

【參考文獻】

相關(guān)期刊論文 前3條

1 Haohuan FU;Junfeng LIAO;Jinzhe YANG;Lanning WANG;Zhenya SONG;Xiaomeng HUANG;Chao YANG;Wei XUE;Fangfang LIU;Fangli QIAO;Wei ZHAO;Xunqiang YIN;Chaofeng HOU;Chenglong ZHANG;Wei GE;Jian ZHANG;Yangang WANG;Chunbo ZHOU;Guangwen YANG;;The Sunway Taihu Light supercomputer:system and applications[J];Science China(Information Sciences);2016年07期

2 Wei Wu;Fengbin Qi;Wangquan He;Shanshan Wang;;CUDA's Mapped Memory to Support I/O Functions on GPU[J];Tsinghua Science and Technology;2013年06期

3 范東睿;袁楠;張軍超;周永彬;林偉;宋風龍;葉笑春;黃河;余磊;龍國平;張浩;劉磊;;Godson-T:An Efficient Many-Core Architecture for Parallel Program Executions[J];Journal of Computer Science & Technology;2009年06期

【共引文獻】

相關(guān)期刊論文 前10條

1 許漢君;劉林龍;楊海濤;繆雪龍;;燃燒室?guī)缀蜟FD自動優(yōu)化程序開發(fā)[J];現(xiàn)代車用動力;2017年02期

2 趙美婷;劉軼;劉銳;宋凱達;錢德沛;;基于申威眾核處理器的HOG特征提取算法并行加速[J];計算機工程與科學;2017年04期

3 何王全;劉勇;方燕飛;魏迪;漆鋒濱;;面向國產(chǎn)異構(gòu)眾核系統(tǒng)的Parallel C語言設(shè)計與實現(xiàn)[J];軟件學報;2017年04期

4 胡森森;計衛(wèi)星;王一拙;陳旭;付文飛;石峰;;片上多核處理器Cache一致性協(xié)議優(yōu)化研究綜述[J];軟件學報;2017年04期

5 侯超峰;高國賢;徐驥;;納米材料制備及物性測量的虛擬過程工程初探[J];計算機與應(yīng)用化學;2016年09期

6 石嵩;寧永波;李宏亮;鄭方;;陣列眾核結(jié)構(gòu)上的一種多層分區(qū)Hash連接算法[J];計算機科學;2016年03期

7 石嵩;李宏亮;朱巍;;陣列眾核處理器上的高效歸并排序算法[J];計算機研究與發(fā)展;2016年02期

8 閆喬;覃志東;王紹宇;閆紅曼;;同構(gòu)多核/眾核處理器任務(wù)分配自適應(yīng)模擬退火算法[J];計算機科學;2014年06期

9 吳志敏;呂慧偉;陳明宇;;一個針對并行模擬引擎的性能評測實例[J];計算機科學;2013年03期

10 張輪凱;宋風龍;王達;;一種針對片上眾核結(jié)構(gòu)共享末級緩存的改進的LFU替換算法[J];計算機應(yīng)用與軟件;2013年01期

【二級參考文獻】

相關(guān)期刊論文 前2條

1 楊學軍;廖湘科;盧凱;胡慶豐;宋君強;蘇金樹;;The TianHe-1A Supercomputer: Its Hardware and Software[J];Journal of Computer Science & Technology;2011年03期

2 楊永增,喬方利,趙偉,滕涌,袁業(yè)立;球坐標系下MASNUM海浪數(shù)值模式的建立及其應(yīng)用[J];海洋學報(中文版);2005年02期

,

本文編號:2513060

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2513060.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5d564***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com