面向HPC的高性能微處理器研究進(jìn)展
發(fā)布時(shí)間:2022-02-15 05:53
高性能計(jì)算HPC以其強(qiáng)大的計(jì)算能力成為關(guān)系國計(jì)民生的重要技術(shù)。作為高性能計(jì)算系統(tǒng)算力源泉的高性能微處理器,更是當(dāng)前各國競(jìng)相爭(zhēng)奪的技術(shù)高地,是高性能計(jì)算領(lǐng)域優(yōu)勢(shì)和實(shí)力的決定性技術(shù);谶@一背景,以NVIDIA、Intel和AMD等主流處理器廠商面向HPC的高性能處理器架構(gòu)為主要目標(biāo),從計(jì)算資源的組織方式、存儲(chǔ)子系統(tǒng)設(shè)計(jì)和核間互連技術(shù)等3個(gè)關(guān)鍵方面展開了研究與分析,在此基礎(chǔ)上對(duì)當(dāng)前高性能微處理器的主流技術(shù)進(jìn)行了總結(jié)和展望。本文的分析和結(jié)論能夠?yàn)槲磥砻嫦騂PC的微處理器研究提供有益的參考。
【文章來源】:計(jì)算機(jī)工程與科學(xué). 2020,42(10)北大核心CSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
NVIDIA A100 GPU SM結(jié)構(gòu)框圖
圖2給出了Ponte Vecchio GPU的結(jié)構(gòu)框圖,可以看出Ponte Vecchio GPU內(nèi)核主要包含SIMT和SIMD 2種類型的運(yùn)算單元。這樣的設(shè)計(jì)完全秉承了Intel對(duì)于GPU的設(shè)計(jì)理念,即:(1)GPU的性能源泉來自其向量(Vector-SIMD)處理能力。(2)單一的Vector-SIMD寬度難以滿足所有應(yīng)用,且為不同寬度的Vector-SIMD所編寫的代碼之間存在極大的兼容性難題(摘自Intel GPU的首席架構(gòu)師Koduri在HPC 開發(fā)者大會(huì)上的發(fā)言)。基于上述2個(gè)方面的考慮,Ponte Vecchio GPU中的SIMT單元主要對(duì)應(yīng)較大寬度Vector-SIMD,在此基礎(chǔ)上,作為對(duì)大寬度Vector-SIMD的補(bǔ)充,進(jìn)一步繼承了Intel CPU中medium尺寸子字SIMD(M SIMD)和Large尺寸子字SIMD(L SIMD)單元,從而進(jìn)一步豐富了對(duì)Vector-SIMD的向量寬度的補(bǔ)充支持。Ponte Vecchio GPU中還添加了SIMT和不同尺寸SIMD單元之間的協(xié)同計(jì)算支持,即SIMT單元負(fù)責(zé)應(yīng)用中較為規(guī)整的并行性開發(fā),在此基礎(chǔ)上,通過SIMD單元進(jìn)一步加速串行部分的執(zhí)行[6]。Ponte Vecchio的另一個(gè)特征是支持內(nèi)核計(jì)算能力的可擴(kuò)展性設(shè)計(jì),可以根據(jù)不同應(yīng)用對(duì)相應(yīng)SIMT+SIMD的功能單元進(jìn)行增加或刪減。此外,有推測(cè)認(rèn)為,SIMT單元中存在面向特定應(yīng)用的專用加速部件[6]。
圖3給出了NCU內(nèi)部的結(jié)構(gòu)框圖。從圖3中可以看出,NCU主要采用Scalar加Vector-SIMD的方式進(jìn)行運(yùn)算資源的組織。其中Scalar部分用于應(yīng)用中的串行處理,Vector-SIMD部分則提供對(duì)并行部分的加速。小結(jié):AMD GPU采用Scalar加Vector-SIMD的方式在支持并行加速的同時(shí),兼顧對(duì)串行部分的處理。
本文編號(hào):3626047
【文章來源】:計(jì)算機(jī)工程與科學(xué). 2020,42(10)北大核心CSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
NVIDIA A100 GPU SM結(jié)構(gòu)框圖
圖2給出了Ponte Vecchio GPU的結(jié)構(gòu)框圖,可以看出Ponte Vecchio GPU內(nèi)核主要包含SIMT和SIMD 2種類型的運(yùn)算單元。這樣的設(shè)計(jì)完全秉承了Intel對(duì)于GPU的設(shè)計(jì)理念,即:(1)GPU的性能源泉來自其向量(Vector-SIMD)處理能力。(2)單一的Vector-SIMD寬度難以滿足所有應(yīng)用,且為不同寬度的Vector-SIMD所編寫的代碼之間存在極大的兼容性難題(摘自Intel GPU的首席架構(gòu)師Koduri在HPC 開發(fā)者大會(huì)上的發(fā)言)。基于上述2個(gè)方面的考慮,Ponte Vecchio GPU中的SIMT單元主要對(duì)應(yīng)較大寬度Vector-SIMD,在此基礎(chǔ)上,作為對(duì)大寬度Vector-SIMD的補(bǔ)充,進(jìn)一步繼承了Intel CPU中medium尺寸子字SIMD(M SIMD)和Large尺寸子字SIMD(L SIMD)單元,從而進(jìn)一步豐富了對(duì)Vector-SIMD的向量寬度的補(bǔ)充支持。Ponte Vecchio GPU中還添加了SIMT和不同尺寸SIMD單元之間的協(xié)同計(jì)算支持,即SIMT單元負(fù)責(zé)應(yīng)用中較為規(guī)整的并行性開發(fā),在此基礎(chǔ)上,通過SIMD單元進(jìn)一步加速串行部分的執(zhí)行[6]。Ponte Vecchio的另一個(gè)特征是支持內(nèi)核計(jì)算能力的可擴(kuò)展性設(shè)計(jì),可以根據(jù)不同應(yīng)用對(duì)相應(yīng)SIMT+SIMD的功能單元進(jìn)行增加或刪減。此外,有推測(cè)認(rèn)為,SIMT單元中存在面向特定應(yīng)用的專用加速部件[6]。
圖3給出了NCU內(nèi)部的結(jié)構(gòu)框圖。從圖3中可以看出,NCU主要采用Scalar加Vector-SIMD的方式進(jìn)行運(yùn)算資源的組織。其中Scalar部分用于應(yīng)用中的串行處理,Vector-SIMD部分則提供對(duì)并行部分的加速。小結(jié):AMD GPU采用Scalar加Vector-SIMD的方式在支持并行加速的同時(shí),兼顧對(duì)串行部分的處理。
本文編號(hào):3626047
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3626047.html
最近更新
教材專著