面向異構(gòu)融合處理器的性能分析、優(yōu)化及應(yīng)用綜述
發(fā)布時(shí)間:2021-09-02 03:35
隨著異構(gòu)計(jì)算技術(shù)的不斷進(jìn)步,CPU和GPU等設(shè)備相集成的異構(gòu)融合處理器在近些年得到了充分的發(fā)展,并引起了學(xué)術(shù)界和工業(yè)界的關(guān)注.將多種設(shè)備進(jìn)行集成帶來了許多好處,例如,多種設(shè)備可以訪問同樣的內(nèi)存,可以進(jìn)行細(xì)粒度的交互.然而,這也帶來了系統(tǒng)編程和優(yōu)化方面的巨大挑戰(zhàn).充分發(fā)揮異構(gòu)融合處理器的性能,需要充分利用集成體系結(jié)構(gòu)中共享內(nèi)存等特性;同時(shí),還需結(jié)合具體應(yīng)用特征對異構(gòu)融合處理器上的不同設(shè)備進(jìn)行優(yōu)化.首先對目前涉及異構(gòu)融合處理器的研究工作進(jìn)行了分析,之后介紹了異構(gòu)融合處理器的性能分析工作,并進(jìn)一步介紹了相關(guān)優(yōu)化技術(shù),隨后對異構(gòu)融合處理器的應(yīng)用進(jìn)行了總結(jié).最后,對異構(gòu)融合處理器未來的研究方向進(jìn)行展望,并進(jìn)行了總結(jié).
【文章來源】:軟件學(xué)報(bào). 2020,31(08)北大核心EICSCD
【文章頁數(shù)】:22 頁
【部分圖文】:
并行度和循環(huán)優(yōu)化[11]
盡管異構(gòu)融合處理器的設(shè)計(jì)具有諸多挑戰(zhàn),目前仍出現(xiàn)了一些異構(gòu)融合架構(gòu),如AMD公司的Carrizo[17]、Intel公司的Skylake[18]和Nvidia公司的Denver[19]等.圖1以CPU、GPU相集成的異構(gòu)融合處理器為例進(jìn)行了展示,圖1中的異構(gòu)融合處理器分為CPU部分和GPU部分,這兩部分可訪問同樣的內(nèi)存.CPU部分具有L1和L2等多級緩存結(jié)構(gòu),不同型號的CPU略有不同.例如,AMD公司生產(chǎn)的A10-7850K異構(gòu)融合處理器的CPU部分具有共享的L2緩存,而Intel公司生產(chǎn)的i7-4770R異構(gòu)融合處理器則采用私有L2緩存設(shè)計(jì).對于GPU部分不同硬件廠商生產(chǎn)的GPU存在較大的體系結(jié)構(gòu)差異,包括局部存儲和緩存設(shè)計(jì)等方面.例如,相比于A10-7850K異構(gòu)融合處理器,i7-4770R異構(gòu)融合處理器上存在共享L3緩存.此外,部分異構(gòu)融合處理器上出現(xiàn)了多設(shè)備共享緩存和嵌入式存儲(embedded DRAM,簡稱EDRAM)等結(jié)構(gòu).對于共享內(nèi)存訪問,目前對CPU和GPU等設(shè)備提供的帶寬不一樣[20].目前,針對異構(gòu)融合處理器的研究工作都是圍繞上述類型體系結(jié)構(gòu)展開的.研究者圍繞多設(shè)備相集成的特點(diǎn)結(jié)合應(yīng)用在異構(gòu)融合處理器上,進(jìn)行各種性能分析與優(yōu)化.由于異構(gòu)融合處理器將不同設(shè)備集成在一起共享內(nèi)存,和離散架構(gòu)相比需要考慮更多因素,如多設(shè)備間如何保證內(nèi)存一致性等問題.異構(gòu)融合處理器共享內(nèi)存的特性避免了通過PCIe的數(shù)據(jù)傳輸,但也增加了不同設(shè)備維護(hù)共享內(nèi)存一致性的開銷[21].
圖2描述了表1中各方向的論文分布情況:性能分析類論文有16篇;性能優(yōu)化類論文有14篇,主要集中在不同設(shè)備間的負(fù)載劃分與調(diào)度優(yōu)化;涉及具體應(yīng)用實(shí)例的論文有23篇.目前,基于異構(gòu)融合處理器的應(yīng)用多集中在數(shù)據(jù)科學(xué)領(lǐng)域和科學(xué)計(jì)算領(lǐng)域,但隨著近年來機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,研究者開始考慮如何將異構(gòu)融合處理器應(yīng)用于機(jī)器學(xué)習(xí)領(lǐng)域,如深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練的加速等環(huán)節(jié).雖然目前這個(gè)領(lǐng)域的研究較少,但具有較大的發(fā)展?jié)摿?此外,也有研究者提出了利用異構(gòu)融合處理器對網(wǎng)絡(luò)數(shù)據(jù)包進(jìn)行處理的解決方案,這也是一個(gè)異構(gòu)融合處理器潛在的應(yīng)用方向.圖3描述了各研究方向的論文隨時(shí)間線的增長圖.從圖中可以看出,關(guān)于異構(gòu)融合處理器的研究從2010年開始快速增加,這與計(jì)算機(jī)技術(shù)的發(fā)展密切相關(guān).正是在2010年前后,AMD宣布推出集成CPU和GPU的異構(gòu)融合處理器,以此為契機(jī),關(guān)于融合處理器的研究開始被大量研究者作為研究課題.到目前為止,關(guān)于異構(gòu)融合處理器的性能分析優(yōu)化和基于異構(gòu)融合處理器的應(yīng)用是這個(gè)領(lǐng)域的熱點(diǎn)方向.
【參考文獻(xiàn)】:
博士論文
[1]面向集成異構(gòu)平臺的負(fù)載分析與優(yōu)化關(guān)鍵技術(shù)研究[D]. 張峰.清華大學(xué) 2017
本文編號:3378226
【文章來源】:軟件學(xué)報(bào). 2020,31(08)北大核心EICSCD
【文章頁數(shù)】:22 頁
【部分圖文】:
并行度和循環(huán)優(yōu)化[11]
盡管異構(gòu)融合處理器的設(shè)計(jì)具有諸多挑戰(zhàn),目前仍出現(xiàn)了一些異構(gòu)融合架構(gòu),如AMD公司的Carrizo[17]、Intel公司的Skylake[18]和Nvidia公司的Denver[19]等.圖1以CPU、GPU相集成的異構(gòu)融合處理器為例進(jìn)行了展示,圖1中的異構(gòu)融合處理器分為CPU部分和GPU部分,這兩部分可訪問同樣的內(nèi)存.CPU部分具有L1和L2等多級緩存結(jié)構(gòu),不同型號的CPU略有不同.例如,AMD公司生產(chǎn)的A10-7850K異構(gòu)融合處理器的CPU部分具有共享的L2緩存,而Intel公司生產(chǎn)的i7-4770R異構(gòu)融合處理器則采用私有L2緩存設(shè)計(jì).對于GPU部分不同硬件廠商生產(chǎn)的GPU存在較大的體系結(jié)構(gòu)差異,包括局部存儲和緩存設(shè)計(jì)等方面.例如,相比于A10-7850K異構(gòu)融合處理器,i7-4770R異構(gòu)融合處理器上存在共享L3緩存.此外,部分異構(gòu)融合處理器上出現(xiàn)了多設(shè)備共享緩存和嵌入式存儲(embedded DRAM,簡稱EDRAM)等結(jié)構(gòu).對于共享內(nèi)存訪問,目前對CPU和GPU等設(shè)備提供的帶寬不一樣[20].目前,針對異構(gòu)融合處理器的研究工作都是圍繞上述類型體系結(jié)構(gòu)展開的.研究者圍繞多設(shè)備相集成的特點(diǎn)結(jié)合應(yīng)用在異構(gòu)融合處理器上,進(jìn)行各種性能分析與優(yōu)化.由于異構(gòu)融合處理器將不同設(shè)備集成在一起共享內(nèi)存,和離散架構(gòu)相比需要考慮更多因素,如多設(shè)備間如何保證內(nèi)存一致性等問題.異構(gòu)融合處理器共享內(nèi)存的特性避免了通過PCIe的數(shù)據(jù)傳輸,但也增加了不同設(shè)備維護(hù)共享內(nèi)存一致性的開銷[21].
圖2描述了表1中各方向的論文分布情況:性能分析類論文有16篇;性能優(yōu)化類論文有14篇,主要集中在不同設(shè)備間的負(fù)載劃分與調(diào)度優(yōu)化;涉及具體應(yīng)用實(shí)例的論文有23篇.目前,基于異構(gòu)融合處理器的應(yīng)用多集中在數(shù)據(jù)科學(xué)領(lǐng)域和科學(xué)計(jì)算領(lǐng)域,但隨著近年來機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,研究者開始考慮如何將異構(gòu)融合處理器應(yīng)用于機(jī)器學(xué)習(xí)領(lǐng)域,如深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練的加速等環(huán)節(jié).雖然目前這個(gè)領(lǐng)域的研究較少,但具有較大的發(fā)展?jié)摿?此外,也有研究者提出了利用異構(gòu)融合處理器對網(wǎng)絡(luò)數(shù)據(jù)包進(jìn)行處理的解決方案,這也是一個(gè)異構(gòu)融合處理器潛在的應(yīng)用方向.圖3描述了各研究方向的論文隨時(shí)間線的增長圖.從圖中可以看出,關(guān)于異構(gòu)融合處理器的研究從2010年開始快速增加,這與計(jì)算機(jī)技術(shù)的發(fā)展密切相關(guān).正是在2010年前后,AMD宣布推出集成CPU和GPU的異構(gòu)融合處理器,以此為契機(jī),關(guān)于融合處理器的研究開始被大量研究者作為研究課題.到目前為止,關(guān)于異構(gòu)融合處理器的性能分析優(yōu)化和基于異構(gòu)融合處理器的應(yīng)用是這個(gè)領(lǐng)域的熱點(diǎn)方向.
【參考文獻(xiàn)】:
博士論文
[1]面向集成異構(gòu)平臺的負(fù)載分析與優(yōu)化關(guān)鍵技術(shù)研究[D]. 張峰.清華大學(xué) 2017
本文編號:3378226
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3378226.html
最近更新
教材專著