SCMP中共享多端口數(shù)據(jù)Cache結(jié)構(gòu)的研究
發(fā)布時(shí)間:2020-05-16 14:26
【摘要】: 在巨大規(guī)模芯片時(shí)代來臨的時(shí)候,體系結(jié)構(gòu)的研究又遇到了新的課題:如何有效利用數(shù)目眾多的晶體管?如何去設(shè)計(jì)與巨大規(guī)模芯片相適應(yīng)的微處理器體系結(jié)構(gòu)?當(dāng)前的處理器主流技術(shù)超標(biāo)量結(jié)構(gòu)由于實(shí)現(xiàn)非常復(fù)雜和資源利用率低的缺陷而難以再大幅度提高其性能。因此,隨著半導(dǎo)體工藝技術(shù)的飛速發(fā)展,在一塊芯片上集成多個(gè)相對(duì)簡(jiǎn)單的處理器的單芯片多處理器(SCMP)結(jié)構(gòu)將是一條提高處理器性能的有效途徑。 為此,在分析SCMP結(jié)構(gòu)特點(diǎn)的基礎(chǔ)上,本文提出了單芯片多處理器的共享Cache結(jié)構(gòu):共享多端口數(shù)據(jù)Cache結(jié)構(gòu)(SMPDCA)。 SMPDCA結(jié)構(gòu)具有六個(gè)突出優(yōu)勢(shì):相對(duì)于大規(guī)模的超標(biāo)量結(jié)構(gòu)而言,SMPDCA結(jié)構(gòu)的控制邏輯復(fù)雜性明顯要低得多;相對(duì)于通過共享主存來實(shí)現(xiàn)處理器之間的通信的結(jié)構(gòu)而言,通過一個(gè)共享的第一級(jí)數(shù)據(jù)Cache來實(shí)現(xiàn)處理器之間的通信的SMPDCA結(jié)構(gòu)能夠提供非常小的處理器之間的通信延遲;沒有Cache一致性維護(hù)開銷;數(shù)據(jù)Cache命中率提高;便于SMP(對(duì)稱多處理器結(jié)構(gòu))的軟件重用;從多個(gè)層次上開發(fā)程序的并行性。 本文給出了SMPDCA的結(jié)構(gòu)模型,說明了SMPDCA結(jié)構(gòu)的各個(gè)功能單元,討論了SMPDCA結(jié)構(gòu)的一些關(guān)鍵技術(shù),分析闡述了利用交叉存儲(chǔ)Cache來實(shí)現(xiàn)多端口Cache的三種地址映像策略。 本文利用模擬器RSIM對(duì)SMPDCA結(jié)構(gòu)進(jìn)行了詳細(xì)的性能模擬分析,從數(shù)據(jù)Cache命中率、通信開銷、共享數(shù)據(jù)Cache的訪問延遲對(duì)性能的影響以及程序執(zhí)行時(shí)間四個(gè)方面給出了模擬結(jié)果,并對(duì)模擬結(jié)果進(jìn)行了分析。性能模擬結(jié)果表明,由于多個(gè)處理器都集成在一塊芯片上,采用多個(gè)處理器共享Cache的結(jié)構(gòu)將能夠更加有效地發(fā)揮SCMP結(jié)構(gòu)的性能優(yōu)勢(shì)。特別是對(duì)于處理器之間的通信與交互比較多的應(yīng)用程序,其性能的提高更加明顯。 針對(duì)SMPDCA結(jié)構(gòu)所存在的硬件實(shí)現(xiàn)代價(jià)的問題,為了證明其可行性,本文以一個(gè)面積為300mm~2左右的芯片的設(shè)計(jì)為目標(biāo),通過性能模擬比較,,我們得出結(jié)論:在一塊芯片上集成多個(gè)相對(duì)簡(jiǎn)單的微處理器是完全可行的,在硬件實(shí)現(xiàn)代價(jià)相近的情況下,SMPDCA結(jié)構(gòu)可以獲得比Superscalar結(jié)構(gòu)更優(yōu)的性能。 針對(duì)SMPDCA結(jié)構(gòu)中所存在的共享數(shù)據(jù)Cache的帶寬問題,本文在分析影響帶寬的因素的基礎(chǔ)上探討了多種提高共享數(shù)據(jù)Cache帶寬的方法。并分別對(duì)更多的訪問端口、非阻塞Cache以及快速命中緩沖區(qū)(QHB)等三種方法進(jìn)行了詳細(xì)描述和性能模擬分析。 總的來說,SMPDCA結(jié)構(gòu)是一種值得進(jìn)一步深入研究的處理器體系結(jié)構(gòu)。
【圖文】:
國防科學(xué)技術(shù)大學(xué)研究生院學(xué)位論文超標(biāo)量處理器實(shí)現(xiàn)的復(fù)雜度限制了超標(biāo)量技術(shù)隨VLsl很難依靠繼續(xù)增大超標(biāo)量處理器的規(guī)模(如發(fā)射寬度、能。構(gòu)資源利用率低測(cè)試,超標(biāo)量處理器中資源利用率非常低,只有20%,
圖5.9FF’I’應(yīng)用程序PCA結(jié)構(gòu)的通信開銷占程序執(zhí)行時(shí)間的百分SMPDCA結(jié)構(gòu)的通信開銷占程序執(zhí)行時(shí)間的5.10所示。nUCU八ltC甘n
本文編號(hào):2666871
【圖文】:
國防科學(xué)技術(shù)大學(xué)研究生院學(xué)位論文超標(biāo)量處理器實(shí)現(xiàn)的復(fù)雜度限制了超標(biāo)量技術(shù)隨VLsl很難依靠繼續(xù)增大超標(biāo)量處理器的規(guī)模(如發(fā)射寬度、能。構(gòu)資源利用率低測(cè)試,超標(biāo)量處理器中資源利用率非常低,只有20%,
圖5.9FF’I’應(yīng)用程序PCA結(jié)構(gòu)的通信開銷占程序執(zhí)行時(shí)間的百分SMPDCA結(jié)構(gòu)的通信開銷占程序執(zhí)行時(shí)間的5.10所示。nUCU八ltC甘n
本文編號(hào):2666871
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2666871.html
最近更新
教材專著