分片式處理器上非均勻一致緩存的設(shè)計(jì)與優(yōu)化

發(fā)布時間：2021-04-16 19:54

　　分片式處理器能夠很好地應(yīng)對納米工藝代芯片設(shè)計(jì)中存在的功耗、線延遲和設(shè)計(jì)復(fù)雜性問題,充分地利用日益增長的片上晶體管資源以提升應(yīng)用的性能,但對其上的Cache設(shè)計(jì)提出了新的要求。一方面,需要有分片式的Cache結(jié)構(gòu)以滿足大量執(zhí)行單元的并發(fā)訪存需求;另一方面,需要有分布式內(nèi)存依賴解析機(jī)制以保證分布式的訪存順序。與傳統(tǒng)的全局控制的Cache結(jié)構(gòu)相比,非均勻一致Cache結(jié)構(gòu)（Non-Uniform Cache Architecture,NUCA）能夠滿足上述要求,更好地適應(yīng)分片式處理器體系結(jié)構(gòu)。本文設(shè)計(jì)了分片式處理器上的非均勻一致的二級和一級Cache結(jié)構(gòu),并根據(jù)分片式處理器中特有的訪存特征對非均勻一致的一級Cache的結(jié)構(gòu)進(jìn)行優(yōu)化,提出了Load本地化執(zhí)行模型,最終評估了模型的性能和開銷。該研究工作對分片式處理器上Cache結(jié)構(gòu)的設(shè)計(jì)具有一定的指導(dǎo)意義。本文對非均勻一致二級和一級緩存的設(shè)計(jì)和優(yōu)化均基于實(shí)驗(yàn)室所研究的TPA-PI（指令級并行的分片式處理器）。主要研究成果包括:（1）為TPA-PI設(shè)計(jì)了非均勻一致二級緩存,設(shè)計(jì)包括:靜態(tài)數(shù)據(jù)映射方式,片上網(wǎng)絡(luò)互連,Cache Bank內(nèi)部結(jié)構(gòu),C...

【文章來源】：中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校

【文章頁數(shù)】：95 頁

【學(xué)位級別】：碩士

【部分圖文】：

T-FLEX的處理器微體系結(jié)構(gòu)（Kim,2007a,b）

流程圖,執(zhí)行控制,流程,控制權(quán)

9圖 2.3 T-FLEX 中一個超級塊的執(zhí)行控制流程T-FLEX 中的資源管理是以超級塊為單位的，而非單獨(dú)的指令。每一個超級塊的運(yùn)行都由一個相應(yīng)的核（Owner Core）控制。和上一節(jié)中提到的出口預(yù)測器和 I-Cache Tag 結(jié)構(gòu)一樣，對于超級塊的控制權(quán)也是通過塊起始地址劃分到不同的核上，因此享有某個超級塊控制權(quán)的核必然擁有該塊的 I-Cache Tag 表項(xiàng)和出口預(yù)測表項(xiàng)。T-FLEX 中一個超級塊的執(zhí)行控制流程如圖 2.3 所示。控制核首先發(fā)起取指（Fetch）操作，查找當(dāng)前超級塊的 I-Cache Tag，若 I-Cache 命中，則將取指指令

提交協(xié)議

廣播給所有的參與核，如圖 2.3（a）所示；同時預(yù)測下一個超級塊地址，并通知相對應(yīng)的下一個控制核，如圖 2.3（b）所示；一旦取指命令到達(dá)參與核，那么相應(yīng)的核就從自己的 I-Cache 中獲取相應(yīng)的指令，并將指令分配到指令窗口中，如圖 2.3（c）所示；最終當(dāng)控制核檢查到該超級塊已執(zhí)行完畢時，將發(fā)起一個四階段的超級塊提交操作，如圖 2.3（d）所示。多個超級塊可以將取指、執(zhí)行和提交等各階段流水執(zhí)行，圖 2.3（e-h）顯示了另一個超級塊執(zhí)行的各個階段。

本文編號：3142068

資料下載

論文發(fā)表

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3142068.html

上一篇：基于接觸電阻加熱的玻璃熔融沉積型3D打印系統(tǒng)
下一篇：嵌入式系統(tǒng)網(wǎng)絡(luò)設(shè)備管理及其驅(qū)動設(shè)計(jì)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

分片式處理器上非均勻一致緩存的設(shè)計(jì)與優(yōu)化