天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

結(jié)合指令預(yù)取和緩存劃分的多核緩存WCEC優(yōu)化

發(fā)布時間:2021-01-03 00:41
  對于能量供應(yīng)有限制的硬實(shí)時多核系統(tǒng),最差情況下的能量消耗WCEC(Worst-Case Energy Consumption)是一個非常關(guān)鍵的問題。隨著芯片工藝的發(fā)展,順序指令預(yù)取技術(shù)可以減少緩存WCEC。為了提高指令預(yù)取的最差情況下的節(jié)能效率,提出結(jié)合指令預(yù)取和共享緩存劃分的硬實(shí)時多核系統(tǒng)緩存WCEC優(yōu)化方法。該方法通過線性規(guī)劃方程ILP(Integer-Linear Programing)為每個核分配L2緩存劃分因子和調(diào)整每個硬實(shí)時子任務(wù)的指令預(yù)取度,在保證硬實(shí)時系統(tǒng)滿足時間截止期的情況下,最小化其緩存WCEC。對DEBIE系統(tǒng)進(jìn)行實(shí)例分析,實(shí)驗(yàn)結(jié)果表明優(yōu)化方法是有效的,在保證系統(tǒng)滿足時間截止期的情況下,優(yōu)化后的緩存WCEC比沒有指令預(yù)取優(yōu)化的緩存WCET平均減少了22.5%。 

【文章來源】:計(jì)算機(jī)工程與應(yīng)用. 2020年01期 北大核心

【文章頁數(shù)】:7 頁

【部分圖文】:

結(jié)合指令預(yù)取和緩存劃分的多核緩存WCEC優(yōu)化


圖1 支持指令預(yù)取器的嵌入式多核架構(gòu)

緩存,例子,預(yù)取


如圖1是一種支持指令預(yù)取的嵌入式多核模型。有NC個同構(gòu)的處理器核。每個核有私有的L1指令/數(shù)據(jù)緩存,所有的核共享L2聯(lián)合緩存,共享L2緩存有W路(way),通過路緩存劃分技術(shù)[13],它被分成了NC部分,即P={p1,p2,…,pNC},,L2緩存劃分因子pi(i=1,2,…,NC)路被分給了運(yùn)行硬實(shí)時任務(wù)的核Ci(i=1,2,…,NC)。緩存的替換策略是LRU(Least Recently Used)。L1和L2緩存通過硬實(shí)時總線連接。如圖2是一個基于路劃分的例子(4核,1組,8路組關(guān)聯(lián)),L2緩存通過路的粒度進(jìn)行劃分,每個處理器核被分配了一些路,并且此處理器只允許訪問分給它的那些路。順序指令預(yù)取器采用支持Prefetch-on-Miss預(yù)取策略的Next-N-Line指令預(yù)取。如果處理器需要處理的當(dāng)前指令i被映射到L1指令緩存行p在L1指令緩存上沒有命中,那么L1指令緩存預(yù)取器I-prefetcher就會發(fā)出預(yù)取L1指令緩存行p+1,p+2,…,p+N的操作請求。如果需要預(yù)取的指令行已經(jīng)在L1指令緩存,預(yù)取請求被丟棄,否則預(yù)取請求進(jìn)入一個FIFO(First In First Out)隊(duì)列,隨后請求會被發(fā)送到L2緩存。為了支持指令預(yù)取優(yōu)化機(jī)制,采用文獻(xiàn)[15]的方法,利用編譯器在任務(wù)之間留下程序預(yù)取度信息指示,在程序運(yùn)行的時候,預(yù)取硬件檢測到這些指示的預(yù)取度,然后用檢測到的預(yù)取度來預(yù)取指令。

預(yù)取,緩存


對文獻(xiàn)[19]中的硬實(shí)時M?lardalen wcet benchmarks,如圖3是不同預(yù)取度下支持指令預(yù)取的緩存WCEC,結(jié)果被不支持指令預(yù)取(預(yù)取度N是0)的結(jié)果歸一化了。這里假設(shè)有4個同構(gòu)的處理器核,32 nm工藝,芯片的頻率是1.0 GHz,5階段流水,順序執(zhí)行,分支預(yù)測是完美的(perfect),L1指令/數(shù)據(jù)緩存大小是256 Byte,緩存行大小是16 Byte,直接映射。L2緩存大小是1 KB,緩存行大小是32 Byte,2路組關(guān)聯(lián)。從圖可以看出順序指令預(yù)取在不同的預(yù)取度下獲得的能量效率不同,cnt最大,預(yù)取度是4時,最差情況下的能量減少43.7%,bsort100最差,在預(yù)取度是4時,能量反而增加了43.9%。這是因?yàn)橛晒剑?)可知,指令預(yù)取的能量獲益是減少的緩存靜態(tài)能耗和增加的預(yù)取器與緩存動態(tài)能耗中和的結(jié)果,每個程序的特性不同,預(yù)取效率不同,所以WCEC呈現(xiàn)的結(jié)果是非線性的。

【參考文獻(xiàn)】:
期刊論文
[1]支持指令預(yù)取的多核緩存WCET分析方法[J]. 安立奎,韓麗艷.  計(jì)算機(jī)工程. 2018(10)
[2]空間碎片探測軟件的并行化及WCRT分析[J]. 康少華,古志民,付引霞,安立奎.  計(jì)算機(jī)應(yīng)用研究. 2015(11)



本文編號:2953966

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2953966.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶046f6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com