天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

基于相似性的粗粒度可重構指令壓縮

發(fā)布時間:2021-02-24 18:12
  粗粒度可重構架構在能效比方面具有明顯優(yōu)勢,然而其指令存儲與傳輸過程的功耗代價過高.實驗發(fā)現(xiàn)指令間具有明顯的相似性,由此本文提出一種基于指令相似性的壓縮技術,通過對指令的壓縮、傳輸與解壓,可以在不降低性能的前提下,優(yōu)化架構的功耗和面積.針對同構和異構平臺分別提出了指令分發(fā)模型和指令寄存器模型的解決方案,結合編譯策略優(yōu)化,最終與兩種傳統(tǒng)結構相比,面積效率比分別提升36%和181%,功耗效率比分別提升33%和118%. 

【文章來源】:微電子學與計算機. 2020,37(08)北大核心

【文章頁數(shù)】:6 頁

【部分圖文】:

基于相似性的粗粒度可重構指令壓縮


典型CGRA結構圖

指令集,寄存器


本文未壓縮基礎指令集如圖2(a)所示.考慮到通用性和可擴展性的要求,基礎指令長度固定為64位,共由以下幾部分組成:5位的操作碼字段,用來表示本條指令的具體操作類型;3個源操作數(shù)字段,每個字段7位,用來表示3個源操作數(shù)(其中3位表示輸入來源:立即數(shù)、共享數(shù)據(jù)存儲器、全局寄存器、本地數(shù)據(jù)寄存器、本地或其他相聯(lián)處理單元的輸出寄存器;4位表示具體地址索引);輸出也用7位表示(3位表示輸出去向:共享數(shù)據(jù)存儲器、全局寄存器、本地數(shù)據(jù)寄存器或輸出寄存器;4位表示輸出的具體地址索引);28位的立即數(shù)/地址字段,用來表示操作數(shù)是立即數(shù)時的值或者load和store指令直接尋址時的地址.3.2 指令分割及壓縮

示例,字段,方案,操作碼


(2)在處理單元映射過程中,可以在性能相同的幾種配置方案中,選擇改變字段數(shù)較少的結果.如圖3所示將圖3(b)所示算法,映射到圖3(a)所示2×2 CGRA陣列上,成功映射方案中的兩種如圖3(c)和圖3(d)所示.啟動間隔表示多條指令循環(huán)執(zhí)行時,一條指令在兩次迭代間的間隔.作為性能衡量的指標,兩種方案的啟動間隔均為2,說明性能相同.如圖4所示,兩種方案改變字段已用虛線框標出.對于映射方案1,處理單元2除操作碼字段(SOp)外,還需要傳輸2個字段(S0和S3);但對于映射方案2,除操作碼字段外,每個處理單元最多只有一個字段發(fā)生改變,故方案2更優(yōu).針對不同的應用,映射算法大多具有明顯的優(yōu)化空間.圖4 映射結果選擇

【參考文獻】:
期刊論文
[1]一種快速高效的粗粒度可重構架構編譯框架[J]. 尹文志,趙仲元,毛志剛,王琴,繩偉光.  微電子學與計算機. 2019(08)



本文編號:3049758

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3049758.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶2cef4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com