天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

VLIW DSP編譯器設(shè)計及性能與功耗的優(yōu)化研究

發(fā)布時間:2020-11-05 10:32
   超長指令字(VLIW)體系結(jié)構(gòu)已經(jīng)為高端數(shù)字信號處理器(DSP)所普遍采用。VLIW體系結(jié)構(gòu)主要采用靜態(tài)指令調(diào)度技術(shù),因此其硬件行為很大程度上依賴于編譯器的安排,這為編譯器提供了廣闊的舞臺,也對其提出了嚴(yán)峻的挑戰(zhàn)。一方面,VLIW DSP的高性能是否能夠發(fā)揮出來,完全取決于編譯器效率的高低;另一方面,因為編譯器可以很大程度上控制芯片的運行軌跡,除了最大程度挖掘指令級并行(ILP)外,還可以通過適當(dāng)?shù)恼{(diào)度優(yōu)化,使得DSP執(zhí)行某一個程序時的功耗變小。可見對于VLIW DSP高性能低功耗編譯技術(shù)的研究具有非,F(xiàn)實的理論與實踐意義。 本文的工作是863項目“32位高性能嵌入式數(shù)字信號處理器(DSP)芯片技術(shù)研究”的一部分。論文針對VLIW DSP編譯器的設(shè)計與實現(xiàn)技術(shù)、性能優(yōu)化技術(shù)、功耗優(yōu)化技術(shù)進行了深入研究。主要工作分為三大部分:首先基于可重定向編譯基礎(chǔ)設(shè)施IMPACT,設(shè)計和實現(xiàn)了VLIW DSP的C編譯器;其次針對VLIW DSP體系結(jié)構(gòu)的特點,對利用謂詞執(zhí)行機制和軟件流水進行性能優(yōu)化的技術(shù)展開了研究;然后對利用SIMD指令自動向量化和循環(huán)緩沖進行低功耗優(yōu)化的技術(shù)展開了研究。 本文所做編譯優(yōu)化工作是圍繞VLIWDSP體系結(jié)構(gòu)展開的,并以YHFT-D4為實例進行了驗證,但所提出的優(yōu)化方法具有普遍的適用性。主要貢獻如下: 一、提出了基于互補謂詞的優(yōu)化方法。該方法從三方面進行編譯優(yōu)化:一是基于二進制決策圖(BDD)謂詞分析系統(tǒng),建立了一種利用互補謂詞機制對控制結(jié)構(gòu)進行優(yōu)化的方法;二是對傳統(tǒng)著色圖寄存器分配算法進行改進,給出了一種建立統(tǒng)一簡化干涉圖的新算法,減少了代碼溢出;三是利用互補謂詞的特性改進了指令調(diào)度中資源的利用情況和目標(biāo)體系結(jié)構(gòu)中謂詞讀取時間,提高了指令調(diào)度中的資源利用率,可以獲得更高的ILP。 二、提出了基于超塊的統(tǒng)一分簇與模調(diào)度方法。使用超塊作為調(diào)度單位是擴大優(yōu)化范圍,獲得更高ILP的重要手段,并且可以處理含有控制流的循環(huán)體,增加了模調(diào)度的適用范圍。VLIWDSP中的分簇結(jié)構(gòu),使得編譯器必須將指令和操作數(shù)在簇間進行合理分配才能得到較好的ILP。基于超塊的統(tǒng)一分簇與模調(diào)度方法,先使用互補謂詞將中間代碼變成超塊,再進行模調(diào)度,在調(diào)度過程中同時進行指令和操作數(shù)的簇分配,實驗證明是一種有效方法。 三、在全面而深入地評述了低功耗編譯技術(shù),特別是指令級、功能級功耗模型的基礎(chǔ)上,提出了基于SIMD指令自動向量化的低能耗編譯方法。與普通指令相比,SIMD指令具有較高的能量效率,F(xiàn)有的一些自動生成SIMD指令的編譯方法,或者只能生成一般SIMD指令,或者高度領(lǐng)域相關(guān),缺乏通用性。針對此,本文提出一種基于SIMD指令自動向量化的低能耗編譯方法,該方法將SIMD自動向量化的任務(wù)劃分為兩階段:首先從高層中間代碼識別出復(fù)雜SIMD指令的備選指令;然后在低層中間代碼中經(jīng)循環(huán)展開之后,用擴展的樹模式匹配、以指令的能耗為代價生成真正的SIMD指令。這種方法清晰直觀、通用性強。實驗證明對于能耗和性能都有優(yōu)化作用。 四、提出了一種通過編譯控制循環(huán)緩沖降低指令存儲器功耗的方法。VLIWDSP中指令存儲器的功耗所占比重較大。但根據(jù)DSP應(yīng)用中循環(huán)較多的特點,可以采用循環(huán)緩沖來減小指令存儲器的功耗。設(shè)計了一種編譯器控制的循環(huán)緩沖,編譯器通過功耗分析確定放入緩沖的循環(huán)體,并確定打開/關(guān)閉循環(huán)緩沖的時機。該方法在不影響性能的情況下,減小了程序運行的總功耗。 五、設(shè)計與實現(xiàn)了VLIW DSP的優(yōu)化編譯器。以可重定向編譯基礎(chǔ)設(shè)施IMPACT為平臺,設(shè)計與實現(xiàn)了VLIW DSP編譯器,并從性能和功耗兩方面對其進行了優(yōu)化。
【學(xué)位單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2006
【中圖分類】:TP368.12
【部分圖文】:

謂詞,優(yōu)化實驗,超塊,加速比


Predieate一 awareSehedulingClassic&SuPersealar圖3.12的實驗結(jié)果給出了scen麗00碑情況下得到的IPC。從中可以看出,與Scenari0O相比,使用超塊并進行謂詞優(yōu)化的Scenariol情況的加速比最大,無第62頁

實驗結(jié)果,分簇


物理寄存器的模塊即可,即按照符號寄存器的簇屬性從相應(yīng)的簇中選取空閑物理寄存器。4.3.9.3與后遍調(diào)度的關(guān)系但寄存器分配后,在寄存器壓力比較大的情況下有可能會在模調(diào)度的核中插入溢出代碼(spillcode),這種情況下將在后遍調(diào)度中使用列表調(diào)度對模調(diào)度的核重新調(diào)度。4.4實驗結(jié)果在面向圖4.1中的分簇結(jié)構(gòu)VUWDSP編譯器中應(yīng)用本章提出的基于超塊的分簇與模調(diào)度(HBUCAMs)方法,我們得到圖4.8的編譯結(jié)果。這里HBUCALS指的是應(yīng)用本章的統(tǒng)一分簇與調(diào)度的方法于LISt調(diào)度對所有循環(huán)或非循環(huán)代碼進行調(diào)度所得到的結(jié)果;而ITss則是在文獻193]中提出的方法,HBuCALs和HBucAMs對這種方法進行了改進。

循環(huán)緩沖,指令存儲器,功耗,比重


二==二二二二二二二二二二二二二二二二二二二二二二=:一二=二二二二二二二二二二二二二二二二二二二二二二=二=一二一二二二二二二二二了使用循環(huán)緩沖技術(shù)后的程序功耗。圖7.8給出了采用循環(huán)緩沖后的指令存儲器功耗比重。從圖7.8可以看出,在使用了循環(huán)緩沖后,指令存儲和傳輸部分的功耗在系統(tǒng)總功耗中的比重大幅降低(一與圖7.1相比較)。 }}}}}}}}}下下 下 下 下下 下 下 下下……一 一 一一一 一一一 一一一一一一 一 一一一一 一 }}}}}}}}}}}}}娜爾斗斗 斗 斗比 比 比 比 比 比 比淤淤 淤 淤 ....................口Cloek」口Proeessing.Feteh%%%n︵日︺八曰日八︸O︹︺汽︸.上%%%nU八曰n口任月O‘二十‘沁觸的只林《抽·曰·洲三·洲O燦響·洲洲沁代二十‘時已圖7.8米用循環(huán)緩沖后的指令存儲器功耗比重圖7.9給出了采用循環(huán)緩沖后的程序平均功耗的變化。系統(tǒng)平均功耗也隨著循環(huán)緩沖的使用,有比較明顯的降低。這里降低主要是指令存儲器的訪問功耗,考慮到時鐘功耗約占指令存儲器功耗的近1/2,若在循環(huán)緩沖工作的時候令指令存儲器進入休眠狀態(tài)
【參考文獻】

相關(guān)期刊論文 前3條

1 戴桂蘭,張素琴,田金蘭,蔣維杜;基于抽象語法描述的中間表示技術(shù)[J];清華大學(xué)學(xué)報(自然科學(xué)版);2003年04期

2 趙榮彩,唐志敏,張兆慶,GuangR.Gao;低功耗多線程編譯優(yōu)化技術(shù)[J];軟件學(xué)報;2002年06期

3 趙榮彩,唐志敏,張兆慶,Guang R.Gao;軟件流水的低功耗編譯技術(shù)研究[J];軟件學(xué)報;2003年08期



本文編號:2871513

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2871513.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶24c89***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com