分片式處理器體系結(jié)構上的超塊優(yōu)化技術
發(fā)布時間:2024-01-31 20:56
在過去的十年中,微處理器的性能以每年大約50-60%的速度提升。然而,隨著芯片制造工藝逐步接近硅原子的尺寸,微處理器學術界和工業(yè)界面臨著諸多尚待解決的問題:比如處理器功耗快速增長導致散熱量的快速增加,芯片內(nèi)部線延遲加長導致信號在單個時鐘周期內(nèi)所能到達的功能部件數(shù)目減少等一系列問題,處理器性能提升的兩架馬車——時鐘頻率和IPC (Instructions Per Cycle)正在失去以往的前進動力。種種跡象表明傳統(tǒng)的處理器體系結(jié)構已經(jīng)不能適應新的制造工藝的發(fā)展,各研究團隊相繼開發(fā)了新的處理器體系結(jié)構來取代傳統(tǒng)的處理器體系結(jié)構,比如分片式處理器體系結(jié)構等。于此同時,新的分片式處理器體系結(jié)構對編譯技術也提出了新的要求,超塊形成和優(yōu)化技術與分片式處理器體系結(jié)構之間的無縫融合成了值得研究的領域。 本文研究了分片式處理器體系結(jié)構的優(yōu)點和潛力以及它和超塊形成和優(yōu)化技術之間的結(jié)合性,探討了分片式處理器體系結(jié)構上指令之間的直接數(shù)據(jù)傳送問題,提出了基于剖析信息和關鍵路徑長度的軟件扇出樹生成算法與基于基本塊特征的MOV指令精簡啟發(fā)式算法,給出了它們的理論分析,在TRIPS編譯器和調(diào)度器上實現(xiàn)了算法并對其進行...
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3891537
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
圖3.3超塊形成示例圖
圖3.3超塊形成示例圖圖3.4顯示了一個在超塊形成之前和之后的匯編代碼片段,它假設塊L5是非關鍵塊,L5沒有被謂詞化合并在主超塊中。其中,(a)為原始CFG,(b)為原始代碼,(c)為超塊形成后的代碼。
圖3.4顯示了一個在超塊形成之前和之后的匯編代碼片段,它假設塊L5是非關鍵塊,L5沒有被謂詞化合并在主超塊中
圖3.3超塊形成示例圖圖3.4顯示了一個在超塊形成之前和之后的匯編代碼片段,它假設塊L5是非關鍵塊,L5沒有被謂詞化合并在主超塊中。其中,(a)為原始CFG,(b)為原始代碼,(c)為超塊形成后的代碼。
圖3.4超塊生成前后的程序片段圖
圖3.3超塊形成示例圖3.4顯示了一個在超塊形成之前和之后的匯編代碼片段,它假設塊,L5沒有被謂詞化合并在主超塊中。其中,(a)為原始CFG,((c)為超塊形成后的代碼。
圖3.7循環(huán)剝離示例圖
離技術的基本塊不滿足條件2,則可以應用循環(huán)剝離技術(Song.2002)。循環(huán)剝離技術剝離選取的基本塊內(nèi)一些迭代以后,外面的塊就會滿足條件2。當內(nèi)層塊內(nèi)時,可以對這些超塊應用循環(huán)剝離。圖3.7(a)顯一個里面。在應用循環(huán)剝離以后,外層循環(huán)可以謂7(b)所示。循環(huán)剝離需要先....
本文編號:3891537
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3891537.html
最近更新
教材專著