天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

分片式處理器上激進(jìn)執(zhí)行模型分析

發(fā)布時(shí)間:2020-11-18 18:14
   隨著大規(guī)模集成電路技術(shù)的發(fā)展,可用的片上資源越來越多,如何把豐富的晶體管資源轉(zhuǎn)化為實(shí)際的計(jì)算能力,是當(dāng)前體系結(jié)構(gòu)研究中面臨的基本問題。傳統(tǒng)的超標(biāo)量和超長(zhǎng)指令字結(jié)構(gòu),由于采用集中式、全局控制結(jié)構(gòu)以及廣播式數(shù)據(jù)通路,導(dǎo)致功耗、線延遲和設(shè)計(jì)復(fù)雜度等諸多問題,很難進(jìn)一步擴(kuò)展,因此一種結(jié)構(gòu)模塊化、分布化、層次化的分片式處理器體系結(jié)構(gòu)應(yīng)運(yùn)而生。分片式處理器通過資源分布和資源復(fù)制策略代替?zhèn)鹘y(tǒng)集中式控制結(jié)構(gòu),用點(diǎn)到點(diǎn)片上數(shù)據(jù)傳輸網(wǎng)絡(luò)取代廣播式數(shù)據(jù)通路,可擴(kuò)展性大大增強(qiáng)。但在順序執(zhí)行模型下,受編譯技術(shù)和應(yīng)用本身的限制,很難充分發(fā)掘應(yīng)用的指令級(jí)并行性。因此,我們提出分片式處理器上基于指令塊的激進(jìn)執(zhí)行模型。本文針對(duì)影響分片式處理器激進(jìn)執(zhí)行模型有效性的幾個(gè)方面進(jìn)行了分析和實(shí)驗(yàn)驗(yàn)證,為激進(jìn)執(zhí)行模型的實(shí)踐提供了理論指導(dǎo)。 本文采用理論分析和實(shí)驗(yàn)驗(yàn)證相結(jié)合的方法,一方面在理論上分析了各種因素對(duì)于分片式處理器激進(jìn)執(zhí)行模型的影響,另一方面對(duì)這些影響因素建立有效的實(shí)驗(yàn)評(píng)價(jià)方案和實(shí)驗(yàn)環(huán)境,進(jìn)行實(shí)驗(yàn)驗(yàn)證。 本文的研究?jī)?nèi)容和成果包括以下幾個(gè)方面:(1)從控制流的角度,分析了控制相關(guān)對(duì)于激進(jìn)執(zhí)行模型的影響,提出了塊級(jí)預(yù)測(cè)技術(shù),設(shè)計(jì)了一種基于傳統(tǒng)分支預(yù)測(cè)器的塊級(jí)分支預(yù)測(cè)器;并且針對(duì)塊間的控制相關(guān),提出了自己的實(shí)驗(yàn)評(píng)價(jià)方案,評(píng)價(jià)了控制相關(guān)對(duì)于分片式處理器上激進(jìn)執(zhí)行模型有效性的影響。實(shí)驗(yàn)結(jié)果表明,由于塊級(jí)預(yù)測(cè)具有較高的預(yù)測(cè)精度,適合深度推測(cè),因而控制相關(guān)對(duì)于激進(jìn)執(zhí)行模型有效性影響較小。(2)從數(shù)據(jù)流的角度,分析了數(shù)據(jù)相關(guān)對(duì)于激進(jìn)執(zhí)行模型的影響,提出了塊間的數(shù)據(jù)forwarding和值預(yù)測(cè)技術(shù),并給出了塊間數(shù)據(jù)依賴深度概念。實(shí)驗(yàn)表明大部分應(yīng)用都具有較高的依賴深度,并且可以通過數(shù)據(jù)流推測(cè)技術(shù)進(jìn)一步減少數(shù)據(jù)相關(guān)造成的等待時(shí)延,因而數(shù)據(jù)相關(guān)對(duì)于分片式處理器激進(jìn)執(zhí)行模型有效性影響較小。(3)針對(duì)結(jié)構(gòu)相關(guān)對(duì)于激進(jìn)執(zhí)行模型的影響,分別對(duì)各種可能的結(jié)構(gòu)相關(guān)因素;進(jìn)行了分析和實(shí)驗(yàn)。結(jié)果表明,結(jié)構(gòu)相關(guān)對(duì)于分片式處理器激進(jìn)執(zhí)行模型幾乎沒有影響,并且有利于把更多的片上資源轉(zhuǎn)轉(zhuǎn)化為芯片的計(jì)算能力。 本文的實(shí)驗(yàn)結(jié)果表明,在分片式處理器上引入激進(jìn)執(zhí)行模型是完全可行的,可以通過控制流推測(cè)、數(shù)據(jù)流推測(cè)等技術(shù)克服塊間的控制、數(shù)據(jù)相關(guān),進(jìn)一步擴(kuò)大分片式處理器的指令發(fā)射窗口,發(fā)掘應(yīng)用的指令級(jí)并行性。
【學(xué)位單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2009
【中圖分類】:TP332
【部分圖文】:

處理器,結(jié)構(gòu)示意圖


圖 1.2 RAW 處理器結(jié)構(gòu)示意圖 處理器由 16 個(gè)相同的用于運(yùn)算處理的分片單元(Tile)構(gòu)似 MIPS 處理器單指令發(fā)射內(nèi)部處理計(jì)算流水線和動(dòng)靜態(tài)網(wǎng)單元可以作為具有獨(dú)立程序計(jì)數(shù)器的處理器工作,當(dāng)指令或時(shí),則可從配置在外的主存獲取數(shù)據(jù)。分片單元間的通信必有布線設(shè)計(jì)均短于分片單元的單邊長(zhǎng)度。因此,即使是根據(jù)管數(shù)目的提高,而增加集成的分片單元數(shù)也不會(huì)降低處理器可見,如果單位不限距離的延遲為 1 個(gè)時(shí)鐘周期的時(shí)候,最概需要 6 個(gè)周期的延遲。分片單元的運(yùn)算流水線由八級(jí)流水都采用單指令發(fā)射的簡(jiǎn)單結(jié)構(gòu)。盡管一個(gè)分片單元每個(gè)周期,但 16 個(gè)單元一共可以發(fā)射 16 條指令,從而達(dá)到較高的峰流水線的數(shù)據(jù)通路上,還設(shè)立了專門的通信機(jī)構(gòu),從而大大間的通信延遲(M. B. Taylor, 2002)。

處理器,整體結(jié)構(gòu),超標(biāo)量


令級(jí)并行性的進(jìn)一步開發(fā)。上述面臨的問題,TPA-PI 采用了一種分片式的體系復(fù)制策略代替?zhèn)鹘y(tǒng)超標(biāo)量集中式控制結(jié)構(gòu),設(shè)計(jì)復(fù)雜上數(shù)據(jù)傳輸網(wǎng)絡(luò)取代超標(biāo)量處理器上廣播式數(shù)據(jù)通,可擴(kuò)展性大大增強(qiáng);并且通過軟硬件協(xié)同開發(fā)的供了統(tǒng)一的編程模型。本章余下部分將對(duì)其硬件結(jié)行詳細(xì)介紹。I 處理器硬件結(jié)構(gòu)理器采用類似 TRIPS 處理器的結(jié)構(gòu),同時(shí)利用 RA劃分成由不同網(wǎng)絡(luò)連接而成的 tile 結(jié)構(gòu)。其中指令數(shù)據(jù) cache 組織成 4*1 的陣列,執(zhí)行單元組織成 4*4 1*4 陣列。另外還有一個(gè)全局的控制單元,通過特行交互。其整體結(jié)構(gòu)如圖 2.1 所示:

指令集,超塊,執(zhí)行模型


2.4 分片式處理器塊執(zhí)行模型TPA-PI 處理器執(zhí)行方式依賴于一種塊執(zhí)行模型,這里的塊是由軟件劃分指令塊,是取指和提交的基本單位,叫做超塊。在本小節(jié)當(dāng)中,我們將首紹超塊的概念及形成過程,然后分別介紹基于塊執(zhí)行機(jī)制的兩種執(zhí)行模型序執(zhí)行模型和激進(jìn)執(zhí)行模型,前者我們只給出簡(jiǎn)單的介紹,后者我們還要影響其可行性的有關(guān)因素,以便后續(xù)章節(jié)能夠更好地展開本文的工作。.4.1 超塊及塊執(zhí)行模型超塊是 TPA-PI 處理器核執(zhí)行的基本單位,由一個(gè)或多個(gè)基本塊組成,多本塊可以通過斷言策略結(jié)合成一個(gè)超塊。超塊中只有一個(gè)基本塊作為其入口是可以有多個(gè)基本塊作為出口。另外,超塊中使用數(shù)據(jù)流來表達(dá),不包含結(jié)構(gòu)。為了滿足 TPA-PI 硬件限制,對(duì)編譯出的超塊要滿足一定的約束:定塊大小,每個(gè)塊中最多包含 128 條指令(不包括寄存器讀寫指令),這樣
【相似文獻(xiàn)】

相關(guān)博士學(xué)位論文 前1條

1 王莉;類數(shù)據(jù)流驅(qū)動(dòng)的分片式處理器上的編譯及優(yōu)化技術(shù)[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年


相關(guān)碩士學(xué)位論文 前4條

1 趙燦明;分片式處理器上激進(jìn)執(zhí)行模型分析[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

2 路璐;分片式處理器上指令調(diào)度器的設(shè)計(jì)及優(yōu)化[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

3 金鷹翰;基于顯式通信指令集的分片式處理器模擬器開發(fā)[D];哈爾濱工業(yè)大學(xué);2010年

4 鄧春華;分片式處理器上謂詞執(zhí)行技術(shù)的實(shí)現(xiàn)與優(yōu)化[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年



本文編號(hào):2889035

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2889035.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a050e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com