同時(shí)多線程處理器前端系統(tǒng)的研究
發(fā)布時(shí)間:2020-08-10 12:41
【摘要】: 同時(shí)多線程處理器(SMT)通過(guò)在每個(gè)時(shí)鐘周期從多個(gè)同時(shí)運(yùn)行的線程取指令執(zhí)行,充分挖掘了線程內(nèi)的指令級(jí)并行性和線程間的線程級(jí)并行性,減少了指令槽的水平浪費(fèi)和垂直浪費(fèi),從而極大地提高了處理器的指令吞吐率,成為目前主流的微處理器體系結(jié)構(gòu)之一。 SMT的前端系統(tǒng)(包括:取指部件、1級(jí)Cache和分支預(yù)測(cè)器)是影響其性能的關(guān)鍵,也是目前學(xué)術(shù)界研究SMT的重點(diǎn)。本論文分別從其前端系統(tǒng)的三個(gè)部件出發(fā),就取指策略、Cache的壓縮存儲(chǔ)技術(shù)及分支預(yù)測(cè)器進(jìn)行了研究,提出兩個(gè)有效的取指策略、一種簡(jiǎn)單的Cache壓縮技術(shù),以及一種基于值的分支預(yù)測(cè)方法,將這些研究成果結(jié)合起來(lái)構(gòu)成一個(gè)新的前端系統(tǒng),使其總體性能得到了大幅度的提高。具體的研究成果如下: 一種有效的SMT取指策略——IPCBFP:該策略分析了目前性能最好的ICOUNT策略的取指特點(diǎn),發(fā)現(xiàn)其存在線程指令分配不適當(dāng)?shù)膯?wèn)題,針對(duì)該問(wèn)題提出一種新的取指策略IPCBFP,該策略通過(guò)很少的硬件支持即可使SMT的總體性能得到很大的提高,同時(shí)對(duì)系統(tǒng)中其他資源的利用也更加有效; 一種具有QoS特性的取指策略:目前對(duì)在SMT中支持線程的QoS需求的研究非常少,僅有的一個(gè)策略其實(shí)現(xiàn)復(fù)雜度很高,不利于物理上的實(shí)現(xiàn)。本研究只從取指的角度來(lái)實(shí)現(xiàn)線程QoS的需求,提出一種新的取指策略,該策略在一定精度的范圍內(nèi)可以同時(shí)滿足多個(gè)線程的QoS需求,與前人的研究成果相比,該策略的實(shí)現(xiàn)更加簡(jiǎn)單,但精度稍差; 一種簡(jiǎn)單的Cache壓縮存儲(chǔ)技術(shù)和一種覆蓋存儲(chǔ)結(jié)構(gòu):在SMT的研究中,因多個(gè)線程競(jìng)爭(zhēng)Cache導(dǎo)致Cache失效率大幅度增加和單線程性能下降的問(wèn)題一直沒(méi)有得到很好的解決,本研究從Cache壓縮存儲(chǔ)的角度來(lái)解決該問(wèn)題,提出一種簡(jiǎn)單的Cache壓縮存儲(chǔ)技術(shù)和一種覆蓋存儲(chǔ)方法,獲得了較好的研究結(jié)果,使Cache的潛在容量大大提高,有效地減少了Cache失效次數(shù),提高了SMT的總體性能;該研究同時(shí)給出了關(guān)于Cache壓縮技術(shù)在SMT下應(yīng)用的一些結(jié)論; 一種基于數(shù)據(jù)值的分支預(yù)測(cè)器VBBP:多線程共享分支預(yù)測(cè)器的空間導(dǎo)致分支預(yù)測(cè)命中率大幅度下降,極大地影響了單線程的性能,本研究從數(shù)據(jù)值的角度提出一種新的分支預(yù)測(cè)器,并作為一個(gè)輔助部件與傳統(tǒng)的分支預(yù)測(cè)器共同使用;初步研究表明,該預(yù)測(cè)器有效地提高了分支預(yù)測(cè)的命中率; 結(jié)合上述研究成果提出的一種新的SMT前端系統(tǒng)組成方式:新的前端系統(tǒng)有效地提高了SMT的總體性能。與傳統(tǒng)的基于ICOUNT取指策略和gshare分支預(yù)測(cè)器的前端結(jié)構(gòu)相比,其性能得到了大幅度的提高,加速比達(dá)到了55%。 除此之外,本論文對(duì)目前最新的基于神經(jīng)元網(wǎng)絡(luò)的分支預(yù)測(cè)器在SMT下的性能也作
【學(xué)位授予單位】:中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2004
【分類(lèi)號(hào)】:TP332
【圖文】:
還有一類(lèi)新的SMT取指控制部件組織方法,其基本思想是在每個(gè)時(shí)鐘周期根據(jù)一個(gè)取指目標(biāo)緩沖區(qū)[GR01]或取指指令流緩沖區(qū)(Stream Buffer)[AR02]所提供的信息僅從一個(gè)線程取指令執(zhí)行,多個(gè)線程在不同的時(shí)鐘周期內(nèi)輪流進(jìn)行取指。在此,取指目標(biāo)緩沖區(qū)或流緩沖區(qū)的實(shí)質(zhì)是通過(guò)忽略若干個(gè)非跳轉(zhuǎn)的分支指令來(lái)增加有效的指令流長(zhǎng)度,從而減少流水線的斷流并提高處理器的性能。研究結(jié)果表明,基于流緩沖區(qū)的取指控制機(jī)制目前可以獲得最優(yōu)的SMT處理器指令吞吐率性能。總體來(lái)看,對(duì) SMT 前端系統(tǒng)的總體組織方式和性能進(jìn)行研究和討論的較單獨(dú)的技術(shù)而言相對(duì)較少。7.2 一種有效的 SMT 前端結(jié)構(gòu)在本節(jié)中,我們將把前面各章的研究成果結(jié)合到一起,提出一種新的有效的 SM前端結(jié)構(gòu)。在新的前端結(jié)構(gòu)中,取指策略選擇第二章提出的 IPCBFP 策略,1 級(jí)數(shù)據(jù) Cach采用第四章提出的改進(jìn)的 Cache 壓縮存儲(chǔ)結(jié)構(gòu),分支預(yù)測(cè)器則采用第五章提出的基于數(shù)據(jù)值的分支預(yù)測(cè)器 VBBP;此外,為了進(jìn)一步提高性能,將分支分類(lèi)器應(yīng)用到新的 SM前端結(jié)構(gòu)中,從而形成本章提出的最終結(jié)構(gòu),其系統(tǒng)結(jié)構(gòu)如圖 7.1 所示。
本文編號(hào):2788092
【學(xué)位授予單位】:中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2004
【分類(lèi)號(hào)】:TP332
【圖文】:
還有一類(lèi)新的SMT取指控制部件組織方法,其基本思想是在每個(gè)時(shí)鐘周期根據(jù)一個(gè)取指目標(biāo)緩沖區(qū)[GR01]或取指指令流緩沖區(qū)(Stream Buffer)[AR02]所提供的信息僅從一個(gè)線程取指令執(zhí)行,多個(gè)線程在不同的時(shí)鐘周期內(nèi)輪流進(jìn)行取指。在此,取指目標(biāo)緩沖區(qū)或流緩沖區(qū)的實(shí)質(zhì)是通過(guò)忽略若干個(gè)非跳轉(zhuǎn)的分支指令來(lái)增加有效的指令流長(zhǎng)度,從而減少流水線的斷流并提高處理器的性能。研究結(jié)果表明,基于流緩沖區(qū)的取指控制機(jī)制目前可以獲得最優(yōu)的SMT處理器指令吞吐率性能。總體來(lái)看,對(duì) SMT 前端系統(tǒng)的總體組織方式和性能進(jìn)行研究和討論的較單獨(dú)的技術(shù)而言相對(duì)較少。7.2 一種有效的 SMT 前端結(jié)構(gòu)在本節(jié)中,我們將把前面各章的研究成果結(jié)合到一起,提出一種新的有效的 SM前端結(jié)構(gòu)。在新的前端結(jié)構(gòu)中,取指策略選擇第二章提出的 IPCBFP 策略,1 級(jí)數(shù)據(jù) Cach采用第四章提出的改進(jìn)的 Cache 壓縮存儲(chǔ)結(jié)構(gòu),分支預(yù)測(cè)器則采用第五章提出的基于數(shù)據(jù)值的分支預(yù)測(cè)器 VBBP;此外,為了進(jìn)一步提高性能,將分支分類(lèi)器應(yīng)用到新的 SM前端結(jié)構(gòu)中,從而形成本章提出的最終結(jié)構(gòu),其系統(tǒng)結(jié)構(gòu)如圖 7.1 所示。
【共引文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 馬可;微處理器性能分析模型的建立和研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
本文編號(hào):2788092
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2788092.html
最近更新
教材專(zhuān)著