天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

同時(shí)多線程處理器前端系統(tǒng)的研究

發(fā)布時(shí)間:2020-08-10 12:41
【摘要】: 同時(shí)多線程處理器(SMT)通過(guò)在每個(gè)時(shí)鐘周期從多個(gè)同時(shí)運(yùn)行的線程取指令執(zhí)行,充分挖掘了線程內(nèi)的指令級(jí)并行性和線程間的線程級(jí)并行性,減少了指令槽的水平浪費(fèi)和垂直浪費(fèi),從而極大地提高了處理器的指令吞吐率,成為目前主流的微處理器體系結(jié)構(gòu)之一。 SMT的前端系統(tǒng)(包括:取指部件、1級(jí)Cache和分支預(yù)測(cè)器)是影響其性能的關(guān)鍵,也是目前學(xué)術(shù)界研究SMT的重點(diǎn)。本論文分別從其前端系統(tǒng)的三個(gè)部件出發(fā),就取指策略、Cache的壓縮存儲(chǔ)技術(shù)及分支預(yù)測(cè)器進(jìn)行了研究,提出兩個(gè)有效的取指策略、一種簡(jiǎn)單的Cache壓縮技術(shù),以及一種基于值的分支預(yù)測(cè)方法,將這些研究成果結(jié)合起來(lái)構(gòu)成一個(gè)新的前端系統(tǒng),使其總體性能得到了大幅度的提高。具體的研究成果如下: 一種有效的SMT取指策略——IPCBFP:該策略分析了目前性能最好的ICOUNT策略的取指特點(diǎn),發(fā)現(xiàn)其存在線程指令分配不適當(dāng)?shù)膯?wèn)題,針對(duì)該問(wèn)題提出一種新的取指策略IPCBFP,該策略通過(guò)很少的硬件支持即可使SMT的總體性能得到很大的提高,同時(shí)對(duì)系統(tǒng)中其他資源的利用也更加有效; 一種具有QoS特性的取指策略:目前對(duì)在SMT中支持線程的QoS需求的研究非常少,僅有的一個(gè)策略其實(shí)現(xiàn)復(fù)雜度很高,不利于物理上的實(shí)現(xiàn)。本研究只從取指的角度來(lái)實(shí)現(xiàn)線程QoS的需求,提出一種新的取指策略,該策略在一定精度的范圍內(nèi)可以同時(shí)滿足多個(gè)線程的QoS需求,與前人的研究成果相比,該策略的實(shí)現(xiàn)更加簡(jiǎn)單,但精度稍差; 一種簡(jiǎn)單的Cache壓縮存儲(chǔ)技術(shù)和一種覆蓋存儲(chǔ)結(jié)構(gòu):在SMT的研究中,因多個(gè)線程競(jìng)爭(zhēng)Cache導(dǎo)致Cache失效率大幅度增加和單線程性能下降的問(wèn)題一直沒(méi)有得到很好的解決,本研究從Cache壓縮存儲(chǔ)的角度來(lái)解決該問(wèn)題,提出一種簡(jiǎn)單的Cache壓縮存儲(chǔ)技術(shù)和一種覆蓋存儲(chǔ)方法,獲得了較好的研究結(jié)果,使Cache的潛在容量大大提高,有效地減少了Cache失效次數(shù),提高了SMT的總體性能;該研究同時(shí)給出了關(guān)于Cache壓縮技術(shù)在SMT下應(yīng)用的一些結(jié)論; 一種基于數(shù)據(jù)值的分支預(yù)測(cè)器VBBP:多線程共享分支預(yù)測(cè)器的空間導(dǎo)致分支預(yù)測(cè)命中率大幅度下降,極大地影響了單線程的性能,本研究從數(shù)據(jù)值的角度提出一種新的分支預(yù)測(cè)器,并作為一個(gè)輔助部件與傳統(tǒng)的分支預(yù)測(cè)器共同使用;初步研究表明,該預(yù)測(cè)器有效地提高了分支預(yù)測(cè)的命中率; 結(jié)合上述研究成果提出的一種新的SMT前端系統(tǒng)組成方式:新的前端系統(tǒng)有效地提高了SMT的總體性能。與傳統(tǒng)的基于ICOUNT取指策略和gshare分支預(yù)測(cè)器的前端結(jié)構(gòu)相比,其性能得到了大幅度的提高,加速比達(dá)到了55%。 除此之外,本論文對(duì)目前最新的基于神經(jīng)元網(wǎng)絡(luò)的分支預(yù)測(cè)器在SMT下的性能也作
【學(xué)位授予單位】:中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2004
【分類(lèi)號(hào)】:TP332
【圖文】:

控制部分,系統(tǒng)結(jié)構(gòu),緩沖區(qū),指令流


還有一類(lèi)新的SMT取指控制部件組織方法,其基本思想是在每個(gè)時(shí)鐘周期根據(jù)一個(gè)取指目標(biāo)緩沖區(qū)[GR01]或取指指令流緩沖區(qū)(Stream Buffer)[AR02]所提供的信息僅從一個(gè)線程取指令執(zhí)行,多個(gè)線程在不同的時(shí)鐘周期內(nèi)輪流進(jìn)行取指。在此,取指目標(biāo)緩沖區(qū)或流緩沖區(qū)的實(shí)質(zhì)是通過(guò)忽略若干個(gè)非跳轉(zhuǎn)的分支指令來(lái)增加有效的指令流長(zhǎng)度,從而減少流水線的斷流并提高處理器的性能。研究結(jié)果表明,基于流緩沖區(qū)的取指控制機(jī)制目前可以獲得最優(yōu)的SMT處理器指令吞吐率性能。總體來(lái)看,對(duì) SMT 前端系統(tǒng)的總體組織方式和性能進(jìn)行研究和討論的較單獨(dú)的技術(shù)而言相對(duì)較少。7.2 一種有效的 SMT 前端結(jié)構(gòu)在本節(jié)中,我們將把前面各章的研究成果結(jié)合到一起,提出一種新的有效的 SM前端結(jié)構(gòu)。在新的前端結(jié)構(gòu)中,取指策略選擇第二章提出的 IPCBFP 策略,1 級(jí)數(shù)據(jù) Cach采用第四章提出的改進(jìn)的 Cache 壓縮存儲(chǔ)結(jié)構(gòu),分支預(yù)測(cè)器則采用第五章提出的基于數(shù)據(jù)值的分支預(yù)測(cè)器 VBBP;此外,為了進(jìn)一步提高性能,將分支分類(lèi)器應(yīng)用到新的 SM前端結(jié)構(gòu)中,從而形成本章提出的最終結(jié)構(gòu),其系統(tǒng)結(jié)構(gòu)如圖 7.1 所示。

【共引文獻(xiàn)】

相關(guān)博士學(xué)位論文 前1條

1 馬可;微處理器性能分析模型的建立和研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年



本文編號(hào):2788092

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2788092.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2f874***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
精品欧美在线观看国产| 午夜福利在线观看免费| 99久久人妻精品免费一区| 国产目拍亚洲精品区一区| 一区二区日本一区二区欧美| 欧美精品在线播放一区二区| 黑色丝袜脚足国产一区二区| 亚洲人午夜精品射精日韩| 亚洲中文在线中文字幕91| 国产精品免费自拍视频| 九九蜜桃视频香蕉视频| 亚洲熟妇熟女久久精品| 亚洲一区二区三区中文久久| 一本色道久久综合狠狠躁| 日本丰满大奶熟女一区二区| 国产丝袜女优一区二区三区| 老司机精品国产在线视频 | 亚洲国产欧美精品久久| 日本午夜免费观看视频| 欧美三级大黄片免费看| 国产精品大秀视频日韩精品| 亚洲精品深夜福利视频| 精品国产亚洲一区二区三区| 在线中文字幕亚洲欧美一区| 九九蜜桃视频香蕉视频| 亚洲午夜av一区二区| 欧美黑人在线一区二区| 国产高清一区二区不卡| 中文字幕一二区在线观看| 国产精品刮毛视频不卡| 亚洲欧美日本国产有色| 国内真实露脸偷拍视频| 在线观看国产午夜福利| 日韩一区二区三区免费av| 少妇人妻一级片一区二区三区| 国产又大又黄又粗的黄色| 九九热精品视频免费观看| 日本av一区二区不卡| 色欧美一区二区三区在线| 欧美极品欧美精品欧美| 国产黄色高清内射熟女视频|