天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微處理器片上存儲(chǔ)系統(tǒng)性能優(yōu)化關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2020-08-28 20:40
   隨著超深亞微米集成電路制造工藝的成熟,給集成電路設(shè)計(jì)提供了廣闊的空間,單個(gè)芯片能夠集成的集體管數(shù)目已經(jīng)達(dá)到十億量級(jí),預(yù)計(jì)到2020年這一數(shù)字將超過(guò)180億個(gè)。目前,IBM和Intel的高端處理器已經(jīng)集成超過(guò)30億個(gè)晶體管,這些高性能處理器無(wú)一例外的都使用了大容量、多層次的片上Cache來(lái)隱藏訪存延遲,其面積已占到整個(gè)芯片的60%-70%。多元化應(yīng)用需求的持續(xù)推動(dòng)和體系結(jié)構(gòu)設(shè)計(jì)技術(shù)的不斷飛躍對(duì)微處理器片上存儲(chǔ)系統(tǒng)提出了更高要求和嚴(yán)峻挑戰(zhàn),“存儲(chǔ)墻”問題對(duì)處理器整體性能提升的阻礙作用愈發(fā)凸顯。如何合理、高效、智能的利用片上Cache空間,構(gòu)建高性能存儲(chǔ)系統(tǒng),進(jìn)而跨越“存儲(chǔ)墻”是處理器微體系結(jié)構(gòu)研究的重要內(nèi)容。本文深入分析了影響處理器存儲(chǔ)系統(tǒng)性能的主要因素,研究了片上存儲(chǔ)系統(tǒng)性能優(yōu)化關(guān)鍵技術(shù),認(rèn)為分支預(yù)測(cè)路徑上的猜測(cè)執(zhí)行帶來(lái)的Cache污染對(duì)Cache空間利用率和處理器IPC性能產(chǎn)生了負(fù)面影響。而現(xiàn)有Cache控制機(jī)制缺乏緩解Cache污染的能力和有效利用猜測(cè)路徑訪存數(shù)據(jù)預(yù)取效應(yīng)的能力,使Cache性能的提升受到阻礙。另外,對(duì)低延遲Cache替換算法的研究相對(duì)較少,仍存在進(jìn)一步優(yōu)化的空間。論文在對(duì)阻礙處理器片上存儲(chǔ)系統(tǒng)性能提升關(guān)鍵因素進(jìn)行深刻論述的基礎(chǔ)上,從減輕Cache污染、提升Cache空間使用效率和低延遲Cache替換算法幾個(gè)方面對(duì)處理器片上存儲(chǔ)系統(tǒng)性能優(yōu)化方案開展了深入研究,主要工作和創(chuàng)新點(diǎn)如下:(1)提出了一種基于分支預(yù)測(cè)路徑中存儲(chǔ)器訪問數(shù)據(jù)跟蹤的數(shù)據(jù)Cache污染過(guò)濾方案,通過(guò)動(dòng)態(tài)形成的分支預(yù)測(cè)路徑訪存數(shù)據(jù)跟蹤表,對(duì)猜測(cè)執(zhí)行路徑上的訪存指令寫入Cache的數(shù)據(jù)進(jìn)行實(shí)時(shí)動(dòng)態(tài)跟蹤,并且為每個(gè)Cache數(shù)據(jù)行對(duì)應(yīng)的地址標(biāo)簽字段增加兩個(gè)標(biāo)志域——猜測(cè)執(zhí)行數(shù)據(jù)標(biāo)志SDT和猜測(cè)路徑編號(hào)SPN來(lái)配合分支預(yù)測(cè)路徑訪存數(shù)據(jù)跟蹤表對(duì)Cache中污染數(shù)據(jù)的控制,降低了預(yù)測(cè)路徑上寫入Cache的數(shù)據(jù)對(duì)Cache效率的影響,有效提升了片上存儲(chǔ)系統(tǒng)的性能,不需要增加額外的獨(dú)立Cache,提升了Cache空間利用率,降低了Cache設(shè)計(jì)復(fù)雜度,對(duì)于小容量的D-Cache非常適用。實(shí)驗(yàn)結(jié)果表明,本方案對(duì)L1 D-Cache命中率提升幅度為0.03%-6.69%,平均提升了1.80%;IPC提升幅度為0.01%-6.60%,平均為2.56%。(2)提出了一種基于Cache數(shù)據(jù)地址標(biāo)簽Valid位分裂的低污染Cache訪問方案,對(duì)Cache地址標(biāo)簽中的Valid位做優(yōu)化設(shè)計(jì),將原有的1位地址標(biāo)簽Valid位替換為2位標(biāo)志,即RVB標(biāo)志位和WVB標(biāo)志位,并根據(jù)這兩個(gè)標(biāo)志位的不同組合對(duì)Cache數(shù)據(jù)行的讀寫訪問進(jìn)行專門控制。第一,該低污染Cache訪問方案能夠區(qū)分正確路徑上訪存指令和猜測(cè)路徑上訪存指令寫入Cache的數(shù)據(jù),并采用不同的方式進(jìn)行處理;第二,該低污染Cache訪問方案能夠保留并利用猜測(cè)路徑上訪存數(shù)據(jù)可能具有的數(shù)據(jù)預(yù)取效應(yīng);第三,每次向Cache寫入數(shù)據(jù)時(shí),無(wú)須經(jīng)過(guò)Cache替換算法的處理就能夠直接向Cache中存儲(chǔ)猜測(cè)數(shù)據(jù)的Cache行寫入數(shù)據(jù)。用較為簡(jiǎn)單的方法有效提升了Cache空間的利用率,提高了Cache寫操作效率,降低了猜測(cè)路徑上訪存數(shù)據(jù)可能導(dǎo)致的Cache污染對(duì)片上存儲(chǔ)性能的影響。實(shí)驗(yàn)結(jié)果表明,本低污染Cache訪問方案能夠?qū)PC(Instruction per Clock)性能平均提升5.13%,使L1 D-Cache缺失率平均降低29.66%。(3)提出了一種基于空間預(yù)約的低延遲Cache替換算法——CSPO,為片上Cache單元增加空間預(yù)約機(jī)制,包括預(yù)約空間計(jì)數(shù)器POC,Cache行預(yù)約標(biāo)志POT,多個(gè)空間預(yù)約地址寄存器CPAR,以及相應(yīng)的控制邏輯,實(shí)現(xiàn)了Cache替換目標(biāo)的選擇過(guò)程與片外存儲(chǔ)器訪問操作并行執(zhí)行。該策略同時(shí)具備盡快提前將Cache臟數(shù)據(jù)寫回主存的能力,有效隱藏Cache替換操作和Cache臟數(shù)據(jù)寫回延遲、降低了訪存指令執(zhí)行總延遲,提升了指令吞吐性能。尤其對(duì)于預(yù)約的Cache數(shù)據(jù)行為臟數(shù)據(jù)的情況來(lái)說(shuō),CSPO能夠提前啟動(dòng)臟數(shù)據(jù)的寫回操作,顯著降低Cache訪問總延遲。仿真結(jié)果表明,CSPO方案能使IPC平均提升5.37%。論文的研究成果為片上存儲(chǔ)系統(tǒng)性能優(yōu)化設(shè)計(jì)提供了可借鑒的方案,也為進(jìn)一步提高先進(jìn)處理器體系結(jié)構(gòu)中的Cache性能提供了方法和手段。
【學(xué)位單位】:長(zhǎng)安大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2018
【中圖分類】:TP333
【部分圖文】:

體系結(jié)構(gòu),多線程處理器,線程,細(xì)粒度


多線程處理器[40]通過(guò)狀態(tài)資源的復(fù)制來(lái)保持每個(gè)線程上下文,其中包括各狀態(tài)寄存器和程序計(jì)數(shù)器(PC,Program Counter)等,但是執(zhí)行資源和片存則為多個(gè)線程共享。由于能夠?qū)崿F(xiàn)線程間的快速切換,這就對(duì)硬件控制提出了較高的要求,設(shè)計(jì)復(fù)雜度和硬件開銷較大。多線程處理器可分為兩即各個(gè)線程交替執(zhí)行的細(xì)粒度多線程處理器和只在長(zhǎng)延遲事件出現(xiàn)才進(jìn)行切換的粗粒度多線程處理器。細(xì)粒度多線程體系結(jié)構(gòu)下,每個(gè)時(shí)鐘周期都行線程上下文的切換,而粗粒度的則不會(huì)頻繁的在線程間切換執(zhí)行。針對(duì)特征的應(yīng)用程序,這兩種體系結(jié)構(gòu)各具優(yōu)勢(shì)。不同體系結(jié)構(gòu)下指令的執(zhí)行如圖 1.5所示。

多線程體系結(jié)構(gòu)


長(zhǎng)安大學(xué)博士學(xué)位論文進(jìn)行切換,這種結(jié)構(gòu)是用單線程性能的犧牲換取了系統(tǒng)吞吐率提升,借多數(shù)量的線程運(yùn)行來(lái)隱藏訪存延遲,但是在執(zhí)行線程數(shù)較少的情況下,能的提升比較有限。而粗粒度多線程結(jié)構(gòu)對(duì)單個(gè)線程指令級(jí)并行性的挖充分,但是卻存在線程間切換的開銷較大、設(shè)計(jì)相對(duì)復(fù)雜的問題。

多線程體系結(jié)構(gòu)


案來(lái)實(shí)現(xiàn)資源濫用和占用的檢測(cè)和發(fā)現(xiàn),并且能夠及時(shí)的將壟斷存儲(chǔ)資源的線程掛起或者阻塞,進(jìn)而將占用的存儲(chǔ)空間釋放,提供給真正需要的線程使用,緩解多個(gè)線程對(duì)存儲(chǔ)資源的競(jìng)爭(zhēng),提升片上存儲(chǔ)資源的利用率。1.2.4同時(shí)多線程處理器存儲(chǔ)結(jié)構(gòu)在同時(shí)多線程結(jié)構(gòu)中,通過(guò)增加相應(yīng)的多線程自動(dòng)切換和發(fā)射寬度增大的硬件支持,更大限度地實(shí)現(xiàn)寬發(fā)射、亂序執(zhí)行的超標(biāo)量處理,使得流水線效率和系統(tǒng)性能得以提升。SMT 技術(shù)將超標(biāo)量技術(shù)和多線程技術(shù)的優(yōu)勢(shì)相結(jié)合,在只有增加少量硬件資源和芯片面積的情況下,充分挖掘線程級(jí)并行性。它實(shí)現(xiàn)每個(gè)時(shí)鐘周期來(lái)自多個(gè)線程的多條指令的同時(shí)發(fā)射執(zhí)行,通過(guò)對(duì) ILP 和 TLP 的并行挖掘,有效改善水平浪費(fèi)和垂直浪費(fèi)問題。但是,當(dāng)某個(gè)時(shí)鐘周期可并行發(fā)射的指令有限時(shí),部分發(fā)射槽和相關(guān)執(zhí)行部件空閑,導(dǎo)致處理器執(zhí)行效率的下降。

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 Zhen TANG;Wei WANG;Lei SUN;Yu HUANG;Heng WU;Jun WEI;Tao HUANG;;IO dependent SSD cache allocation for elastic Hadoop applications[J];Science China(Information Sciences);2018年05期

2 孫玉強(qiáng);王文聞;巢碧霞;顧玉宛;;基于預(yù)取的Cache替換策略[J];微電子學(xué)與計(jì)算機(jī);2017年01期

3 徐金波;龐征斌;李琰;;位置信息與替換概率相結(jié)合的多核共享Cache管理機(jī)制[J];國(guó)防科技大學(xué)學(xué)報(bào);2016年05期

4 文敏華;強(qiáng)凱;;多核中Cache一致性延遲分析[J];信息通信;2016年03期

5 文敏華;顏豐琳;;一種Cache一致性優(yōu)化策略[J];信息系統(tǒng)工程;2016年04期

6 于茜;蔡紅柳;陳財(cái)森;;一種自適應(yīng)的cache驅(qū)逐策略[J];信息通信;2016年05期

7 毛金玲;;基于抽象解釋技術(shù)的Cache分析方法[J];中小企業(yè)管理與科技(中旬刊);2015年03期

8 毛金玲;;基于抽象解釋技術(shù)的多層Cache分析的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2014年24期

9 王黨輝;劉合朋;陳怡然;;Multi-bit soft error tolerable L1 data cache based on characteristic of data value[J];Journal of Central South University;2015年05期

10 何青松;鄧超;邱志;;一種嵌入式系統(tǒng)的滑動(dòng)Cache機(jī)制設(shè)計(jì)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2015年03期

相關(guān)會(huì)議論文 前10條

1 葛磊磊;劉勝;陳海燕;;一種融人優(yōu)先權(quán)的Cache行替換機(jī)制[A];第十七屆計(jì)算機(jī)工程與工藝年會(huì)暨第三屆微處理器技術(shù)論壇論文集(下冊(cè))[C];2013年

2 所光;楊學(xué)軍;;雙核處理器性能最優(yōu)的共享Cache劃分[A];2008年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2008年

3 ;Application of cache in Data Access Performance Optimization[A];2011年全國(guó)電子信息技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2011年

4 石文強(qiáng);倪曉強(qiáng);金作霖;張民選;;Cache動(dòng)態(tài)插入策略模型研究[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年

5 楊旭;駱祖瑩;韓銀和;;基于cache內(nèi)容替換的系統(tǒng)管理模式漏洞檢測(cè)方法[A];第十四屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議(CFTC'2011)論文集[C];2011年

6 李昭然;劉勝;許邦建;陳海燕;;基于System Verilog Assertions的全局Cache的形式化驗(yàn)證[A];第十九屆計(jì)算機(jī)工程與工藝年會(huì)暨第五屆微處理器技術(shù)論壇論文集[C];2015年

7 Yu Xi;Cai Hong-liu;Chen Cai-sen;Xiang Yang-xia;;Security Analysis on S-Box of LBlock Algorithm Based on Trace-Driven Cache Timing Attack[A];第17屆中國(guó)系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會(huì)論文集(17th CCSSTA 2016)[C];2016年

8 汪騰;楊少軍;;一種高效的指令Cache的結(jié)構(gòu)[A];中國(guó)聲學(xué)學(xué)會(huì)2001年青年學(xué)術(shù)會(huì)議[CYCA'01]論文集[C];2001年

9 ;Research on WEB Cache Prediction Recommend Mechanism Based on Usage Pattern[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年

10 周旋;馮玉才;李碧波;孫小薇;;多服務(wù)器DBMS的Cache管理[A];數(shù)據(jù)庫(kù)研究與進(jìn)展95——第十三屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1995年

相關(guān)重要報(bào)紙文章 前10條

1 上海 李超;什么是Cache[N];電腦報(bào);2001年

2 劉昌勇;小緩存里的大學(xué)問[N];中國(guó)電腦教育報(bào);2004年

3 北京共創(chuàng)開源軟件股份有限公司 董孝峰;共創(chuàng)NC的設(shè)計(jì)與實(shí)現(xiàn)[N];中國(guó)計(jì)算機(jī)報(bào);2004年

4 超頻者;K7-650(0015)最新實(shí)超報(bào)告[N];大眾科技報(bào);2000年

5 ;阿萌小辭典[N];電腦報(bào);2004年

6 陳自文;CPU如何影響IA服務(wù)器的性能?[N];網(wǎng)絡(luò)世界;2000年

7 中國(guó)計(jì)算機(jī)報(bào)測(cè)試實(shí)驗(yàn)室 王炳晨;Duron抵京,Thunderbird爭(zhēng)宏[N];中國(guó)計(jì)算機(jī)報(bào);2000年

8 安徽省六安市 李紅;SOHO上網(wǎng)這樣省錢[N];中國(guó)計(jì)算機(jī)報(bào);2000年

9 巖公;電信網(wǎng)加速不難[N];中國(guó)計(jì)算機(jī)報(bào);2003年

10 徐春梅;國(guó)際品牌進(jìn)入中國(guó):適應(yīng)是關(guān)鍵[N];中國(guó)經(jīng)營(yíng)報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 劉松鶴;微處理器片上存儲(chǔ)系統(tǒng)性能優(yōu)化關(guān)鍵技術(shù)研究[D];長(zhǎng)安大學(xué);2018年

2 李炳超;高性能GPU系統(tǒng)結(jié)構(gòu)的研究[D];天津大學(xué);2017年

3 鄭重;異構(gòu)眾核體系結(jié)構(gòu)Cache功耗和性能優(yōu)化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年

4 田新華;面向性能優(yōu)化的壓縮cache技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2007年

5 付雄;利用程序分析和優(yōu)化提高Cache性能[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

6 彭蔓蔓;體系結(jié)構(gòu)級(jí)低能耗Cache和動(dòng)態(tài)電壓縮放技術(shù)研究[D];湖南大學(xué);2007年

7 賈小敏;多核處理器片上Cache訪問行為分析與優(yōu)化機(jī)制研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

8 項(xiàng)曉燕;體系結(jié)構(gòu)級(jí)Cache功耗優(yōu)化技術(shù)研究[D];浙江大學(xué);2013年

9 孫蓀;提高多核處理器片上Cache利用率的關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年

10 周宏偉;微處理器中Cache漏流功耗的體系結(jié)構(gòu)級(jí)優(yōu)化技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 吳建宇;面向多線程應(yīng)用的多核Cache優(yōu)化研究[D];湖南大學(xué);2014年

2 王鵬;Cache替換算法中重引用區(qū)間預(yù)測(cè)策略的改進(jìn)[D];湖南大學(xué);2016年

3 李靜;基于Cache感知的自供能NVP系統(tǒng)備份方案的研究[D];山東大學(xué);2018年

4 邱鯉跳;3D堆疊DRAM Cache的建模以及功耗優(yōu)化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2016年

5 孫金周;面向安卓應(yīng)用的Cache設(shè)計(jì)空間探索[D];東南大學(xué);2016年

6 王利杰;基于視頻場(chǎng)景的帶寬感知Cache模型和劃分策略[D];華中科技大學(xué);2013年

7 劉清;嵌入式系統(tǒng)中低功耗可重構(gòu)Cache的研究與設(shè)計(jì)[D];湖南大學(xué);2012年

8 李冬妮;嵌入式系統(tǒng)中低功耗Cache的重構(gòu)技術(shù)研究[D];湖南大學(xué);2012年

9 李家文;虛擬機(jī)環(huán)境下動(dòng)態(tài)Cache劃分技術(shù)研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

10 楊巍;采用基樹的磁盤陣列Cache技術(shù)研究[D];華中科技大學(xué);2009年



本文編號(hào):2808131

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2808131.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3988***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
av免费视屏在线观看| 精品亚洲一区二区三区w竹菊 | 精品人妻精品一区二区三区| 欧美日韩亚洲精品在线观看| 国产在线一区二区三区不卡| 男女午夜福利院在线观看| 亚洲一区二区三区免费的视频| 好吊视频一区二区在线| 成在线人免费视频一区二区| 国产精品激情对白一区二区| 99秋霞在线观看视频| 久久综合亚洲精品蜜桃| 免费观看成人免费视频| 亚洲精品一区二区三区日韩| 搡老熟女老女人一区二区| 丰满的人妻一区二区三区| 福利新区一区二区人口| 久久精品亚洲情色欧美| 毛片在线观看免费日韩| 91麻豆视频国产一区二区| 日本婷婷色大香蕉视频在线观看| 99久久国产综合精品二区 | 中文字幕日韩欧美一区| 国产真人无遮挡免费视频一区| 成人午夜免费观看视频| 成人免费高清在线一区二区| 99久久精品国产麻豆| 国产欧美日韩精品自拍| 两性色午夜天堂免费视频| 国产又粗又猛又大爽又黄| 91人妻人人精品人人爽| 欧美日韩视频中文字幕| 亚洲视频偷拍福利来袭| 日韩欧美精品一区二区三区| 美女黄色三级深夜福利| 97人妻人人揉人人躁人人| 欧美韩日在线观看一区| 福利一区二区视频在线| 亚洲欧美日本国产有色| 真实国产乱子伦对白视频不卡| 欧美成人黄色一区二区三区|