天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

微處理器片上存儲系統(tǒng)性能優(yōu)化關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2020-08-28 20:40
   隨著超深亞微米集成電路制造工藝的成熟,給集成電路設(shè)計(jì)提供了廣闊的空間,單個(gè)芯片能夠集成的集體管數(shù)目已經(jīng)達(dá)到十億量級,預(yù)計(jì)到2020年這一數(shù)字將超過180億個(gè)。目前,IBM和Intel的高端處理器已經(jīng)集成超過30億個(gè)晶體管,這些高性能處理器無一例外的都使用了大容量、多層次的片上Cache來隱藏訪存延遲,其面積已占到整個(gè)芯片的60%-70%。多元化應(yīng)用需求的持續(xù)推動和體系結(jié)構(gòu)設(shè)計(jì)技術(shù)的不斷飛躍對微處理器片上存儲系統(tǒng)提出了更高要求和嚴(yán)峻挑戰(zhàn),“存儲墻”問題對處理器整體性能提升的阻礙作用愈發(fā)凸顯。如何合理、高效、智能的利用片上Cache空間,構(gòu)建高性能存儲系統(tǒng),進(jìn)而跨越“存儲墻”是處理器微體系結(jié)構(gòu)研究的重要內(nèi)容。本文深入分析了影響處理器存儲系統(tǒng)性能的主要因素,研究了片上存儲系統(tǒng)性能優(yōu)化關(guān)鍵技術(shù),認(rèn)為分支預(yù)測路徑上的猜測執(zhí)行帶來的Cache污染對Cache空間利用率和處理器IPC性能產(chǎn)生了負(fù)面影響。而現(xiàn)有Cache控制機(jī)制缺乏緩解Cache污染的能力和有效利用猜測路徑訪存數(shù)據(jù)預(yù)取效應(yīng)的能力,使Cache性能的提升受到阻礙。另外,對低延遲Cache替換算法的研究相對較少,仍存在進(jìn)一步優(yōu)化的空間。論文在對阻礙處理器片上存儲系統(tǒng)性能提升關(guān)鍵因素進(jìn)行深刻論述的基礎(chǔ)上,從減輕Cache污染、提升Cache空間使用效率和低延遲Cache替換算法幾個(gè)方面對處理器片上存儲系統(tǒng)性能優(yōu)化方案開展了深入研究,主要工作和創(chuàng)新點(diǎn)如下:(1)提出了一種基于分支預(yù)測路徑中存儲器訪問數(shù)據(jù)跟蹤的數(shù)據(jù)Cache污染過濾方案,通過動態(tài)形成的分支預(yù)測路徑訪存數(shù)據(jù)跟蹤表,對猜測執(zhí)行路徑上的訪存指令寫入Cache的數(shù)據(jù)進(jìn)行實(shí)時(shí)動態(tài)跟蹤,并且為每個(gè)Cache數(shù)據(jù)行對應(yīng)的地址標(biāo)簽字段增加兩個(gè)標(biāo)志域——猜測執(zhí)行數(shù)據(jù)標(biāo)志SDT和猜測路徑編號SPN來配合分支預(yù)測路徑訪存數(shù)據(jù)跟蹤表對Cache中污染數(shù)據(jù)的控制,降低了預(yù)測路徑上寫入Cache的數(shù)據(jù)對Cache效率的影響,有效提升了片上存儲系統(tǒng)的性能,不需要增加額外的獨(dú)立Cache,提升了Cache空間利用率,降低了Cache設(shè)計(jì)復(fù)雜度,對于小容量的D-Cache非常適用。實(shí)驗(yàn)結(jié)果表明,本方案對L1 D-Cache命中率提升幅度為0.03%-6.69%,平均提升了1.80%;IPC提升幅度為0.01%-6.60%,平均為2.56%。(2)提出了一種基于Cache數(shù)據(jù)地址標(biāo)簽Valid位分裂的低污染Cache訪問方案,對Cache地址標(biāo)簽中的Valid位做優(yōu)化設(shè)計(jì),將原有的1位地址標(biāo)簽Valid位替換為2位標(biāo)志,即RVB標(biāo)志位和WVB標(biāo)志位,并根據(jù)這兩個(gè)標(biāo)志位的不同組合對Cache數(shù)據(jù)行的讀寫訪問進(jìn)行專門控制。第一,該低污染Cache訪問方案能夠區(qū)分正確路徑上訪存指令和猜測路徑上訪存指令寫入Cache的數(shù)據(jù),并采用不同的方式進(jìn)行處理;第二,該低污染Cache訪問方案能夠保留并利用猜測路徑上訪存數(shù)據(jù)可能具有的數(shù)據(jù)預(yù)取效應(yīng);第三,每次向Cache寫入數(shù)據(jù)時(shí),無須經(jīng)過Cache替換算法的處理就能夠直接向Cache中存儲猜測數(shù)據(jù)的Cache行寫入數(shù)據(jù)。用較為簡單的方法有效提升了Cache空間的利用率,提高了Cache寫操作效率,降低了猜測路徑上訪存數(shù)據(jù)可能導(dǎo)致的Cache污染對片上存儲性能的影響。實(shí)驗(yàn)結(jié)果表明,本低污染Cache訪問方案能夠?qū)PC(Instruction per Clock)性能平均提升5.13%,使L1 D-Cache缺失率平均降低29.66%。(3)提出了一種基于空間預(yù)約的低延遲Cache替換算法——CSPO,為片上Cache單元增加空間預(yù)約機(jī)制,包括預(yù)約空間計(jì)數(shù)器POC,Cache行預(yù)約標(biāo)志POT,多個(gè)空間預(yù)約地址寄存器CPAR,以及相應(yīng)的控制邏輯,實(shí)現(xiàn)了Cache替換目標(biāo)的選擇過程與片外存儲器訪問操作并行執(zhí)行。該策略同時(shí)具備盡快提前將Cache臟數(shù)據(jù)寫回主存的能力,有效隱藏Cache替換操作和Cache臟數(shù)據(jù)寫回延遲、降低了訪存指令執(zhí)行總延遲,提升了指令吞吐性能。尤其對于預(yù)約的Cache數(shù)據(jù)行為臟數(shù)據(jù)的情況來說,CSPO能夠提前啟動臟數(shù)據(jù)的寫回操作,顯著降低Cache訪問總延遲。仿真結(jié)果表明,CSPO方案能使IPC平均提升5.37%。論文的研究成果為片上存儲系統(tǒng)性能優(yōu)化設(shè)計(jì)提供了可借鑒的方案,也為進(jìn)一步提高先進(jìn)處理器體系結(jié)構(gòu)中的Cache性能提供了方法和手段。
【學(xué)位單位】:長安大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2018
【中圖分類】:TP333
【部分圖文】:

體系結(jié)構(gòu),多線程處理器,線程,細(xì)粒度


多線程處理器[40]通過狀態(tài)資源的復(fù)制來保持每個(gè)線程上下文,其中包括各狀態(tài)寄存器和程序計(jì)數(shù)器(PC,Program Counter)等,但是執(zhí)行資源和片存則為多個(gè)線程共享。由于能夠?qū)崿F(xiàn)線程間的快速切換,這就對硬件控制提出了較高的要求,設(shè)計(jì)復(fù)雜度和硬件開銷較大。多線程處理器可分為兩即各個(gè)線程交替執(zhí)行的細(xì)粒度多線程處理器和只在長延遲事件出現(xiàn)才進(jìn)行切換的粗粒度多線程處理器。細(xì)粒度多線程體系結(jié)構(gòu)下,每個(gè)時(shí)鐘周期都行線程上下文的切換,而粗粒度的則不會頻繁的在線程間切換執(zhí)行。針對特征的應(yīng)用程序,這兩種體系結(jié)構(gòu)各具優(yōu)勢。不同體系結(jié)構(gòu)下指令的執(zhí)行如圖 1.5所示。

多線程體系結(jié)構(gòu)


長安大學(xué)博士學(xué)位論文進(jìn)行切換,這種結(jié)構(gòu)是用單線程性能的犧牲換取了系統(tǒng)吞吐率提升,借多數(shù)量的線程運(yùn)行來隱藏訪存延遲,但是在執(zhí)行線程數(shù)較少的情況下,能的提升比較有限。而粗粒度多線程結(jié)構(gòu)對單個(gè)線程指令級并行性的挖充分,但是卻存在線程間切換的開銷較大、設(shè)計(jì)相對復(fù)雜的問題。

多線程體系結(jié)構(gòu)


案來實(shí)現(xiàn)資源濫用和占用的檢測和發(fā)現(xiàn),并且能夠及時(shí)的將壟斷存儲資源的線程掛起或者阻塞,進(jìn)而將占用的存儲空間釋放,提供給真正需要的線程使用,緩解多個(gè)線程對存儲資源的競爭,提升片上存儲資源的利用率。1.2.4同時(shí)多線程處理器存儲結(jié)構(gòu)在同時(shí)多線程結(jié)構(gòu)中,通過增加相應(yīng)的多線程自動切換和發(fā)射寬度增大的硬件支持,更大限度地實(shí)現(xiàn)寬發(fā)射、亂序執(zhí)行的超標(biāo)量處理,使得流水線效率和系統(tǒng)性能得以提升。SMT 技術(shù)將超標(biāo)量技術(shù)和多線程技術(shù)的優(yōu)勢相結(jié)合,在只有增加少量硬件資源和芯片面積的情況下,充分挖掘線程級并行性。它實(shí)現(xiàn)每個(gè)時(shí)鐘周期來自多個(gè)線程的多條指令的同時(shí)發(fā)射執(zhí)行,通過對 ILP 和 TLP 的并行挖掘,有效改善水平浪費(fèi)和垂直浪費(fèi)問題。但是,當(dāng)某個(gè)時(shí)鐘周期可并行發(fā)射的指令有限時(shí),部分發(fā)射槽和相關(guān)執(zhí)行部件空閑,導(dǎo)致處理器執(zhí)行效率的下降。

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 Zhen TANG;Wei WANG;Lei SUN;Yu HUANG;Heng WU;Jun WEI;Tao HUANG;;IO dependent SSD cache allocation for elastic Hadoop applications[J];Science China(Information Sciences);2018年05期

2 孫玉強(qiáng);王文聞;巢碧霞;顧玉宛;;基于預(yù)取的Cache替換策略[J];微電子學(xué)與計(jì)算機(jī);2017年01期

3 徐金波;龐征斌;李琰;;位置信息與替換概率相結(jié)合的多核共享Cache管理機(jī)制[J];國防科技大學(xué)學(xué)報(bào);2016年05期

4 文敏華;強(qiáng)凱;;多核中Cache一致性延遲分析[J];信息通信;2016年03期

5 文敏華;顏豐琳;;一種Cache一致性優(yōu)化策略[J];信息系統(tǒng)工程;2016年04期

6 于茜;蔡紅柳;陳財(cái)森;;一種自適應(yīng)的cache驅(qū)逐策略[J];信息通信;2016年05期

7 毛金玲;;基于抽象解釋技術(shù)的Cache分析方法[J];中小企業(yè)管理與科技(中旬刊);2015年03期

8 毛金玲;;基于抽象解釋技術(shù)的多層Cache分析的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2014年24期

9 王黨輝;劉合朋;陳怡然;;Multi-bit soft error tolerable L1 data cache based on characteristic of data value[J];Journal of Central South University;2015年05期

10 何青松;鄧超;邱志;;一種嵌入式系統(tǒng)的滑動Cache機(jī)制設(shè)計(jì)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2015年03期

相關(guān)會議論文 前10條

1 葛磊磊;劉勝;陳海燕;;一種融人優(yōu)先權(quán)的Cache行替換機(jī)制[A];第十七屆計(jì)算機(jī)工程與工藝年會暨第三屆微處理器技術(shù)論壇論文集(下冊)[C];2013年

2 所光;楊學(xué)軍;;雙核處理器性能最優(yōu)的共享Cache劃分[A];2008年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2008年

3 ;Application of cache in Data Access Performance Optimization[A];2011年全國電子信息技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2011年

4 石文強(qiáng);倪曉強(qiáng);金作霖;張民選;;Cache動態(tài)插入策略模型研究[A];第十五屆計(jì)算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年

5 楊旭;駱祖瑩;韓銀和;;基于cache內(nèi)容替換的系統(tǒng)管理模式漏洞檢測方法[A];第十四屆全國容錯(cuò)計(jì)算學(xué)術(shù)會議(CFTC'2011)論文集[C];2011年

6 李昭然;劉勝;許邦建;陳海燕;;基于System Verilog Assertions的全局Cache的形式化驗(yàn)證[A];第十九屆計(jì)算機(jī)工程與工藝年會暨第五屆微處理器技術(shù)論壇論文集[C];2015年

7 Yu Xi;Cai Hong-liu;Chen Cai-sen;Xiang Yang-xia;;Security Analysis on S-Box of LBlock Algorithm Based on Trace-Driven Cache Timing Attack[A];第17屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會論文集(17th CCSSTA 2016)[C];2016年

8 汪騰;楊少軍;;一種高效的指令Cache的結(jié)構(gòu)[A];中國聲學(xué)學(xué)會2001年青年學(xué)術(shù)會議[CYCA'01]論文集[C];2001年

9 ;Research on WEB Cache Prediction Recommend Mechanism Based on Usage Pattern[A];中國電子學(xué)會第十五屆信息論學(xué)術(shù)年會暨第一屆全國網(wǎng)絡(luò)編碼學(xué)術(shù)年會論文集(上冊)[C];2008年

10 周旋;馮玉才;李碧波;孫小薇;;多服務(wù)器DBMS的Cache管理[A];數(shù)據(jù)庫研究與進(jìn)展95——第十三屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1995年

相關(guān)重要報(bào)紙文章 前10條

1 上海 李超;什么是Cache[N];電腦報(bào);2001年

2 劉昌勇;小緩存里的大學(xué)問[N];中國電腦教育報(bào);2004年

3 北京共創(chuàng)開源軟件股份有限公司 董孝峰;共創(chuàng)NC的設(shè)計(jì)與實(shí)現(xiàn)[N];中國計(jì)算機(jī)報(bào);2004年

4 超頻者;K7-650(0015)最新實(shí)超報(bào)告[N];大眾科技報(bào);2000年

5 ;阿萌小辭典[N];電腦報(bào);2004年

6 陳自文;CPU如何影響IA服務(wù)器的性能?[N];網(wǎng)絡(luò)世界;2000年

7 中國計(jì)算機(jī)報(bào)測試實(shí)驗(yàn)室 王炳晨;Duron抵京,Thunderbird爭宏[N];中國計(jì)算機(jī)報(bào);2000年

8 安徽省六安市 李紅;SOHO上網(wǎng)這樣省錢[N];中國計(jì)算機(jī)報(bào);2000年

9 巖公;電信網(wǎng)加速不難[N];中國計(jì)算機(jī)報(bào);2003年

10 徐春梅;國際品牌進(jìn)入中國:適應(yīng)是關(guān)鍵[N];中國經(jīng)營報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 劉松鶴;微處理器片上存儲系統(tǒng)性能優(yōu)化關(guān)鍵技術(shù)研究[D];長安大學(xué);2018年

2 李炳超;高性能GPU系統(tǒng)結(jié)構(gòu)的研究[D];天津大學(xué);2017年

3 鄭重;異構(gòu)眾核體系結(jié)構(gòu)Cache功耗和性能優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年

4 田新華;面向性能優(yōu)化的壓縮cache技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2007年

5 付雄;利用程序分析和優(yōu)化提高Cache性能[D];中國科學(xué)技術(shù)大學(xué);2007年

6 彭蔓蔓;體系結(jié)構(gòu)級低能耗Cache和動態(tài)電壓縮放技術(shù)研究[D];湖南大學(xué);2007年

7 賈小敏;多核處理器片上Cache訪問行為分析與優(yōu)化機(jī)制研究[D];國防科學(xué)技術(shù)大學(xué);2011年

8 項(xiàng)曉燕;體系結(jié)構(gòu)級Cache功耗優(yōu)化技術(shù)研究[D];浙江大學(xué);2013年

9 孫蓀;提高多核處理器片上Cache利用率的關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2015年

10 周宏偉;微處理器中Cache漏流功耗的體系結(jié)構(gòu)級優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 吳建宇;面向多線程應(yīng)用的多核Cache優(yōu)化研究[D];湖南大學(xué);2014年

2 王鵬;Cache替換算法中重引用區(qū)間預(yù)測策略的改進(jìn)[D];湖南大學(xué);2016年

3 李靜;基于Cache感知的自供能NVP系統(tǒng)備份方案的研究[D];山東大學(xué);2018年

4 邱鯉跳;3D堆疊DRAM Cache的建模以及功耗優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2016年

5 孫金周;面向安卓應(yīng)用的Cache設(shè)計(jì)空間探索[D];東南大學(xué);2016年

6 王利杰;基于視頻場景的帶寬感知Cache模型和劃分策略[D];華中科技大學(xué);2013年

7 劉清;嵌入式系統(tǒng)中低功耗可重構(gòu)Cache的研究與設(shè)計(jì)[D];湖南大學(xué);2012年

8 李冬妮;嵌入式系統(tǒng)中低功耗Cache的重構(gòu)技術(shù)研究[D];湖南大學(xué);2012年

9 李家文;虛擬機(jī)環(huán)境下動態(tài)Cache劃分技術(shù)研究與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2011年

10 楊巍;采用基樹的磁盤陣列Cache技術(shù)研究[D];華中科技大學(xué);2009年



本文編號:2808131

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2808131.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3988***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com