基于節(jié)點預(yù)測的直接Cache一致性協(xié)議
本文關(guān)鍵詞: 單芯片多處理器(CMP) 預(yù)測 一致性協(xié)議 目錄 可擴(kuò)展 出處:《計算機(jī)學(xué)報》2014年03期 論文類型:期刊論文
【摘要】:處理器性能的提升依賴于對存儲系統(tǒng)性能的挖掘.隨著片上集成內(nèi)核數(shù)量的不斷增大和特征尺寸的持續(xù)縮小,延遲、存儲可擴(kuò)展的Cache一致性協(xié)議已經(jīng)成為提升訪存效率的關(guān)鍵性因素.文中提出一種基于節(jié)點預(yù)測的直接Cache一致性協(xié)議-NPP協(xié)議,研究一致性交互延遲隱藏和目錄存儲開銷減少技術(shù).針對讀、寫缺失中存在的間接性問題和現(xiàn)有解決方案破壞已有數(shù)據(jù)局部性、無法獲得最近數(shù)據(jù)副本等問題,分別提出節(jié)點掛起技術(shù)和直接寫缺失處理技術(shù),有效隱藏了目錄訪問延遲.為了實現(xiàn)準(zhǔn)確的節(jié)點預(yù)測,作者還提出基于"簽名"回收的歷史信息更新算法,避免了冗余更新和不完整更新.使用SPLASH-2測試程序集,在基于2D MESH NoC互聯(lián)的64核CMP下,相對于全映射目錄協(xié)議,NPP協(xié)議的平均執(zhí)行時間降幅為21.78%~31.11%;平均讀缺失延遲降低14.22%~18.9%;平均寫缺失延遲降低17.89%~21.13%.而獲得上述性能提升的代價是網(wǎng)絡(luò)流量平均增加6.62%~7.28%.
[Abstract]:The improvement of processor performance depends on the mining of storage system performance. With the increasing number of on-chip integrated cores and the continuous reduction of feature size, delay. The storage extensible Cache conformance protocol has become the key factor to improve the memory access efficiency. In this paper, a direct Cache conformance protocol-NPP protocol based on node prediction is proposed. Aiming at the indirect problem in reading and writing missing and the existing solutions which destroy the existing data locality and can not get the most recent data copy etc research on consistent interactive latency hiding and directory storage cost reduction. In order to realize accurate node prediction, the author also proposes an update algorithm of historical information based on "signature" recycling. Avoid redundant updates and incomplete updates. Using SPLASH-2 test assemblies, under 64-core CMP based on 2D MESH NoC interconnection, relative to the full-mapping directory protocol. The average execution time of NPP was 21.78% and 31.11% respectively. The average delayed reading loss decreased 14.2222% and 18.9%; The average write loss delay decreases 17.89% and 21.13%. The cost of achieving the above performance gains is an average increase in network traffic of 6.62% and 7.28%.
【作者單位】: 中國航空工業(yè)集團(tuán)公司西安航空計算技術(shù)研究所;西安交通大學(xué)電子與信息工程學(xué)院;
【基金】:國家“核高基”科技重大專項(2009ZX01039-003-001-03,2009ZX01023-004) 國家自然科學(xué)基金(60905007)資助~~
【分類號】:TP332
【正文快照】: 1引言良好的可擴(kuò)展性和對芯片面積的高效利用促使CMP處理器(Chip Multi-Processor)被廣泛使用.然而,芯片上連線的電氣特性不可能與半導(dǎo)體工藝等比例縮放,線延遲問題已經(jīng)成為未來CMP設(shè)計的重要限制因素[1-2].研究者提出延遲非一致的Cache訪問(Non-Uniform Cache Access,NUCA)[3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 黃安文;張民選;;多核處理器Cache一致性協(xié)議關(guān)鍵技術(shù)研究[J];計算機(jī)工程與科學(xué);2009年S1期
2 胡偉武,施巍松,唐志敏;基于新型Cache一致性協(xié)議的共享虛擬存儲系統(tǒng)[J];計算機(jī)學(xué)報;1999年05期
3 王鈺;;多機(jī)可縮放性高速緩沖存儲器一致性協(xié)議分析[J];計算機(jī)技術(shù)與發(fā)展;2009年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 謝青峰;淺析高速緩沖存儲器Cache在PC系統(tǒng)中的應(yīng)用[J];福建電腦;2004年09期
2 章隆兵,陳意云,章鋒,陳國良;基于分布式共享存儲系統(tǒng)的并行文件子系統(tǒng)DPFS[J];計算機(jī)研究與發(fā)展;2002年03期
3 姚念民,舒繼武,鄭緯民;SAN中的分布式鎖機(jī)制[J];計算機(jī)研究與發(fā)展;2005年02期
4 劉廣忠;肖鈺;袁淑芳;;基于外部共享Cache的多處理機(jī)Cache一致性協(xié)議[J];河北工程技術(shù)高等?茖W(xué)校學(xué)報;2006年02期
5 吳從暉,徐青,朱彩英,池天河,何建邦,陳榮國;基于軟件DSMs網(wǎng)絡(luò)系統(tǒng)的機(jī)載SAR圖像并行處理的研究[J];計算機(jī)工程與應(yīng)用;2001年07期
6 章隆兵,章曉良;軟件DSM系統(tǒng)中的全局?jǐn)帱c技術(shù)[J];計算機(jī)工程與應(yīng)用;2002年07期
7 李靜梅;楊鵬飛;張健沛;門朝光;吳艷霞;;適用于多核環(huán)境的混合Cache一致性協(xié)議[J];計算機(jī)工程;2011年24期
8 周偉波,戴華東,楊學(xué)軍;線程一致性模型及其實現(xiàn)[J];計算機(jī)工程與科學(xué);2003年01期
9 章隆兵,張福新,吳少剛,陳意云;基于鎖集合的動態(tài)數(shù)據(jù)競爭檢測方法[J];計算機(jī)學(xué)報;2003年10期
10 林偉;葉笑春;宋風(fēng)龍;張浩;;眾核處理器中使用寫掩碼實現(xiàn)混合寫回/寫穿透策略[J];計算機(jī)學(xué)報;2008年11期
相關(guān)會議論文 前1條
1 喬立民;徐漢川;劉旭東;;利用Monitor解決J2EE Web應(yīng)用程序的并發(fā)問題[A];黑龍江省計算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年
相關(guān)博士學(xué)位論文 前7條
1 戴華東;并行分布操作系統(tǒng)共享存儲管理及其優(yōu)化技術(shù)的研究[D];國防科學(xué)技術(shù)大學(xué);2002年
2 吳少剛;機(jī)群系統(tǒng)OpenMP研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年
3 潘國騰;CC-NUMA系統(tǒng)存儲體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2007年
4 王慶;面向嵌入式多核系統(tǒng)的并行程序優(yōu)化技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
5 朱素霞;面向多核處理器確定性重演的內(nèi)存競爭記錄機(jī)制研究[D];哈爾濱工業(yè)大學(xué);2013年
6 馮超超;片上網(wǎng)絡(luò)無緩沖路由器關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2012年
7 李建華;片上多核處理器緩存子系統(tǒng)優(yōu)化的研究[D];中國科學(xué)技術(shù)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 田新宇;網(wǎng)絡(luò)存儲陣列中CACHE的設(shè)計[D];西南交通大學(xué);2011年
2 高曉東;基于多核平臺的高速網(wǎng)絡(luò)數(shù)據(jù)捕獲和并行處理研究與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
3 楊鵬飛;多核環(huán)境Cache一致性協(xié)議研究[D];哈爾濱工程大學(xué);2011年
4 陳丹丹;用軟件實現(xiàn)局域網(wǎng)中的內(nèi)存共享[D];南京航空航天大學(xué);2002年
5 劉旭民;一種避免偽共享的分布式共享存儲協(xié)議的設(shè)計與實現(xiàn)[D];暨南大學(xué);2003年
6 馮燦;WindowsNT系統(tǒng)下實時動態(tài)模擬環(huán)境[D];電子科技大學(xué);2006年
7 孫春玲;基于局域網(wǎng)的共享存儲研究[D];北京交通大學(xué);2008年
8 劉華;WindowsNT系統(tǒng)下多任務(wù)間進(jìn)程通訊的研究和模擬[D];電子科技大學(xué);2009年
9 何宇磊;虛擬膝關(guān)節(jié)鏡手術(shù)交互裝置設(shè)計及系統(tǒng)研發(fā)[D];廣東工業(yè)大學(xué);2012年
10 付波;基于dsp的兩級cache低功耗研究與實現(xiàn)[D];南昌大學(xué);2012年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 賁可榮,孫寧;計算機(jī)科學(xué)中的待解問題綜述[J];計算機(jī)工程與科學(xué);2005年10期
2 陳海建;胡麗芳;于樂;王焱;;BP神經(jīng)網(wǎng)絡(luò)在元器件貯存可靠性參數(shù)預(yù)測中的應(yīng)用[J];海軍航空工程學(xué)院學(xué)報;2008年02期
3 覃蓉芳,袁旭;預(yù)測模型在計算機(jī)中的存取[J];四川有色金屬;1995年02期
4 李俊瑩;;論“計算機(jī)未來學(xué)”[J];網(wǎng)絡(luò)與信息;2008年06期
5 王錚;張毅;;改進(jìn)的基于目錄的Cache一致性協(xié)議[J];計算機(jī)工程;2009年01期
6 袁愛東,董建萍;基于目錄的一致性協(xié)議淺析[J];計算機(jī)工程;2004年S1期
7 蔡曄;史崗;;基于鎖的Cache一致性協(xié)議的硬件優(yōu)化策略[J];高技術(shù)通訊;2009年09期
8 胡海波,陳增強(qiáng),袁著祉;并行廣義預(yù)測自校正控制器(GPC)[J];系統(tǒng)工程與電子技術(shù);1994年01期
9 莊曉彤,王勤,張克弼;一個基于預(yù)測和Client/Server互操作的網(wǎng)絡(luò)傳輸模型[J];計算機(jī)工程;2000年03期
10 胡_g;柴華;;Cache一致性機(jī)制及其相關(guān)研究[J];科技情報開發(fā)與經(jīng)濟(jì);2008年17期
相關(guān)會議論文 前10條
1 尹飛;吳磊;;基于功能覆蓋率驗證多核處理器中的Cache一致性協(xié)議[A];第十五屆計算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 湯克明;王創(chuàng)偉;陳];;P2P模擬器的比較研究[A];2008年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2008年
3 吳長俊;曾國蓀;劉濤;;異構(gòu)環(huán)境下一種實現(xiàn)負(fù)載均衡的MIMO反饋控制模型[A];2006年全國理論計算機(jī)科學(xué)學(xué)術(shù)年會論文集[C];2006年
4 莫倩蕓;鐘誠;;機(jī)群系統(tǒng)上并行計算時間序列的動態(tài)彎曲距離[A];2008年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2008年
5 談春燕;;計算機(jī)集群系統(tǒng)技術(shù)探討[A];第三屆全國現(xiàn)代設(shè)備管理及應(yīng)用技術(shù)研討會交流論文集[C];2004年
6 李蒙;王俊;趙敬;武鵬;;基于DSP/FPGA的大容量存儲設(shè)備[A];全國第十屆信號與信息處理、第四屆DSP應(yīng)用技術(shù)聯(lián)合學(xué)術(shù)會議論文集[C];2006年
7 李琦;高軍萍;;一種基于多機(jī)通信的存儲器擴(kuò)容方法研究[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(一)[C];2007年
8 朱連章;魏曉慧;;基于著色Petri網(wǎng)避免并發(fā)系統(tǒng)死鎖的方法[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2008年
9 劉萍;鐘誠;;機(jī)群系統(tǒng)上基于映射和抽樣劃分的并行聚類算法[A];2008年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2008年
10 陸向艷;鐘誠;;機(jī)群系統(tǒng)上長序列最大串聯(lián)重復(fù)識別并行算法[A];2010年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前10條
1 中國軟件評測中心媒體測試部;設(shè)計出眾 可擴(kuò)展性優(yōu)秀[N];中國計算機(jī)報;2009年
2 一冰;萬全R150填補聯(lián)想單路機(jī)架式服務(wù)器空白[N];電腦商報;2008年
3 Gina Geisel;SAS:新一代SCSI[N];網(wǎng)絡(luò)世界;2008年
4 ;戴爾用實惠價促HPC普及[N];中國計算機(jī)報;2006年
5 方正;以創(chuàng)新突破x64瓶頸[N];網(wǎng)絡(luò)世界;2006年
6 張承東;戴爾新型存儲設(shè)備可擴(kuò)展性提升三倍[N];網(wǎng)絡(luò)世界;2008年
7 ;海量存儲簡單化[N];網(wǎng)絡(luò)世界;2005年
8 郭平;CLARiiON詮釋新架構(gòu)[N];計算機(jī)世界;2006年
9 郭松柳 顧瑜 陳建黨 汪東升;可擴(kuò)展的片上多處理器模擬器及評測系統(tǒng)[N];計算機(jī)世界;2005年
10 北京捷華潤公司 郝常杰;對象存儲:塊和文件之外的存儲形式[N];中國計算機(jī)報;2006年
相關(guān)博士學(xué)位論文 前10條
1 王之元;并行計算可擴(kuò)展性分析與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2011年
2 潘國騰;CC-NUMA系統(tǒng)存儲體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2007年
3 龐征斌;基于SMP的CC-NUMA類大規(guī)模系統(tǒng)中Cache一致性協(xié)議研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2007年
4 陳軍;分布式存儲環(huán)境下并行計算可擴(kuò)展性的研究與應(yīng)用[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2000年
5 李功明;片上多處理器體系結(jié)構(gòu)中Cache一致性模型研究[D];中國科學(xué)技術(shù)大學(xué);2013年
6 曹家鑫;數(shù)據(jù)中心中的一種可擴(kuò)展和高效的可靠組數(shù)據(jù)傳輸方法[D];中國科學(xué)技術(shù)大學(xué);2013年
7 李懷陽;進(jìn)化存儲系統(tǒng)數(shù)據(jù)組織模式研究[D];華中科技大學(xué);2006年
8 劉群;基于可擴(kuò)展對象的海量存儲系統(tǒng)研究[D];華中科技大學(xué);2006年
9 羅益輝;海量對象存儲系統(tǒng)數(shù)據(jù)組織算法的研究[D];華中科技大學(xué);2006年
10 鐘海峰;層次p2p存儲系統(tǒng)關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 張毅;CC-NUMA多機(jī)系統(tǒng)Cache一致性研究[D];重慶大學(xué);2008年
2 賀爾華;可擴(kuò)展層次式Cache一致性目錄方法的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2004年
3 張騰;數(shù)據(jù)中心網(wǎng)絡(luò)可擴(kuò)展性和多路路由研究[D];清華大學(xué);2012年
4 張澤;多內(nèi)核cache一致性協(xié)議研究與實現(xiàn)[D];西安電子科技大學(xué);2013年
5 周川;眾核處理器中動態(tài)可重構(gòu)Cache一致性協(xié)議的研究與實現(xiàn)[D];上海交通大學(xué);2013年
6 鐘愷文;一種數(shù)字信號處理器內(nèi)核的設(shè)計與擴(kuò)展[D];上海交通大學(xué);2009年
7 孔令鑫;基于異構(gòu)Beowulf機(jī)群的并行計算模型的研究[D];曲阜師范大學(xué);2009年
8 汪焱雷;嵌入式環(huán)境下可擴(kuò)展性圖形用戶界面的研究與實現(xiàn)[D];華中科技大學(xué);2012年
9 崔磊;數(shù)據(jù)Cache存儲體的設(shè)計與驗證[D];國防科學(xué)技術(shù)大學(xué);2006年
10 代明;安全微處理器存儲控制單元的研究與設(shè)計[D];華北電力大學(xué)(北京);2008年
,本文編號:1453159
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1453159.html