CPU-GPU融合架構上共享Cache的動態(tài)劃分技術

發(fā)布時間：2017-04-28 05:13

本文關鍵詞：CPU-GPU融合架構上共享Cache的動態(tài)劃分技術，，由筆耕文化傳播整理發(fā)布。

【摘要】：近年來,為了降低片內(nèi)通信延遲和獲得更高的資源利用率,學術界和工業(yè)界提出了將CPU和GPU"結合”在同一塊芯片上的融合結構。這種CPU和GPU的融合架構大都采用多級緩存層次的結構,并共享末級高速緩存。由于上級高速緩存的局部性過濾作用,致使末級高速緩存的數(shù)據(jù)局部性較差。傳統(tǒng)的LRU緩存替換策略難以有效利用末級高速緩存空間,嚴重影響程序的性能提升。因此,對末級高速緩存進行更高效地管理和優(yōu)化,減少末級高速緩存的缺失率對于提高系統(tǒng)的整體性能有非常重要的意義。另外,CPU和GPU具有不同的體系結構,它們在末級高速緩存容量的敏感性上存在差異。GPU上有大量的執(zhí)行線程,GPU應用程序的訪存需求大,因此在LRU替換策略下,GPU程序占用大量的緩存空間,但是程序的性能并沒有隨著緩存容量的增加而明顯提高：在這種情況下,CPU應用程序很難分配到足夠的緩存,影響了系統(tǒng)的整體性能。上述兩個問題給CPU和GPU間共享的末級緩存管理帶來新的挑戰(zhàn)。本文分析了GPU應用程序訪存特征,借鑒CMP結構下緩存優(yōu)化策略,提出對CPU-GPU融合架構共享的末級高速緩存進行基于I-M CP動態(tài)劃分的方案,從而提高系統(tǒng)整體性能。本文的主要研究工作和成果包括以下兩點：1.分別從線程切換代價、并行核心、存儲帶寬、緩存讀取方式等方面分析了CPU和GPU架構的區(qū)別。在CPU和GPU上運行相應的基準測試程序,并從訪存次數(shù)、局部性、帶寬需求以及訪存缺失率等四個方面分析CPU和GPU的訪存特征的區(qū)別,提出了GPU應用程序緩存敏感性評價方法,并對GPU應用程序進行分類。2.結合末級高速緩存優(yōu)化策略以及CPU和GPU應用程序的特征,提出了基于CPU-GPU融合架構的共享末級高速緩存I-M CP動態(tài)劃分方法,對CPU-GPU融合系統(tǒng)的末級高速緩存進行基于I-M CP算法的動態(tài)劃分。本文通過詳細的實驗設計,對CPU和GPU的訪存特征和緩存劃分進行多個維度的測試。實驗結果表明,通過緩存劃分可以有效避免CPU和GPU程序間的干擾。經(jīng)過測試后發(fā)現(xiàn),緩存劃分方法使得程序整體性能得到了很大提升,說明本文提出的劃分方法是十分有效的。與傳統(tǒng)LRU策略相比,最優(yōu)靜態(tài)劃分和I-MCP動態(tài)劃分可以使系統(tǒng)整體性能分別提升11.62%和13.63%,而兩種劃分策略使得GPU程序的性能分別只下降了3.27%和0.87%。
【關鍵詞】：GPU緩存敏感性 融合架構 共享末級高速緩存 動態(tài)緩存劃分
【學位授予單位】：中國科學技術大學
【學位級別】：碩士
【學位授予年份】：2015
【分類號】：TP332
【目錄】：

摘要5-6
ABSTRACT6-12
第1章緒論12-22
1.1 研究背景13-19
1.1.1 處理器的體系結構13-15
1.1.2 CPU-GPU融合微處理器架構15-17
1.1.3 末級高速緩存介紹17-19
1.2 研究問題和研究意義19-20
1.3 論文主要工作20-21
1.4 論文組織結構21-22
第2章相關背景22-32
2.1 CPU-GPU融合架構22-26
2.1.1 AMD融合芯片發(fā)展史23
2.1.2 Intel融合芯片發(fā)展史23-24
2.1.3 Nvidia融合芯片發(fā)展史24-25
2.1.4 CPU-GPU融合架構面對的挑戰(zhàn)25-26
2.2 末級高速緩存的組織和管理26-29
2.2.1 末級高速緩存的組織26-27
2.2.2 末級高速緩存的管理27-28
2.2.3 末級高速緩存優(yōu)化技術28-29
2.3 末級高速緩存性能分析方法29-30
2.4 本章小結30-32
第3章 CPU和GPU訪存行為分析32-44
3.1 Gem5-GPU模擬器介紹32-34
3.2 CPU和GPU訪存行為分析34-41
3.2.1 模擬器參數(shù)34-35
3.2.2 基準測試程序35-36
3.2.3 訪存次數(shù)對比36
3.2.4 局部性的對比36-37
3.2.5 帶寬需求對比37-38
3.2.6 訪存缺失對性能的影響38-39
3.2.7 訪存差異原因分析39-41
3.3 GPU應用程序緩存敏感性分析41-43
3.4 本章小結43-44
第4章 CPU-GPU融合架構上共享Cache劃分44-58
4.1 末級高速緩存劃分的重要性44-47
4.1.1 高速緩存對通用GPU的重要性44-45
4.1.2 末級高速緩存劃分的重要性45-47
4.2 CPU-GPU融合架構上共享Cache的動態(tài)劃分方案47-55
4.2.1 棧距離剖析47-48
4.2.2 靜態(tài)劃分方案48-49
4.2.3 CPU-GPU融合架構上的動態(tài)緩存劃分49
4.2.4 動態(tài)緩存劃分結構支持49-50
4.2.5 監(jiān)控器MON50-52
4.2.6 動態(tài)緩存劃分算法52-53
4.2.7 動態(tài)緩存劃分的實現(xiàn)53-55
4.3 本章小結55-58
第5章動態(tài)緩存劃分實驗評估58-66
5.1 CPU-GPU融合處理器模型58-59
5.2 基準測試程序集介紹59-60
5.3 性能對比60-62
5.4 多CPU程序?qū)澐值挠绊?/span>62-63
5.5 緩存容量對劃分的影響63-64
5.6 本章小結64-66
第6章全文總結66-70
6.1 研究工作總結66-67
6.2 本文創(chuàng)新點67-68
6.3 未來工作展望68-70
參考文獻70-74
致謝74-76
在讀期間發(fā)表的學術論文與取得的研究成果76

【相似文獻】

中國期刊全文數(shù)據(jù)庫前10條

1 崔昌棟;鞠大鵬;李兆麟;;采用路選擇技術實現(xiàn)的低功耗高速緩存設計[J];清華大學學報(自然科學版);2007年01期

2 陳黎明;鄒雪城;雷擰銘;劉政林;;動態(tài)可重構高速緩存結構的研究與設計[J];微電子學;2007年06期

3 黃濤;王晶;管雪濤;鐘祺;王克義;;一種降低末級高速緩存污染的軟件控制插入策略[J];電子學報;2012年12期

4 孫丕恕,辛衛(wèi)華;高速緩存386系統(tǒng)的實現(xiàn)[J];小型微型計算機系統(tǒng);1989年09期

5 徐景村,何培斌;微機高速緩存系統(tǒng)組織與數(shù)據(jù)更新探討[J];山東師大學報(自然科學版);1998年01期

6 周全營;計算機存儲系統(tǒng)的高速緩存[J];鄭州紡織工學院學報;1999年S1期

7 吳英杰,王曉東;理想高速緩存模型及其高效算法研究[J];福州大學學報(自然科學版);2004年04期

8 胡澤林;張云泉;;高速緩存優(yōu)化的并行連接算法[J];計算機工程與設計;2009年20期

9 劉娟;共享外部超高速緩存的雙處理機塊的設計和實施[J];航空計算技術;1998年01期

10 ;iCache提速詳解[J];每周電腦報;2000年12期

中國重要會議論文全文數(shù)據(jù)庫前1條

1 高欣;劉衡竹;張波濤;;高速緩存優(yōu)化研究與設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集（A輯）[C];2011年

中國重要報紙全文數(shù)據(jù)庫前10條

1 飛思卡爾半導體公司汽車和標準產(chǎn)品部Johann Holzmann;利用高速緩存體系結構進行汽車引擎嵌入式控制[N];中國電子報;2005年

2 楊阿昭;ECDN 提高網(wǎng)絡性能[N];中國計算機報;2002年

3 宋占川;Oracle服務器性能調(diào)整攻略[N];計算機世界;2003年

4 高明云;高速緩存技術實現(xiàn)更快內(nèi)容傳輸[N];人民郵電;2003年

5 山楓;趨勢科技利用高速緩存方案企業(yè)防毒性能長5倍[N];中國計算機報;2002年

6 陳怡均 DigiTimes;IBM研發(fā)新DRAM電路[N];電子資訊時報;2007年

7 本報記者武漢;來跟著我的節(jié)拍[N];網(wǎng)絡世界;2003年

8 小溪綜合編譯;新一代視頻游戲機上演三國大戰(zhàn)[N];計算機世界;2006年

9 ;顯卡術語釋義[N];電腦報;2002年

10 山東財政學院楊曉紅;為電子商務站點加速[N];計算機世界;2000年

中國博士學位論文全文數(shù)據(jù)庫前2條

1 方磊;適用于多/眾核系統(tǒng)的智能目錄高速緩存[D];浙江大學;2014年

2 隋秀峰;高性能微處理器中自適應高速緩存管理策略研究[D];中國科學技術大學;2010年

中國碩士學位論文全文數(shù)據(jù)庫前10條

1 孫傳偉;CPU-GPU融合架構上共享Cache的動態(tài)劃分技術[D];中國科學技術大學;2015年

2 冷冰;基于路訪問軌跡和路休眠的高速緩存低功耗研究[D];浙江大學;2012年

3 吳英杰;充分利用高速緩存的高效算法研究[D];福州大學;2004年

4 梁靜;基于路預測訪問的低功耗高速緩存設計研究[D];浙江大學;2012年

5 趙彩;基于混合糾錯碼的可容錯性高速緩存研究[D];浙江大學;2015年

6 陳石坤;多核處理器中CACHE一致性協(xié)議研究和實現(xiàn)[D];國防科學技術大學;2005年

7 姜彩萍;互聯(lián)網(wǎng)高速緩存系統(tǒng)構建和性能分析[D];吉林大學;2004年

8 李瑞東;高速緩存參數(shù)無關DNA短序列精確比對算法[D];哈爾濱工業(yè)大學;2013年

9 陳燕暉;頁面分配器的研究與實現(xiàn)[D];國防科學技術大學;2006年

10 虞增輝;輕量級Web瀏覽器的協(xié)議、技術及其實現(xiàn)[D];浙江大學;2005年

本文關鍵詞：CPU-GPU融合架構上共享Cache的動態(tài)劃分技術，由筆耕文化傳播整理發(fā)布。

本文編號：332184

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/332184.html

上一篇：發(fā)布訂閱網(wǎng)絡中的緩存機制研究
下一篇：兼容POSIX接口的云存儲文件系統(tǒng)的設計與實現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

CPU-GPU融合架構上共享Cache的動態(tài)劃分技術