CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù)
本文關鍵詞:CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù),,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,為了降低片內(nèi)通信延遲和獲得更高的資源利用率,學術(shù)界和工業(yè)界提出了將CPU和GPU"結(jié)合”在同一塊芯片上的融合結(jié)構(gòu)。這種CPU和GPU的融合架構(gòu)大都采用多級緩存層次的結(jié)構(gòu),并共享末級高速緩存。由于上級高速緩存的局部性過濾作用,致使末級高速緩存的數(shù)據(jù)局部性較差。傳統(tǒng)的LRU緩存替換策略難以有效利用末級高速緩存空間,嚴重影響程序的性能提升。因此,對末級高速緩存進行更高效地管理和優(yōu)化,減少末級高速緩存的缺失率對于提高系統(tǒng)的整體性能有非常重要的意義。另外,CPU和GPU具有不同的體系結(jié)構(gòu),它們在末級高速緩存容量的敏感性上存在差異。GPU上有大量的執(zhí)行線程,GPU應用程序的訪存需求大,因此在LRU替換策略下,GPU程序占用大量的緩存空間,但是程序的性能并沒有隨著緩存容量的增加而明顯提高:在這種情況下,CPU應用程序很難分配到足夠的緩存,影響了系統(tǒng)的整體性能。上述兩個問題給CPU和GPU間共享的末級緩存管理帶來新的挑戰(zhàn)。本文分析了GPU應用程序訪存特征,借鑒CMP結(jié)構(gòu)下緩存優(yōu)化策略,提出對CPU-GPU融合架構(gòu)共享的末級高速緩存進行基于I-M CP動態(tài)劃分的方案,從而提高系統(tǒng)整體性能。本文的主要研究工作和成果包括以下兩點:1.分別從線程切換代價、并行核心、存儲帶寬、緩存讀取方式等方面分析了CPU和GPU架構(gòu)的區(qū)別。在CPU和GPU上運行相應的基準測試程序,并從訪存次數(shù)、局部性、帶寬需求以及訪存缺失率等四個方面分析CPU和GPU的訪存特征的區(qū)別,提出了GPU應用程序緩存敏感性評價方法,并對GPU應用程序進行分類。2.結(jié)合末級高速緩存優(yōu)化策略以及CPU和GPU應用程序的特征,提出了基于CPU-GPU融合架構(gòu)的共享末級高速緩存I-M CP動態(tài)劃分方法,對CPU-GPU融合系統(tǒng)的末級高速緩存進行基于I-M CP算法的動態(tài)劃分。本文通過詳細的實驗設計,對CPU和GPU的訪存特征和緩存劃分進行多個維度的測試。實驗結(jié)果表明,通過緩存劃分可以有效避免CPU和GPU程序間的干擾。經(jīng)過測試后發(fā)現(xiàn),緩存劃分方法使得程序整體性能得到了很大提升,說明本文提出的劃分方法是十分有效的。與傳統(tǒng)LRU策略相比,最優(yōu)靜態(tài)劃分和I-MCP動態(tài)劃分可以使系統(tǒng)整體性能分別提升11.62%和13.63%,而兩種劃分策略使得GPU程序的性能分別只下降了3.27%和0.87%。
【關鍵詞】:GPU緩存敏感性 融合架構(gòu) 共享末級高速緩存 動態(tài)緩存劃分
【學位授予單位】:中國科學技術(shù)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP332
【目錄】:
- 摘要5-6
- ABSTRACT6-12
- 第1章 緒論12-22
- 1.1 研究背景13-19
- 1.1.1 處理器的體系結(jié)構(gòu)13-15
- 1.1.2 CPU-GPU融合微處理器架構(gòu)15-17
- 1.1.3 末級高速緩存介紹17-19
- 1.2 研究問題和研究意義19-20
- 1.3 論文主要工作20-21
- 1.4 論文組織結(jié)構(gòu)21-22
- 第2章 相關背景22-32
- 2.1 CPU-GPU融合架構(gòu)22-26
- 2.1.1 AMD融合芯片發(fā)展史23
- 2.1.2 Intel融合芯片發(fā)展史23-24
- 2.1.3 Nvidia融合芯片發(fā)展史24-25
- 2.1.4 CPU-GPU融合架構(gòu)面對的挑戰(zhàn)25-26
- 2.2 末級高速緩存的組織和管理26-29
- 2.2.1 末級高速緩存的組織26-27
- 2.2.2 末級高速緩存的管理27-28
- 2.2.3 末級高速緩存優(yōu)化技術(shù)28-29
- 2.3 末級高速緩存性能分析方法29-30
- 2.4 本章小結(jié)30-32
- 第3章 CPU和GPU訪存行為分析32-44
- 3.1 Gem5-GPU模擬器介紹32-34
- 3.2 CPU和GPU訪存行為分析34-41
- 3.2.1 模擬器參數(shù)34-35
- 3.2.2 基準測試程序35-36
- 3.2.3 訪存次數(shù)對比36
- 3.2.4 局部性的對比36-37
- 3.2.5 帶寬需求對比37-38
- 3.2.6 訪存缺失對性能的影響38-39
- 3.2.7 訪存差異原因分析39-41
- 3.3 GPU應用程序緩存敏感性分析41-43
- 3.4 本章小結(jié)43-44
- 第4章 CPU-GPU融合架構(gòu)上共享Cache劃分44-58
- 4.1 末級高速緩存劃分的重要性44-47
- 4.1.1 高速緩存對通用GPU的重要性44-45
- 4.1.2 末級高速緩存劃分的重要性45-47
- 4.2 CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分方案47-55
- 4.2.1 棧距離剖析47-48
- 4.2.2 靜態(tài)劃分方案48-49
- 4.2.3 CPU-GPU融合架構(gòu)上的動態(tài)緩存劃分49
- 4.2.4 動態(tài)緩存劃分結(jié)構(gòu)支持49-50
- 4.2.5 監(jiān)控器MON50-52
- 4.2.6 動態(tài)緩存劃分算法52-53
- 4.2.7 動態(tài)緩存劃分的實現(xiàn)53-55
- 4.3 本章小結(jié)55-58
- 第5章 動態(tài)緩存劃分實驗評估58-66
- 5.1 CPU-GPU融合處理器模型58-59
- 5.2 基準測試程序集介紹59-60
- 5.3 性能對比60-62
- 5.4 多CPU程序?qū)澐值挠绊?/span>62-63
- 5.5 緩存容量對劃分的影響63-64
- 5.6 本章小結(jié)64-66
- 第6章 全文總結(jié)66-70
- 6.1 研究工作總結(jié)66-67
- 6.2 本文創(chuàng)新點67-68
- 6.3 未來工作展望68-70
- 參考文獻70-74
- 致謝74-76
- 在讀期間發(fā)表的學術(shù)論文與取得的研究成果76
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 崔昌棟;鞠大鵬;李兆麟;;采用路選擇技術(shù)實現(xiàn)的低功耗高速緩存設計[J];清華大學學報(自然科學版);2007年01期
2 陳黎明;鄒雪城;雷擰銘;劉政林;;動態(tài)可重構(gòu)高速緩存結(jié)構(gòu)的研究與設計[J];微電子學;2007年06期
3 黃濤;王晶;管雪濤;鐘祺;王克義;;一種降低末級高速緩存污染的軟件控制插入策略[J];電子學報;2012年12期
4 孫丕恕,辛衛(wèi)華;高速緩存386系統(tǒng)的實現(xiàn)[J];小型微型計算機系統(tǒng);1989年09期
5 徐景村,何培斌;微機高速緩存系統(tǒng)組織與數(shù)據(jù)更新探討[J];山東師大學報(自然科學版);1998年01期
6 周全營;計算機存儲系統(tǒng)的高速緩存[J];鄭州紡織工學院學報;1999年S1期
7 吳英杰,王曉東;理想高速緩存模型及其高效算法研究[J];福州大學學報(自然科學版);2004年04期
8 胡澤林;張云泉;;高速緩存優(yōu)化的并行連接算法[J];計算機工程與設計;2009年20期
9 劉娟;共享外部超高速緩存的雙處理機塊的設計和實施[J];航空計算技術(shù);1998年01期
10 ;iCache提速詳解[J];每周電腦報;2000年12期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 高欣;劉衡竹;張波濤;;高速緩存優(yōu)化研究與設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 飛思卡爾半導體公司汽車和標準產(chǎn)品部Johann Holzmann;利用高速緩存體系結(jié)構(gòu)進行汽車引擎嵌入式控制[N];中國電子報;2005年
2 楊阿昭;ECDN 提高網(wǎng)絡性能[N];中國計算機報;2002年
3 宋占川;Oracle服務器性能調(diào)整攻略[N];計算機世界;2003年
4 高明云;高速緩存技術(shù)實現(xiàn)更快內(nèi)容傳輸[N];人民郵電;2003年
5 山楓;趨勢科技利用高速緩存方案 企業(yè)防毒性能長5倍[N];中國計算機報;2002年
6 陳怡均 DigiTimes;IBM研發(fā)新DRAM電路[N];電子資訊時報;2007年
7 本報記者 武漢;來跟著我的節(jié)拍[N];網(wǎng)絡世界;2003年
8 小溪綜合編譯;新一代視頻游戲機上演三國大戰(zhàn)[N];計算機世界;2006年
9 ;顯卡術(shù)語釋義[N];電腦報;2002年
10 山東財政學院 楊曉紅;為電子商務站點加速[N];計算機世界;2000年
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 方磊;適用于多/眾核系統(tǒng)的智能目錄高速緩存[D];浙江大學;2014年
2 隋秀峰;高性能微處理器中自適應高速緩存管理策略研究[D];中國科學技術(shù)大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 孫傳偉;CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù)[D];中國科學技術(shù)大學;2015年
2 冷冰;基于路訪問軌跡和路休眠的高速緩存低功耗研究[D];浙江大學;2012年
3 吳英杰;充分利用高速緩存的高效算法研究[D];福州大學;2004年
4 梁靜;基于路預測訪問的低功耗高速緩存設計研究[D];浙江大學;2012年
5 趙彩;基于混合糾錯碼的可容錯性高速緩存研究[D];浙江大學;2015年
6 陳石坤;多核處理器中CACHE一致性協(xié)議研究和實現(xiàn)[D];國防科學技術(shù)大學;2005年
7 姜彩萍;互聯(lián)網(wǎng)高速緩存系統(tǒng)構(gòu)建和性能分析[D];吉林大學;2004年
8 李瑞東;高速緩存參數(shù)無關DNA短序列精確比對算法[D];哈爾濱工業(yè)大學;2013年
9 陳燕暉;頁面分配器的研究與實現(xiàn)[D];國防科學技術(shù)大學;2006年
10 虞增輝;輕量級Web瀏覽器的協(xié)議、技術(shù)及其實現(xiàn)[D];浙江大學;2005年
本文關鍵詞:CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù),由筆耕文化傳播整理發(fā)布。
本文編號:332184
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/332184.html