天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù)

發(fā)布時間:2017-04-28 05:13

  本文關鍵詞:CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù),,由筆耕文化傳播整理發(fā)布。


【摘要】:近年來,為了降低片內(nèi)通信延遲和獲得更高的資源利用率,學術(shù)界和工業(yè)界提出了將CPU和GPU"結(jié)合”在同一塊芯片上的融合結(jié)構(gòu)。這種CPU和GPU的融合架構(gòu)大都采用多級緩存層次的結(jié)構(gòu),并共享末級高速緩存。由于上級高速緩存的局部性過濾作用,致使末級高速緩存的數(shù)據(jù)局部性較差。傳統(tǒng)的LRU緩存替換策略難以有效利用末級高速緩存空間,嚴重影響程序的性能提升。因此,對末級高速緩存進行更高效地管理和優(yōu)化,減少末級高速緩存的缺失率對于提高系統(tǒng)的整體性能有非常重要的意義。另外,CPU和GPU具有不同的體系結(jié)構(gòu),它們在末級高速緩存容量的敏感性上存在差異。GPU上有大量的執(zhí)行線程,GPU應用程序的訪存需求大,因此在LRU替換策略下,GPU程序占用大量的緩存空間,但是程序的性能并沒有隨著緩存容量的增加而明顯提高:在這種情況下,CPU應用程序很難分配到足夠的緩存,影響了系統(tǒng)的整體性能。上述兩個問題給CPU和GPU間共享的末級緩存管理帶來新的挑戰(zhàn)。本文分析了GPU應用程序訪存特征,借鑒CMP結(jié)構(gòu)下緩存優(yōu)化策略,提出對CPU-GPU融合架構(gòu)共享的末級高速緩存進行基于I-M CP動態(tài)劃分的方案,從而提高系統(tǒng)整體性能。本文的主要研究工作和成果包括以下兩點:1.分別從線程切換代價、并行核心、存儲帶寬、緩存讀取方式等方面分析了CPU和GPU架構(gòu)的區(qū)別。在CPU和GPU上運行相應的基準測試程序,并從訪存次數(shù)、局部性、帶寬需求以及訪存缺失率等四個方面分析CPU和GPU的訪存特征的區(qū)別,提出了GPU應用程序緩存敏感性評價方法,并對GPU應用程序進行分類。2.結(jié)合末級高速緩存優(yōu)化策略以及CPU和GPU應用程序的特征,提出了基于CPU-GPU融合架構(gòu)的共享末級高速緩存I-M CP動態(tài)劃分方法,對CPU-GPU融合系統(tǒng)的末級高速緩存進行基于I-M CP算法的動態(tài)劃分。本文通過詳細的實驗設計,對CPU和GPU的訪存特征和緩存劃分進行多個維度的測試。實驗結(jié)果表明,通過緩存劃分可以有效避免CPU和GPU程序間的干擾。經(jīng)過測試后發(fā)現(xiàn),緩存劃分方法使得程序整體性能得到了很大提升,說明本文提出的劃分方法是十分有效的。與傳統(tǒng)LRU策略相比,最優(yōu)靜態(tài)劃分和I-MCP動態(tài)劃分可以使系統(tǒng)整體性能分別提升11.62%和13.63%,而兩種劃分策略使得GPU程序的性能分別只下降了3.27%和0.87%。
【關鍵詞】:GPU緩存敏感性 融合架構(gòu) 共享末級高速緩存 動態(tài)緩存劃分
【學位授予單位】:中國科學技術(shù)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP332
【目錄】:
  • 摘要5-6
  • ABSTRACT6-12
  • 第1章 緒論12-22
  • 1.1 研究背景13-19
  • 1.1.1 處理器的體系結(jié)構(gòu)13-15
  • 1.1.2 CPU-GPU融合微處理器架構(gòu)15-17
  • 1.1.3 末級高速緩存介紹17-19
  • 1.2 研究問題和研究意義19-20
  • 1.3 論文主要工作20-21
  • 1.4 論文組織結(jié)構(gòu)21-22
  • 第2章 相關背景22-32
  • 2.1 CPU-GPU融合架構(gòu)22-26
  • 2.1.1 AMD融合芯片發(fā)展史23
  • 2.1.2 Intel融合芯片發(fā)展史23-24
  • 2.1.3 Nvidia融合芯片發(fā)展史24-25
  • 2.1.4 CPU-GPU融合架構(gòu)面對的挑戰(zhàn)25-26
  • 2.2 末級高速緩存的組織和管理26-29
  • 2.2.1 末級高速緩存的組織26-27
  • 2.2.2 末級高速緩存的管理27-28
  • 2.2.3 末級高速緩存優(yōu)化技術(shù)28-29
  • 2.3 末級高速緩存性能分析方法29-30
  • 2.4 本章小結(jié)30-32
  • 第3章 CPU和GPU訪存行為分析32-44
  • 3.1 Gem5-GPU模擬器介紹32-34
  • 3.2 CPU和GPU訪存行為分析34-41
  • 3.2.1 模擬器參數(shù)34-35
  • 3.2.2 基準測試程序35-36
  • 3.2.3 訪存次數(shù)對比36
  • 3.2.4 局部性的對比36-37
  • 3.2.5 帶寬需求對比37-38
  • 3.2.6 訪存缺失對性能的影響38-39
  • 3.2.7 訪存差異原因分析39-41
  • 3.3 GPU應用程序緩存敏感性分析41-43
  • 3.4 本章小結(jié)43-44
  • 第4章 CPU-GPU融合架構(gòu)上共享Cache劃分44-58
  • 4.1 末級高速緩存劃分的重要性44-47
  • 4.1.1 高速緩存對通用GPU的重要性44-45
  • 4.1.2 末級高速緩存劃分的重要性45-47
  • 4.2 CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分方案47-55
  • 4.2.1 棧距離剖析47-48
  • 4.2.2 靜態(tài)劃分方案48-49
  • 4.2.3 CPU-GPU融合架構(gòu)上的動態(tài)緩存劃分49
  • 4.2.4 動態(tài)緩存劃分結(jié)構(gòu)支持49-50
  • 4.2.5 監(jiān)控器MON50-52
  • 4.2.6 動態(tài)緩存劃分算法52-53
  • 4.2.7 動態(tài)緩存劃分的實現(xiàn)53-55
  • 4.3 本章小結(jié)55-58
  • 第5章 動態(tài)緩存劃分實驗評估58-66
  • 5.1 CPU-GPU融合處理器模型58-59
  • 5.2 基準測試程序集介紹59-60
  • 5.3 性能對比60-62
  • 5.4 多CPU程序?qū)澐值挠绊?/span>62-63
  • 5.5 緩存容量對劃分的影響63-64
  • 5.6 本章小結(jié)64-66
  • 第6章 全文總結(jié)66-70
  • 6.1 研究工作總結(jié)66-67
  • 6.2 本文創(chuàng)新點67-68
  • 6.3 未來工作展望68-70
  • 參考文獻70-74
  • 致謝74-76
  • 在讀期間發(fā)表的學術(shù)論文與取得的研究成果76

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 崔昌棟;鞠大鵬;李兆麟;;采用路選擇技術(shù)實現(xiàn)的低功耗高速緩存設計[J];清華大學學報(自然科學版);2007年01期

2 陳黎明;鄒雪城;雷擰銘;劉政林;;動態(tài)可重構(gòu)高速緩存結(jié)構(gòu)的研究與設計[J];微電子學;2007年06期

3 黃濤;王晶;管雪濤;鐘祺;王克義;;一種降低末級高速緩存污染的軟件控制插入策略[J];電子學報;2012年12期

4 孫丕恕,辛衛(wèi)華;高速緩存386系統(tǒng)的實現(xiàn)[J];小型微型計算機系統(tǒng);1989年09期

5 徐景村,何培斌;微機高速緩存系統(tǒng)組織與數(shù)據(jù)更新探討[J];山東師大學報(自然科學版);1998年01期

6 周全營;計算機存儲系統(tǒng)的高速緩存[J];鄭州紡織工學院學報;1999年S1期

7 吳英杰,王曉東;理想高速緩存模型及其高效算法研究[J];福州大學學報(自然科學版);2004年04期

8 胡澤林;張云泉;;高速緩存優(yōu)化的并行連接算法[J];計算機工程與設計;2009年20期

9 劉娟;共享外部超高速緩存的雙處理機塊的設計和實施[J];航空計算技術(shù);1998年01期

10 ;iCache提速詳解[J];每周電腦報;2000年12期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 高欣;劉衡竹;張波濤;;高速緩存優(yōu)化研究與設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 飛思卡爾半導體公司汽車和標準產(chǎn)品部Johann Holzmann;利用高速緩存體系結(jié)構(gòu)進行汽車引擎嵌入式控制[N];中國電子報;2005年

2 楊阿昭;ECDN 提高網(wǎng)絡性能[N];中國計算機報;2002年

3 宋占川;Oracle服務器性能調(diào)整攻略[N];計算機世界;2003年

4 高明云;高速緩存技術(shù)實現(xiàn)更快內(nèi)容傳輸[N];人民郵電;2003年

5 山楓;趨勢科技利用高速緩存方案 企業(yè)防毒性能長5倍[N];中國計算機報;2002年

6 陳怡均 DigiTimes;IBM研發(fā)新DRAM電路[N];電子資訊時報;2007年

7 本報記者 武漢;來跟著我的節(jié)拍[N];網(wǎng)絡世界;2003年

8 小溪綜合編譯;新一代視頻游戲機上演三國大戰(zhàn)[N];計算機世界;2006年

9 ;顯卡術(shù)語釋義[N];電腦報;2002年

10 山東財政學院 楊曉紅;為電子商務站點加速[N];計算機世界;2000年

中國博士學位論文全文數(shù)據(jù)庫 前2條

1 方磊;適用于多/眾核系統(tǒng)的智能目錄高速緩存[D];浙江大學;2014年

2 隋秀峰;高性能微處理器中自適應高速緩存管理策略研究[D];中國科學技術(shù)大學;2010年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 孫傳偉;CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù)[D];中國科學技術(shù)大學;2015年

2 冷冰;基于路訪問軌跡和路休眠的高速緩存低功耗研究[D];浙江大學;2012年

3 吳英杰;充分利用高速緩存的高效算法研究[D];福州大學;2004年

4 梁靜;基于路預測訪問的低功耗高速緩存設計研究[D];浙江大學;2012年

5 趙彩;基于混合糾錯碼的可容錯性高速緩存研究[D];浙江大學;2015年

6 陳石坤;多核處理器中CACHE一致性協(xié)議研究和實現(xiàn)[D];國防科學技術(shù)大學;2005年

7 姜彩萍;互聯(lián)網(wǎng)高速緩存系統(tǒng)構(gòu)建和性能分析[D];吉林大學;2004年

8 李瑞東;高速緩存參數(shù)無關DNA短序列精確比對算法[D];哈爾濱工業(yè)大學;2013年

9 陳燕暉;頁面分配器的研究與實現(xiàn)[D];國防科學技術(shù)大學;2006年

10 虞增輝;輕量級Web瀏覽器的協(xié)議、技術(shù)及其實現(xiàn)[D];浙江大學;2005年


  本文關鍵詞:CPU-GPU融合架構(gòu)上共享Cache的動態(tài)劃分技術(shù),由筆耕文化傳播整理發(fā)布。



本文編號:332184

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/332184.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶662c5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产精品免费精品一区二区| 日韩精品毛片视频免费看| 又大又紧又硬又湿又爽又猛| 午夜资源在线观看免费高清| 国产亚洲欧美日韩国亚语| 国产av精品高清一区二区三区| 精品国模一区二区三区欧美| 激情少妇一区二区三区| 人妻久久这里只有精品| 91国自产精品中文字幕亚洲| 国产一区二区三中文字幕| 人妻少妇av中文字幕乱码高清| 九九热精品视频在线观看| 精品女同在线一区二区| 91爽人人爽人人插人人爽| 中文字幕中文字幕一区二区| 亚洲av又爽又色又色| 国产老女人性生活视频| 欧美成人一区二区三区在线| 丰满人妻少妇精品一区二区三区| 黄色在线免费高清观看| 精品国产成人av一区二区三区| 国产美女网红精品演绎| 欧美在线观看视频免费不卡| 亚洲男人的天堂久久a| 国产精品一区日韩欧美| 欧美日韩少妇精品专区性色| 欧美91精品国产自产| 日韩一级毛一欧美一级乱| 亚洲少妇一区二区三区懂色| 国产自拍欧美日韩在线观看| 99香蕉精品视频国产版| 午夜精品一区免费视频| 亚洲中文字幕在线综合视频| 国产女同精品一区二区| 亚洲视频一区二区久久久| 亚洲av日韩一区二区三区四区| 亚洲淫片一区二区三区| 国产又粗又深又猛又爽又黄| 日韩性生活视频免费在线观看| 免费大片黄在线观看日本|