基于GPU-like和GPU-CPU架構(gòu)的異構(gòu)片上網(wǎng)絡(luò)的設(shè)計(jì)與研究
發(fā)布時(shí)間:2017-04-11 07:06
本文關(guān)鍵詞:基于GPU-like和GPU-CPU架構(gòu)的異構(gòu)片上網(wǎng)絡(luò)的設(shè)計(jì)與研究,由筆耕文化傳播整理發(fā)布。
【摘要】:進(jìn)入二十一世紀(jì)以來(lái),多核處理器的設(shè)計(jì)發(fā)展邁向了兩種不同的方向:一種是保持應(yīng)用總體按序執(zhí)行的CPU,另一種則是更適用于并行計(jì)算的GPU。GPU自誕生伊始便在浮點(diǎn)計(jì)算性能上超越了CPU,GPU并行執(zhí)行與CPU順序執(zhí)行性能之間巨大的鴻溝使得大量的程序開發(fā)人員將程序中計(jì)算密集型的部分交付給GPU進(jìn)行計(jì)算。計(jì)算機(jī)體系結(jié)構(gòu)已經(jīng)從傳統(tǒng)的多核CPU-like時(shí)代跨越到多核GPU-like和GPU-CPU異構(gòu)時(shí)代。而當(dāng)前設(shè)計(jì)的處理器芯片大都通過(guò)片上網(wǎng)絡(luò)來(lái)訪問(wèn)共享資源,因此片上網(wǎng)絡(luò)的配置對(duì)其性能和功耗有著重要影響。近期提出的異構(gòu)片上網(wǎng)絡(luò)不僅其性能進(jìn)一步接近于傳統(tǒng)的有緩沖區(qū)片上網(wǎng)絡(luò),而且其面積開銷和功耗也明顯下降。然而,面向GPU-like架構(gòu)和GPU-CPU異構(gòu)體系結(jié)構(gòu)的異構(gòu)片上網(wǎng)絡(luò)設(shè)計(jì)目前尚未深入研究。GPU-like架構(gòu)和GPU-CPU架構(gòu)芯片為片上網(wǎng)絡(luò)的設(shè)計(jì)提出了新的挑戰(zhàn)。其一,Dennard定律的終結(jié)引發(fā)了處理器多核時(shí)代的暗硅問(wèn)題,芯片的功耗限制使芯片上的晶體管點(diǎn)亮的數(shù)目達(dá)到了極限,導(dǎo)致處理器核心僅能在較短的時(shí)間里全部激活,大部分時(shí)間內(nèi),一些處理器核心區(qū)域無(wú)法激活,處于黑暗狀態(tài)。而片上網(wǎng)絡(luò)功耗在芯片整體功耗中比重很高,這驅(qū)使我們盡量降低片上網(wǎng)絡(luò)的功耗,為核心保留更多的功耗預(yù)算。其二,與CPU相比,GPU線程數(shù)量更多,并行度高,這種特性使得GPU與末級(jí)高速緩沖存儲(chǔ)器和存儲(chǔ)控制器間的指令與數(shù)據(jù)交換更加頻繁;贑PU多核處理器的片上網(wǎng)絡(luò)上的交通比較平均,而基于整合了GPU和CPU異構(gòu)芯片的片上網(wǎng)絡(luò)上的交通熱點(diǎn)相對(duì)更集中,GPU迥異于CPU的特性改變了片上網(wǎng)絡(luò)中的交通特征。如何使異構(gòu)片上網(wǎng)絡(luò)得以適應(yīng)新型的GPU-like和GPU-CPU架構(gòu)是當(dāng)前亟待解決的問(wèn)題。為此,本文首先針對(duì)芯片的暗硅問(wèn)題,基于GPU-like芯片按照GPGPU負(fù)載對(duì)暗硅的適應(yīng)程度將其分為暗硅敏感型、暗硅遲鈍型和暗硅適應(yīng)型三類。通過(guò)分析不同放置方式的異構(gòu)片上網(wǎng)絡(luò)對(duì)負(fù)載性能和片上網(wǎng)絡(luò)功耗的影響,來(lái)探究異構(gòu)片上網(wǎng)絡(luò)對(duì)GPU-like芯片暗硅程度的影響。實(shí)驗(yàn)結(jié)果顯示,相比于傳統(tǒng)的有緩沖區(qū)片上網(wǎng)絡(luò),異構(gòu)片上網(wǎng)絡(luò)可以有效降低GPU-like芯片的暗硅程度,使芯片至少可以在額定功耗預(yù)算下多激活一個(gè)處理器核心。對(duì)于暗硅敏感型負(fù)載,在額定功耗預(yù)算下,使用異構(gòu)片上網(wǎng)絡(luò)至少提升了10%的性能,為額定功耗預(yù)算下片上網(wǎng)絡(luò)類型的選擇提供了參考。其次,基于GPU-CPU架構(gòu)芯片,通過(guò)調(diào)整有緩沖區(qū)和無(wú)緩沖區(qū)路由器的放置方式,對(duì)多種基于"熱土豆"路由的靜態(tài)異構(gòu)片上網(wǎng)絡(luò)的性能和功耗進(jìn)行了評(píng)估,實(shí)驗(yàn)結(jié)果對(duì)于進(jìn)一步探索片上互聯(lián)的設(shè)計(jì)空間是大有裨益的。最后,本文提出一種面向異構(gòu)片上網(wǎng)絡(luò)的基于信用的單向流控機(jī)制(UFC)來(lái)控制網(wǎng)絡(luò)擁塞,從而保證有緩沖區(qū)路由器始終有空閑的緩沖區(qū)保存來(lái)自于相鄰無(wú)緩沖區(qū)路由器的分片。實(shí)驗(yàn)結(jié)果顯示,相比于"熱土豆"路由,UFC可以將異構(gòu)片上網(wǎng)絡(luò)的性能平均提升14.1%,而網(wǎng)絡(luò)的功耗平均提升僅有5.3%。
【關(guān)鍵詞】:GPU 片上網(wǎng)絡(luò) 異構(gòu)性 拓?fù)浣Y(jié)構(gòu) 流量控制
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP332
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-18
- 1.1 課題背景和研究意義10-13
- 1.1.1 選題背景10-11
- 1.1.2 研究意義11
- 1.1.3 研究?jī)?nèi)容11-13
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀13-17
- 1.2.1 無(wú)緩沖區(qū)片上網(wǎng)絡(luò)13-16
- 1.2.2 異構(gòu)片上網(wǎng)絡(luò)16
- 1.2.3 片上網(wǎng)絡(luò)流量控制機(jī)制16-17
- 1.3 論文的結(jié)構(gòu)安排17-18
- 第2章 多核處理器與片上網(wǎng)絡(luò)18-32
- 2.1 引言18
- 2.2 多核處理器18-21
- 2.2.1 多核處理器基礎(chǔ)18-20
- 2.2.2 多核處理器的應(yīng)用20-21
- 2.3 片上網(wǎng)絡(luò)21-31
- 2.3.1 片上網(wǎng)絡(luò)基礎(chǔ)21-22
- 2.3.2 片上網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)22-24
- 2.3.3 片上網(wǎng)絡(luò)交換機(jī)制24-25
- 2.3.4 片上網(wǎng)絡(luò)虛擬通道25-26
- 2.3.5 片上網(wǎng)絡(luò)路由算法26-31
- 2.4 本章小結(jié)31-32
- 第3章 從片上網(wǎng)絡(luò)異構(gòu)性的角度對(duì)暗硅程度緩解的探究32-42
- 3.1 引言32
- 3.2 動(dòng)機(jī)32-33
- 3.3 實(shí)驗(yàn)環(huán)境33-35
- 3.4 實(shí)驗(yàn)結(jié)果與分析35-40
- 3.4.1 片上網(wǎng)絡(luò)功耗分析35-37
- 3.4.2 程序性能分析37-39
- 3.4.3 固定功耗預(yù)算下片上網(wǎng)絡(luò)類型的選擇39-40
- 3.5 本章小結(jié)40-42
- 第4章 基于GPU-CPU架構(gòu)的異構(gòu)片上網(wǎng)絡(luò)及流量控制設(shè)計(jì)42-56
- 4.1 引言42
- 4.2 靜態(tài)異構(gòu)片上網(wǎng)絡(luò)設(shè)計(jì)42-45
- 4.2.1 無(wú)緩沖區(qū)路由器設(shè)計(jì)42-43
- 4.2.2 有緩沖區(qū)路由器設(shè)計(jì)43-44
- 4.2.3 有緩沖區(qū)路由器及無(wú)緩沖區(qū)路由器的放置方式44-45
- 4.3 單向流量控制機(jī)制45-47
- 4.3.1 面向異構(gòu)片上網(wǎng)絡(luò)的基于信用的流量控制機(jī)制45-46
- 4.3.2 單向流量控制機(jī)制描述46-47
- 4.3.3 死鎖與活鎖47
- 4.4 實(shí)驗(yàn)結(jié)果與分析47-55
- 4.4.1 實(shí)驗(yàn)環(huán)境47-48
- 4.4.2 基準(zhǔn)測(cè)試程序48-49
- 4.4.3 度量標(biāo)準(zhǔn)49-50
- 4.4.4 實(shí)驗(yàn)結(jié)果50-55
- 4.5 本章小結(jié)55-56
- 結(jié)論56-58
- 參考 文獻(xiàn)58-64
- 攻讀碩士學(xué)位期間所取得的成果64-66
- 致謝66
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 歐陽(yáng)一鳴;張一棟;梁華國(guó);黃正峰;常郝;;基于虛通道故障粒度劃分的3D NoC容錯(cuò)路由器設(shè)計(jì)[J];計(jì)算機(jī)研究與發(fā)展;2014年09期
本文關(guān)鍵詞:基于GPU-like和GPU-CPU架構(gòu)的異構(gòu)片上網(wǎng)絡(luò)的設(shè)計(jì)與研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):298556
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/298556.html
最近更新
教材專著