大規(guī)模并行處理器上資源與性能優(yōu)化的調(diào)度方法研究
【學(xué)位單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2015
【中圖分類】:TP332
【部分圖文】:
圖2.2?SM內(nèi)部體系結(jié)構(gòu)模型??Kg.?2.2?The?archi化cture?model?inside?an?SM??SM指令執(zhí)行使用流水線技術(shù),如圖2.3所示,包括取指、譯碼、發(fā)射、取參、執(zhí)??行、寫回六個(gè)階段。取指和譯碼兩個(gè)階段主要負(fù)責(zé)從內(nèi)存中讀取指令和將指令翻譯成相??應(yīng)的控制信號(hào)。發(fā)射階段主要負(fù)責(zé)Warp調(diào)度。每個(gè)時(shí)鐘周期Warp調(diào)度器都根據(jù)各執(zhí)??行單元狀態(tài)和指令間依賴關(guān)系,嘗試從各warp的待發(fā)射指令中選擇一條指令,并送入??下一階段。取參階段根據(jù)指令中的寄存器下標(biāo)讀取各線程所需的輸入?yún)?shù)并維護(hù)寄存器??依賴關(guān)系計(jì)分板(Scor純oard)。執(zhí)行階段主要負(fù)責(zé)完成指令功能。這一階段包含了不??同種類的執(zhí)行單元,指令會(huì)根據(jù)類別分派到不同的執(zhí)行單元,F(xiàn)有GPGPU包含了H種??主要的執(zhí)行單元:計(jì)算核屯、包含ALU/FPU負(fù)責(zé)算術(shù)計(jì)算、SFU負(fù)責(zé)高階函數(shù)計(jì)算、LDST??連接緩存和內(nèi)存控制器負(fù)責(zé)訪存操作。各執(zhí)行單元內(nèi)通常也包含一套流水線邏輯。由于??硬件復(fù)雜度的差異,不同的執(zhí)行單元也具有不同的硬件并行度。通常來說,ALU/FPU??-16-??
 ̄??數(shù)觀愛存存II紋理緩存II龍緩存…??圖2.2?SM內(nèi)部體系結(jié)構(gòu)模型??Kg.?2.2?The?archi化cture?model?inside?an?SM??SM指令執(zhí)行使用流水線技術(shù),如圖2.3所示,包括取指、譯碼、發(fā)射、取參、執(zhí)??行、寫回六個(gè)階段。取指和譯碼兩個(gè)階段主要負(fù)責(zé)從內(nèi)存中讀取指令和將指令翻譯成相??應(yīng)的控制信號(hào)。發(fā)射階段主要負(fù)責(zé)Warp調(diào)度。每個(gè)時(shí)鐘周期Warp調(diào)度器都根據(jù)各執(zhí)??行單元狀態(tài)和指令間依賴關(guān)系,嘗試從各warp的待發(fā)射指令中選擇一條指令,并送入??下一階段。取參階段根據(jù)指令中的寄存器下標(biāo)讀取各線程所需的輸入?yún)?shù)并維護(hù)寄存器??依賴關(guān)系計(jì)分板(Scor純oard)。執(zhí)行階段主要負(fù)責(zé)完成指令功能。這一階段包含了不??同種類的執(zhí)行單元,指令會(huì)根據(jù)類別分派到不同的執(zhí)行單元,F(xiàn)有GPGPU包含了H種??主要的執(zhí)行單元:計(jì)算核屯、包含ALU/FPU負(fù)責(zé)算術(shù)計(jì)算、SFU負(fù)責(zé)高階函數(shù)計(jì)算、LDST??連接緩存和內(nèi)存控制器負(fù)責(zé)訪存操作。各執(zhí)行單元內(nèi)通常也包含一套流水線邏輯。由于??硬件復(fù)雜度的差異,不同的執(zhí)行單元也具有不同的硬件并行度。通常來說,ALU/FPU??-16-??
對(duì)應(yīng)的工具的角度,兩者都極為相似。本節(jié)就W?CUDA為例同時(shí)兼廠OpenCL介紹??GPGPU軟件編程模型。??分發(fā)給GPGPU的計(jì)算任務(wù)W函數(shù)形式定義,稱為核函數(shù)(Kernel),如圖2.4所示。??核函數(shù)代碼規(guī)定了單個(gè)線程的計(jì)算邏輯,并通過固有變量來獲得當(dāng)前線程下標(biāo)。線程數(shù)??量在核函數(shù)調(diào)用時(shí)通過配置參數(shù)指定。核函數(shù)的線程被姐織成H個(gè)層級(jí):網(wǎng)格(Grid)、??線程塊(Block或Cooperative?thread?array,?CTA)和線程(Thread)。網(wǎng)格代表整個(gè)核??函數(shù)的執(zhí)行實(shí)例,被劃分為若干CTA,而各CTA則由指定數(shù)量的線程構(gòu)成。根據(jù)核函??數(shù)的計(jì)算還輯,線程和CTA的下標(biāo)可選用一維、二維或H維形式(圖2.3采用了二維下??標(biāo))。由于運(yùn)行時(shí)WCTA為單位向各SM分發(fā)計(jì)算任務(wù)且SM之間獨(dú)立運(yùn)行,因此線??程間的同步操作只能在CTA內(nèi)進(jìn)行,而沒有提供CTA之間的同步操作接口。??計(jì)算網(wǎng)格?綾巧??CTA?'??核函數(shù)1?i??巧國..■曝?tO.O)?(1.0)?(m,0)??(0,0)?(1,0)?帶莉?^?^?^??[HQ?"■?H?\?【0.1)【1.1)??(0
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳勇,劉心松,蘇森;大規(guī)模并行處理互連結(jié)構(gòu)的分析[J];地質(zhì)科技管理;1994年06期
2 鄭世榮,李曉峰;大規(guī)模并行處理系統(tǒng)互連通信的新技術(shù)研究[J];計(jì)算機(jī)研究與發(fā)展;1996年06期
3 王文義,王若雨;世界級(jí)重大挑戰(zhàn)性課題與大規(guī)模并行處理系統(tǒng)[J];鄭州工業(yè)大學(xué)學(xué)報(bào);1997年04期
4 果蘋;;2012年大數(shù)據(jù)市場(chǎng)前瞻[J];通訊世界;2012年05期
5 李國杰;高速科學(xué)計(jì)算與大規(guī)模并行機(jī)[J];計(jì)算物理;1992年04期
6 王廣益;當(dāng)前超級(jí)計(jì)算機(jī)的發(fā)展態(tài)勢(shì)研究[J];現(xiàn)代計(jì)算機(jī);1999年02期
7 ;Universal DB是否滿足需求[J];每周電腦報(bào);1997年10期
8 劉心松;基于程控SP_2開關(guān)直通的計(jì)算機(jī)系統(tǒng)[J];計(jì)算機(jī)工程與設(shè)計(jì);1999年03期
9 桂文莊;;多尺度現(xiàn)象和大規(guī)模并行處理[J];科研信息化技術(shù)與應(yīng)用;2010年04期
10 ;大規(guī)模并行超級(jí)計(jì)算機(jī)的關(guān)鍵技術(shù)[J];水利電力機(jī)械;2000年04期
相關(guān)博士學(xué)位論文 前1條
1 于玉龍;大規(guī)模并行處理器上資源與性能優(yōu)化的調(diào)度方法研究[D];大連理工大學(xué);2015年
相關(guān)碩士學(xué)位論文 前1條
1 鄭雪梅;云平臺(tái)上基于OLAP的what-if分析技術(shù)研究[D];貴州大學(xué);2016年
本文編號(hào):2846153
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2846153.html