天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

大規(guī)模并行處理器上資源與性能優(yōu)化的調(diào)度方法研究

發(fā)布時(shí)間:2020-10-18 10:02
   大規(guī)模并行處理器在空間上堆疊大量橫向計(jì)算單元,通過提高并行度為許多計(jì)算帶來了性能加速。以圖形處理單元(Graphic Processing Unit, GPU)為硬件平臺(tái)的通用計(jì)算GPU (General-purpose GPU, GPGPU)是大規(guī)模并行處理器的典型實(shí)例,加之CUDA和OpenCL等軟件開發(fā)平臺(tái)的推出,而備受親睞。很多操作系統(tǒng)、圖形圖像處理軟件、科學(xué)計(jì)算軟件等都引入了GPGPU性能加速,且每年都有大量的關(guān)于GPGPU并行算法的學(xué)術(shù)成果被發(fā)表,不斷拓展著GPGPU的應(yīng)用范圍、提高算法的性能。然而,以GPGPU為代表的大規(guī)模并行處理器由于體系結(jié)構(gòu)和CPU之間的差異為其性能有效發(fā)揮帶來了巨大的挑戰(zhàn)。在軟件方面,需要充分考慮這些差異,優(yōu)化組合使用各種計(jì)算資源,才能充分發(fā)揮性能潛力;在硬件方面,需要不斷完善體系結(jié)構(gòu)設(shè)計(jì),改進(jìn)優(yōu)化調(diào)度機(jī)制與策略,才能保證計(jì)算資源充分利用,避免過度硬件開銷。而軟硬件調(diào)度系統(tǒng)是保證GPGPU資源和性能優(yōu)化的關(guān)鍵。分別從資源分配、執(zhí)行次序、并行度三個(gè)角度對(duì)現(xiàn)有調(diào)度系統(tǒng)的各層次調(diào)度機(jī)制和策略存在的問題進(jìn)行了剖析,提出相應(yīng)的調(diào)度優(yōu)化方法,其具體的內(nèi)容如下:(一)資源分配,是指GPGPU各種軟硬件資源的配給與管理機(jī)制,需要防止配給錯(cuò)誤和訪問沖突。針對(duì)GPGPU內(nèi)存資源分配機(jī)制進(jìn)行了研究:(1)GPGPU的多地址空間的內(nèi)存模型導(dǎo)致了數(shù)據(jù)管理的復(fù)雜化。提出了多地址空間封裝機(jī)制,將多地址副本整合成單一數(shù)據(jù)結(jié)構(gòu),在保持性能的同時(shí)簡化了資源利用。(2)GPGPU特有內(nèi)存和核函數(shù)之間的靜態(tài)關(guān)聯(lián)導(dǎo)致其在多線程程序中產(chǎn)生資源訪問沖突。以紋理內(nèi)存為例,提出內(nèi)存資源池調(diào)度管理機(jī)制,將靜態(tài)資源實(shí)現(xiàn)動(dòng)態(tài)化分配,提高了特有內(nèi)存利用率。(二)執(zhí)行次序優(yōu)化,是指根據(jù)依賴關(guān)系與資源需求優(yōu)化線程、線程塊(Cooperative thread array, CTA)、核函數(shù)等的時(shí)間分配和空間分布。針對(duì)線程和CTA的執(zhí)行次序優(yōu)化進(jìn)行了研究:(1)探究GPGPU單指令流多線程的協(xié)同調(diào)度的設(shè)計(jì)合理性,研究了虛擬化平臺(tái)的VCPU協(xié)同調(diào)度,并針對(duì)其時(shí)間片碎片化問題提出了縮小CPU作用范圍的細(xì)粒度協(xié)同調(diào)度優(yōu)化。該研究確認(rèn)了GPGPU協(xié)同調(diào)度的合理性和GPGPU細(xì)粒度協(xié)同調(diào)度優(yōu)化的性能優(yōu)勢(shì)。(2)負(fù)載均衡是GPGPU性能的關(guān)鍵,然而現(xiàn)有CTA調(diào)度策略由于數(shù)據(jù)局部性優(yōu)化而產(chǎn)生了CTA分配的不均衡。設(shè)計(jì)CTA負(fù)載均衡調(diào)度優(yōu)化策略CLASO,通過信用額度控制CTA分發(fā),提高了CTA負(fù)載均衡和性能,同時(shí)模塊化設(shè)計(jì)實(shí)現(xiàn)了對(duì)多種調(diào)度策略的兼容。(三)并行度優(yōu)化,是指通過匹配源代碼、核函數(shù)、線程等計(jì)算任務(wù)和硬件平臺(tái)之間的并行度以減少調(diào)度開銷,提高資源利用率并避免資源擁塞。針對(duì)源代碼并行粒度和運(yùn)行時(shí)線程級(jí)并行度的優(yōu)化策略進(jìn)行了研究:(1)現(xiàn)有GPGPU源代碼并行粒度調(diào)整算法不能支持足夠的語句類型。對(duì)此提出了多層次遞歸形式的源代碼模型,并設(shè)計(jì)了自動(dòng)化源代碼并行粒度調(diào)整算法,實(shí)現(xiàn)了對(duì)包含在多層次分支、循環(huán)語句中的同步語句的支持。(2)現(xiàn)有線程級(jí)調(diào)度中面向CTA的并行度優(yōu)化存在的調(diào)整粒度過粗和優(yōu)化條件不準(zhǔn)確等問題。提出了基于流水線停頓的Warp調(diào)度器上的細(xì)粒度動(dòng)態(tài)并行度優(yōu)化策略。對(duì)比CTA和Warp兩個(gè)調(diào)度層次的并行度優(yōu)化及其組合優(yōu)化效果,Warp調(diào)度的并行度優(yōu)化更具性能優(yōu)勢(shì)。
【學(xué)位單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2015
【中圖分類】:TP332
【部分圖文】:

內(nèi)部體系,結(jié)構(gòu)模型,執(zhí)行單元


圖2.2?SM內(nèi)部體系結(jié)構(gòu)模型??Kg.?2.2?The?archi化cture?model?inside?an?SM??SM指令執(zhí)行使用流水線技術(shù),如圖2.3所示,包括取指、譯碼、發(fā)射、取參、執(zhí)??行、寫回六個(gè)階段。取指和譯碼兩個(gè)階段主要負(fù)責(zé)從內(nèi)存中讀取指令和將指令翻譯成相??應(yīng)的控制信號(hào)。發(fā)射階段主要負(fù)責(zé)Warp調(diào)度。每個(gè)時(shí)鐘周期Warp調(diào)度器都根據(jù)各執(zhí)??行單元狀態(tài)和指令間依賴關(guān)系,嘗試從各warp的待發(fā)射指令中選擇一條指令,并送入??下一階段。取參階段根據(jù)指令中的寄存器下標(biāo)讀取各線程所需的輸入?yún)?shù)并維護(hù)寄存器??依賴關(guān)系計(jì)分板(Scor純oard)。執(zhí)行階段主要負(fù)責(zé)完成指令功能。這一階段包含了不??同種類的執(zhí)行單元,指令會(huì)根據(jù)類別分派到不同的執(zhí)行單元,F(xiàn)有GPGPU包含了H種??主要的執(zhí)行單元:計(jì)算核屯、包含ALU/FPU負(fù)責(zé)算術(shù)計(jì)算、SFU負(fù)責(zé)高階函數(shù)計(jì)算、LDST??連接緩存和內(nèi)存控制器負(fù)責(zé)訪存操作。各執(zhí)行單元內(nèi)通常也包含一套流水線邏輯。由于??硬件復(fù)雜度的差異,不同的執(zhí)行單元也具有不同的硬件并行度。通常來說,ALU/FPU??-16-??

模型圖,指令執(zhí)行,流水線,模型


 ̄??數(shù)觀愛存存II紋理緩存II龍緩存…??圖2.2?SM內(nèi)部體系結(jié)構(gòu)模型??Kg.?2.2?The?archi化cture?model?inside?an?SM??SM指令執(zhí)行使用流水線技術(shù),如圖2.3所示,包括取指、譯碼、發(fā)射、取參、執(zhí)??行、寫回六個(gè)階段。取指和譯碼兩個(gè)階段主要負(fù)責(zé)從內(nèi)存中讀取指令和將指令翻譯成相??應(yīng)的控制信號(hào)。發(fā)射階段主要負(fù)責(zé)Warp調(diào)度。每個(gè)時(shí)鐘周期Warp調(diào)度器都根據(jù)各執(zhí)??行單元狀態(tài)和指令間依賴關(guān)系,嘗試從各warp的待發(fā)射指令中選擇一條指令,并送入??下一階段。取參階段根據(jù)指令中的寄存器下標(biāo)讀取各線程所需的輸入?yún)?shù)并維護(hù)寄存器??依賴關(guān)系計(jì)分板(Scor純oard)。執(zhí)行階段主要負(fù)責(zé)完成指令功能。這一階段包含了不??同種類的執(zhí)行單元,指令會(huì)根據(jù)類別分派到不同的執(zhí)行單元,F(xiàn)有GPGPU包含了H種??主要的執(zhí)行單元:計(jì)算核屯、包含ALU/FPU負(fù)責(zé)算術(shù)計(jì)算、SFU負(fù)責(zé)高階函數(shù)計(jì)算、LDST??連接緩存和內(nèi)存控制器負(fù)責(zé)訪存操作。各執(zhí)行單元內(nèi)通常也包含一套流水線邏輯。由于??硬件復(fù)雜度的差異,不同的執(zhí)行單元也具有不同的硬件并行度。通常來說,ALU/FPU??-16-??

模型圖,核函數(shù),模型,線程


對(duì)應(yīng)的工具的角度,兩者都極為相似。本節(jié)就W?CUDA為例同時(shí)兼廠OpenCL介紹??GPGPU軟件編程模型。??分發(fā)給GPGPU的計(jì)算任務(wù)W函數(shù)形式定義,稱為核函數(shù)(Kernel),如圖2.4所示。??核函數(shù)代碼規(guī)定了單個(gè)線程的計(jì)算邏輯,并通過固有變量來獲得當(dāng)前線程下標(biāo)。線程數(shù)??量在核函數(shù)調(diào)用時(shí)通過配置參數(shù)指定。核函數(shù)的線程被姐織成H個(gè)層級(jí):網(wǎng)格(Grid)、??線程塊(Block或Cooperative?thread?array,?CTA)和線程(Thread)。網(wǎng)格代表整個(gè)核??函數(shù)的執(zhí)行實(shí)例,被劃分為若干CTA,而各CTA則由指定數(shù)量的線程構(gòu)成。根據(jù)核函??數(shù)的計(jì)算還輯,線程和CTA的下標(biāo)可選用一維、二維或H維形式(圖2.3采用了二維下??標(biāo))。由于運(yùn)行時(shí)WCTA為單位向各SM分發(fā)計(jì)算任務(wù)且SM之間獨(dú)立運(yùn)行,因此線??程間的同步操作只能在CTA內(nèi)進(jìn)行,而沒有提供CTA之間的同步操作接口。??計(jì)算網(wǎng)格?綾巧??CTA?'??核函數(shù)1?i??巧國..■曝?tO.O)?(1.0)?(m,0)??(0,0)?(1,0)?帶莉?^?^?^??[HQ?"■?H?\?【0.1)【1.1)??(0
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳勇,劉心松,蘇森;大規(guī)模并行處理互連結(jié)構(gòu)的分析[J];地質(zhì)科技管理;1994年06期

2 鄭世榮,李曉峰;大規(guī)模并行處理系統(tǒng)互連通信的新技術(shù)研究[J];計(jì)算機(jī)研究與發(fā)展;1996年06期

3 王文義,王若雨;世界級(jí)重大挑戰(zhàn)性課題與大規(guī)模并行處理系統(tǒng)[J];鄭州工業(yè)大學(xué)學(xué)報(bào);1997年04期

4 果蘋;;2012年大數(shù)據(jù)市場(chǎng)前瞻[J];通訊世界;2012年05期

5 李國杰;高速科學(xué)計(jì)算與大規(guī)模并行機(jī)[J];計(jì)算物理;1992年04期

6 王廣益;當(dāng)前超級(jí)計(jì)算機(jī)的發(fā)展態(tài)勢(shì)研究[J];現(xiàn)代計(jì)算機(jī);1999年02期

7 ;Universal DB是否滿足需求[J];每周電腦報(bào);1997年10期

8 劉心松;基于程控SP_2開關(guān)直通的計(jì)算機(jī)系統(tǒng)[J];計(jì)算機(jī)工程與設(shè)計(jì);1999年03期

9 桂文莊;;多尺度現(xiàn)象和大規(guī)模并行處理[J];科研信息化技術(shù)與應(yīng)用;2010年04期

10 ;大規(guī)模并行超級(jí)計(jì)算機(jī)的關(guān)鍵技術(shù)[J];水利電力機(jī)械;2000年04期


相關(guān)博士學(xué)位論文 前1條

1 于玉龍;大規(guī)模并行處理器上資源與性能優(yōu)化的調(diào)度方法研究[D];大連理工大學(xué);2015年


相關(guān)碩士學(xué)位論文 前1條

1 鄭雪梅;云平臺(tái)上基于OLAP的what-if分析技術(shù)研究[D];貴州大學(xué);2016年



本文編號(hào):2846153

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2846153.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶86f45***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日本少妇aa特黄大片| 色综合伊人天天综合网中文| 国产肥妇一区二区熟女精品| 精品国自产拍天天青青草原| 国产又猛又黄又粗又爽无遮挡 | 国产一区二区三区草莓av| 日本加勒比在线播放一区| 国产精品人妻熟女毛片av久久| 亚洲中文字幕在线观看四区| 亚洲av熟女一区二区三区蜜桃 | 色婷婷视频国产一区视频| 九九热视频网在线观看| 99精品国产自在现线观看| 免费性欧美重口味黄色| 久热这里只有精品九九| 日韩国产中文在线视频| 极品熟女一区二区三区| 久久99热成人网不卡| 男人把女人操得嗷嗷叫| 午夜福利激情性生活免费视频| 人妻巨大乳一二三区麻豆| 日韩一区二区三区久久| 日本一品道在线免费观看| 亚洲一区二区亚洲日本| 日本一二三区不卡免费| 在线观看日韩欧美综合黄片| 五月婷婷六月丁香狠狠| 欧美人与动牲交a精品| 日韩熟妇人妻一区二区三区| 国产精品午夜小视频观看| 欧美性高清一区二区三区视频 | 激情图日韩精品中文字幕| 亚洲中文字幕在线观看四区| 亚洲av专区在线观看| 好东西一起分享老鸭窝| 精品人妻一区二区三区在线看| 高清一区二区三区不卡免费| 99国产高清不卡视频| 亚洲色图欧美另类人妻| 日韩特级黄片免费在线观看| 国产又猛又黄又粗又爽无遮挡|