基于GPU/CPU混合架構(gòu)的流程序多粒度劃分與調(diào)度方法研究
發(fā)布時(shí)間:2024-02-25 05:44
數(shù)據(jù)流編程語言簡化了相關(guān)領(lǐng)域的編程,很好地把任務(wù)計(jì)算和數(shù)據(jù)通信分開,從而使應(yīng)用程序分別在任務(wù)級(jí)和數(shù)據(jù)級(jí)均具有可并行性。針對GPU/CPU混合架構(gòu)中存在的大量數(shù)據(jù)并行、任務(wù)并行和流水線并行等問題,提出并實(shí)現(xiàn)了面向GPU/CPU混合架構(gòu)的數(shù)據(jù)流程序任務(wù)劃分方法和多粒度調(diào)度策略,包括任務(wù)的分類處理、GPU端任務(wù)的水平分裂和CPU端離散任務(wù)的均衡化,構(gòu)造了軟件流水調(diào)度,經(jīng)過編譯優(yōu)化生成OpenCL的目標(biāo)代碼。任務(wù)的分類處理根據(jù)數(shù)據(jù)流程序各個(gè)任務(wù)的計(jì)算特點(diǎn)和任務(wù)間的通信量大小,將各任務(wù)分配到合適的計(jì)算平臺(tái)上;GPU端任務(wù)的水平分裂利用GPU端任務(wù)的并行性將其均衡分裂到各個(gè)GPU,以避免GPU間高額的通信開銷影響程序整體的執(zhí)行性能;CPU端離散任務(wù)的均衡化通過選擇合適CPU核,將CPU端各任務(wù)均衡分配給各CPU核,以保證負(fù)載均衡并提高各CPU核的利用率。實(shí)驗(yàn)以多塊NVIDIA Tesla C2050、多核CPU為混合架構(gòu)平臺(tái),選取多媒體領(lǐng)域典型的算法作為測試程序,實(shí)驗(yàn)結(jié)果表明了劃分方法和調(diào)度策略的有效性。
【文章頁數(shù)】:12 頁
本文編號(hào):3910167
【文章頁數(shù)】:12 頁
本文編號(hào):3910167
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3910167.html
最近更新
教材專著