BATS:異構(gòu)系統(tǒng)環(huán)境下的任務(wù)調(diào)度節(jié)能方法
發(fā)布時間:2021-08-03 01:03
當(dāng)今計算機系統(tǒng)廣泛采用GPU(Graphics Processing Unit)來實現(xiàn)系統(tǒng)最大性能,但其能耗直接影響運行成本、可維護(hù)性,還會造成環(huán)境問題,這引起了研究人員、計算機架構(gòu)師和開發(fā)人員的廣泛關(guān)注.為解決能耗問題,提出一種BATS(Balanced Average Time Scheduling)調(diào)度方法,通過合理分配各個GPU上的任務(wù)來減少系統(tǒng)能耗.該方法首先獲取任務(wù)執(zhí)行時間、任務(wù)數(shù)量以及系統(tǒng)中可用的GPU數(shù)量;其次,利用上述信息以均分思想和折半方法對任務(wù)按執(zhí)行時間進(jìn)行分配;最后在典型平臺上驗證所提出的BATS方法 .實驗結(jié)果表明,與現(xiàn)有方法相比,BATS平均節(jié)省8. 6%的能量,證明BATS方法是有效的、合理的、可行的.
【文章來源】:南京大學(xué)學(xué)報(自然科學(xué)). 2020,56(02)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
任務(wù)量與執(zhí)行時間的關(guān)系
圖2展示了BATS方法在CaseA輸入規(guī)模情況下對單個GPU的內(nèi)存變化情況,共經(jīng)歷四次循環(huán)分配:第一次循環(huán)分配序號1~7的任務(wù);第二次循環(huán)分配序號8~11的任務(wù);第三次循環(huán)分配序號12~16的任務(wù);第四次循環(huán)分配序號17~18的任務(wù).總體上看,分配任務(wù)越多,內(nèi)存占用量越大.在序號1~7的任務(wù)分配中,內(nèi)存分配量有突然增加的趨勢,而后面的內(nèi)存分配量的增加相對平緩,原因在于BATS方法的分配以時間為主而非以內(nèi)存占用量為主.圖3至圖5展示了四個任務(wù)在不同的調(diào)度策略以及不同輸入情況下各個處理器平均執(zhí)行時間的比率.
圖3展示了對應(yīng)表3中CaseA輸入規(guī)模在任務(wù)數(shù)量為80個時各個處理器執(zhí)行時間的比率.可以看出,AA方法的處理器有34.50%執(zhí)行時間的差距,最大的執(zhí)行時間比率為46.38%,最小的執(zhí)行時間比率為11.88%.FF和PH方法中存在17.47%的時間差距,最大的執(zhí)行時間比率為35.92%,最小的執(zhí)行時間比率為18.45%.BATS方法中有0.02%的時間差距,最大的執(zhí)行時間比率為25.01%,最小的執(zhí)行時間比率為24.99%.由執(zhí)行時間的差別可以看出,BATS方法給四個GPU分配的任務(wù)是較均勻的,使得執(zhí)行整體任務(wù)所消耗的時間較少,從側(cè)面驗證了表3中BATS方法在CaseA輸入規(guī)模下功耗較小的原因.圖4展示了對應(yīng)于表3中CaseB輸入規(guī)模的各個處理器執(zhí)行時間的比率.可以看出,AA方法中的最大的執(zhí)行時間和最小的執(zhí)行時間相差31.68%,FF和PH方法中的最大的執(zhí)行時間和最小的執(zhí)行時間相差17.53%,而BATS方法中的最大比率和最小比率兩者只相差0.12%.由執(zhí)行時間的差別可以看出,BATS方法給四個GPU分配的任務(wù)是比較均勻的,使得執(zhí)行整體任務(wù)所消耗的時間較少,從側(cè)面驗證了表3中BATS方法在CaseB輸入規(guī)模下功耗較小的原因.
本文編號:3318623
【文章來源】:南京大學(xué)學(xué)報(自然科學(xué)). 2020,56(02)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
任務(wù)量與執(zhí)行時間的關(guān)系
圖2展示了BATS方法在CaseA輸入規(guī)模情況下對單個GPU的內(nèi)存變化情況,共經(jīng)歷四次循環(huán)分配:第一次循環(huán)分配序號1~7的任務(wù);第二次循環(huán)分配序號8~11的任務(wù);第三次循環(huán)分配序號12~16的任務(wù);第四次循環(huán)分配序號17~18的任務(wù).總體上看,分配任務(wù)越多,內(nèi)存占用量越大.在序號1~7的任務(wù)分配中,內(nèi)存分配量有突然增加的趨勢,而后面的內(nèi)存分配量的增加相對平緩,原因在于BATS方法的分配以時間為主而非以內(nèi)存占用量為主.圖3至圖5展示了四個任務(wù)在不同的調(diào)度策略以及不同輸入情況下各個處理器平均執(zhí)行時間的比率.
圖3展示了對應(yīng)表3中CaseA輸入規(guī)模在任務(wù)數(shù)量為80個時各個處理器執(zhí)行時間的比率.可以看出,AA方法的處理器有34.50%執(zhí)行時間的差距,最大的執(zhí)行時間比率為46.38%,最小的執(zhí)行時間比率為11.88%.FF和PH方法中存在17.47%的時間差距,最大的執(zhí)行時間比率為35.92%,最小的執(zhí)行時間比率為18.45%.BATS方法中有0.02%的時間差距,最大的執(zhí)行時間比率為25.01%,最小的執(zhí)行時間比率為24.99%.由執(zhí)行時間的差別可以看出,BATS方法給四個GPU分配的任務(wù)是較均勻的,使得執(zhí)行整體任務(wù)所消耗的時間較少,從側(cè)面驗證了表3中BATS方法在CaseA輸入規(guī)模下功耗較小的原因.圖4展示了對應(yīng)于表3中CaseB輸入規(guī)模的各個處理器執(zhí)行時間的比率.可以看出,AA方法中的最大的執(zhí)行時間和最小的執(zhí)行時間相差31.68%,FF和PH方法中的最大的執(zhí)行時間和最小的執(zhí)行時間相差17.53%,而BATS方法中的最大比率和最小比率兩者只相差0.12%.由執(zhí)行時間的差別可以看出,BATS方法給四個GPU分配的任務(wù)是比較均勻的,使得執(zhí)行整體任務(wù)所消耗的時間較少,從側(cè)面驗證了表3中BATS方法在CaseB輸入規(guī)模下功耗較小的原因.
本文編號:3318623
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3318623.html
最近更新
教材專著