功率約束HPC系統(tǒng)OpenMP程序性能能耗協(xié)同優(yōu)化研究
發(fā)布時(shí)間:2021-01-28 20:57
隨著科學(xué)研究和生產(chǎn)生活對計(jì)算能力的需求不斷提高,高性能計(jì)算系統(tǒng)已向著E級百億億次計(jì)算方向迅速發(fā)展,但是能耗問題越來越成為限制高性能計(jì)算系統(tǒng)發(fā)展的重要阻礙,這對硬件系統(tǒng)的體系結(jié)構(gòu)設(shè)計(jì)和軟件系統(tǒng)的執(zhí)行效率提出了更高的要求。在未來的高性能計(jì)算系統(tǒng)中,功率約束將會成為一種常用的節(jié)能手段,不同的計(jì)算節(jié)點(diǎn)、計(jì)算任務(wù)將按照給定的功率上限運(yùn)行。作為并行計(jì)算常用的編程模型,OpenMP并行程序已廣泛地應(yīng)用在不同的計(jì)算場景,研究OpenMP程序在功率約束條件下的運(yùn)行情況有助于更好地促進(jìn)高性能計(jì)算系統(tǒng)的發(fā)展。本文提出一種基于功率約束系統(tǒng)對OpenMP并行程序進(jìn)行細(xì)粒度性能能耗協(xié)同優(yōu)化的策略,該策略通過對程序的并行域設(shè)置不同的CPU和DRAM功率上限達(dá)到功率約束的目的,同時(shí)對程序的性能能耗進(jìn)行機(jī)器學(xué)習(xí)建模,可以根據(jù)實(shí)際需要預(yù)測不同功率上限設(shè)置下程序執(zhí)行的性能和能耗;诖瞬呗员疚脑O(shè)計(jì)實(shí)現(xiàn)了一個(gè)自動代碼優(yōu)化系統(tǒng),可以根據(jù)不同的優(yōu)化目標(biāo)選擇出最優(yōu)的功率配置,對性能能耗進(jìn)行協(xié)同優(yōu)化,并在源碼級別對待優(yōu)化程序進(jìn)行修改。本文在實(shí)驗(yàn)平臺上執(zhí)行了十二組OpenMP基準(zhǔn)測試程序進(jìn)行訓(xùn)練和預(yù)測,對本文提出的策略的優(yōu)化效果進(jìn)行驗(yàn)...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
最優(yōu)配置生成算法優(yōu)化效果
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-34-表5-1基準(zhǔn)測試程序5.2模型預(yù)測結(jié)果5.2.1數(shù)據(jù)集劃分為了更好的訓(xùn)練效果,訓(xùn)練集和測試集內(nèi)部的數(shù)據(jù)分布應(yīng)盡量保持一致性,避免因數(shù)據(jù)劃分過程引入額外的偏差而對最終結(jié)果產(chǎn)生影響,這就需要從不同類別的并行域中進(jìn)行層次采樣。本文根據(jù)采集到的PAPI特征對數(shù)據(jù)集進(jìn)行層次聚類分析(HierarchicalClusterAnalysis),聚類結(jié)果如圖5-1所示。圖5-1并行域聚類結(jié)果及訓(xùn)練集劃分基準(zhǔn)測試程序描述選中的并行域個(gè)數(shù)NPB/BT求解3對角線方程組3NPB/CG求解大型稀疏對稱正定矩陣的最小特征值的近似值2NPB/EP計(jì)算Gauss偽隨機(jī)數(shù)1NPB/FT快速傅里葉變換3NPB/MG多柵格基準(zhǔn)測試2NPB/SP求解5對角線方程組3STREAM測量內(nèi)存帶寬實(shí)際性能4CoMD經(jīng)典分子動力學(xué)算法1LULESH爆炸流體力學(xué)3
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-36-圖5-2測試集使用RF和SVR訓(xùn)練能耗模型的平均絕對誤差MAPE圖5-3是測試集各個(gè)并行域分別使用RF和SVR訓(xùn)練的AjustedR2結(jié)果。從圖中可以看出,(1)整體上RF模型的AjustedR2值要大于SVR模型,只有FT_1的AjustedR2值RF小于SVR;(2)RF模型整體的AjustedR2值可以保持在0.60以上,其平均AjustedR2值為0.85,最大值0.96(FT_1),最小值為0.70(SP_3);SVR模型在LULESH_1上的預(yù)測效果較差,AjustedR2值為-42.12,其余的預(yù)測平均AjustedR2值為0.69,最大為0.97(FT_1),最小值為0.19(BT_2)。圖5-3測試集使用RF和SVR訓(xùn)練能耗模型的校正決定系數(shù)AdjustedR2
【參考文獻(xiàn)】:
期刊論文
[1]2018年中國高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫? 計(jì)算機(jī)科學(xué). 2019(01)
[2]全球高性能計(jì)算發(fā)展態(tài)勢分析[J]. 鄭曉歡,陳明奇,唐川,張娟,房俊民. 世界科技研究與發(fā)展. 2018(03)
[3]數(shù)據(jù)中心中DVFS對程序性能影響模型的設(shè)計(jì)[J]. 李登輝,趙家程,崔慧敏,馮曉兵. 軟件學(xué)報(bào). 2017(04)
[4]高性能計(jì)算的發(fā)展[J]. 臧大偉,曹政,孫凝暉. 科技導(dǎo)報(bào). 2016(14)
[5]并行計(jì)算技術(shù)綜述[J]. 王磊. 信息技術(shù). 2012(10)
[6]改進(jìn)的能量最優(yōu)OpenMP靜態(tài)調(diào)度算法[J]. 董勇,陳娟,楊學(xué)軍. 軟件學(xué)報(bào). 2011(09)
博士論文
[1]眾核系統(tǒng)動態(tài)能耗管理技術(shù)研究[D]. 賴志權(quán).國防科學(xué)技術(shù)大學(xué) 2015
[2]面向分布共享存儲體系結(jié)構(gòu)的高效能OpenMP關(guān)鍵技術(shù)研究[D]. 黃春.國防科學(xué)技術(shù)大學(xué) 2007
本文編號:3005680
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
最優(yōu)配置生成算法優(yōu)化效果
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-34-表5-1基準(zhǔn)測試程序5.2模型預(yù)測結(jié)果5.2.1數(shù)據(jù)集劃分為了更好的訓(xùn)練效果,訓(xùn)練集和測試集內(nèi)部的數(shù)據(jù)分布應(yīng)盡量保持一致性,避免因數(shù)據(jù)劃分過程引入額外的偏差而對最終結(jié)果產(chǎn)生影響,這就需要從不同類別的并行域中進(jìn)行層次采樣。本文根據(jù)采集到的PAPI特征對數(shù)據(jù)集進(jìn)行層次聚類分析(HierarchicalClusterAnalysis),聚類結(jié)果如圖5-1所示。圖5-1并行域聚類結(jié)果及訓(xùn)練集劃分基準(zhǔn)測試程序描述選中的并行域個(gè)數(shù)NPB/BT求解3對角線方程組3NPB/CG求解大型稀疏對稱正定矩陣的最小特征值的近似值2NPB/EP計(jì)算Gauss偽隨機(jī)數(shù)1NPB/FT快速傅里葉變換3NPB/MG多柵格基準(zhǔn)測試2NPB/SP求解5對角線方程組3STREAM測量內(nèi)存帶寬實(shí)際性能4CoMD經(jīng)典分子動力學(xué)算法1LULESH爆炸流體力學(xué)3
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-36-圖5-2測試集使用RF和SVR訓(xùn)練能耗模型的平均絕對誤差MAPE圖5-3是測試集各個(gè)并行域分別使用RF和SVR訓(xùn)練的AjustedR2結(jié)果。從圖中可以看出,(1)整體上RF模型的AjustedR2值要大于SVR模型,只有FT_1的AjustedR2值RF小于SVR;(2)RF模型整體的AjustedR2值可以保持在0.60以上,其平均AjustedR2值為0.85,最大值0.96(FT_1),最小值為0.70(SP_3);SVR模型在LULESH_1上的預(yù)測效果較差,AjustedR2值為-42.12,其余的預(yù)測平均AjustedR2值為0.69,最大為0.97(FT_1),最小值為0.19(BT_2)。圖5-3測試集使用RF和SVR訓(xùn)練能耗模型的校正決定系數(shù)AdjustedR2
【參考文獻(xiàn)】:
期刊論文
[1]2018年中國高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫? 計(jì)算機(jī)科學(xué). 2019(01)
[2]全球高性能計(jì)算發(fā)展態(tài)勢分析[J]. 鄭曉歡,陳明奇,唐川,張娟,房俊民. 世界科技研究與發(fā)展. 2018(03)
[3]數(shù)據(jù)中心中DVFS對程序性能影響模型的設(shè)計(jì)[J]. 李登輝,趙家程,崔慧敏,馮曉兵. 軟件學(xué)報(bào). 2017(04)
[4]高性能計(jì)算的發(fā)展[J]. 臧大偉,曹政,孫凝暉. 科技導(dǎo)報(bào). 2016(14)
[5]并行計(jì)算技術(shù)綜述[J]. 王磊. 信息技術(shù). 2012(10)
[6]改進(jìn)的能量最優(yōu)OpenMP靜態(tài)調(diào)度算法[J]. 董勇,陳娟,楊學(xué)軍. 軟件學(xué)報(bào). 2011(09)
博士論文
[1]眾核系統(tǒng)動態(tài)能耗管理技術(shù)研究[D]. 賴志權(quán).國防科學(xué)技術(shù)大學(xué) 2015
[2]面向分布共享存儲體系結(jié)構(gòu)的高效能OpenMP關(guān)鍵技術(shù)研究[D]. 黃春.國防科學(xué)技術(shù)大學(xué) 2007
本文編號:3005680
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3005680.html
最近更新
教材專著