天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

功率約束HPC系統(tǒng)OpenMP程序性能能耗協(xié)同優(yōu)化研究

發(fā)布時(shí)間:2021-01-28 20:57
  隨著科學(xué)研究和生產(chǎn)生活對計(jì)算能力的需求不斷提高,高性能計(jì)算系統(tǒng)已向著E級百億億次計(jì)算方向迅速發(fā)展,但是能耗問題越來越成為限制高性能計(jì)算系統(tǒng)發(fā)展的重要阻礙,這對硬件系統(tǒng)的體系結(jié)構(gòu)設(shè)計(jì)和軟件系統(tǒng)的執(zhí)行效率提出了更高的要求。在未來的高性能計(jì)算系統(tǒng)中,功率約束將會成為一種常用的節(jié)能手段,不同的計(jì)算節(jié)點(diǎn)、計(jì)算任務(wù)將按照給定的功率上限運(yùn)行。作為并行計(jì)算常用的編程模型,OpenMP并行程序已廣泛地應(yīng)用在不同的計(jì)算場景,研究OpenMP程序在功率約束條件下的運(yùn)行情況有助于更好地促進(jìn)高性能計(jì)算系統(tǒng)的發(fā)展。本文提出一種基于功率約束系統(tǒng)對OpenMP并行程序進(jìn)行細(xì)粒度性能能耗協(xié)同優(yōu)化的策略,該策略通過對程序的并行域設(shè)置不同的CPU和DRAM功率上限達(dá)到功率約束的目的,同時(shí)對程序的性能能耗進(jìn)行機(jī)器學(xué)習(xí)建模,可以根據(jù)實(shí)際需要預(yù)測不同功率上限設(shè)置下程序執(zhí)行的性能和能耗;诖瞬呗员疚脑O(shè)計(jì)實(shí)現(xiàn)了一個(gè)自動代碼優(yōu)化系統(tǒng),可以根據(jù)不同的優(yōu)化目標(biāo)選擇出最優(yōu)的功率配置,對性能能耗進(jìn)行協(xié)同優(yōu)化,并在源碼級別對待優(yōu)化程序進(jìn)行修改。本文在實(shí)驗(yàn)平臺上執(zhí)行了十二組OpenMP基準(zhǔn)測試程序進(jìn)行訓(xùn)練和預(yù)測,對本文提出的策略的優(yōu)化效果進(jìn)行驗(yàn)... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

功率約束HPC系統(tǒng)OpenMP程序性能能耗協(xié)同優(yōu)化研究


最優(yōu)配置生成算法優(yōu)化效果

數(shù)據(jù)分布,訓(xùn)練集,聚類


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-34-表5-1基準(zhǔn)測試程序5.2模型預(yù)測結(jié)果5.2.1數(shù)據(jù)集劃分為了更好的訓(xùn)練效果,訓(xùn)練集和測試集內(nèi)部的數(shù)據(jù)分布應(yīng)盡量保持一致性,避免因數(shù)據(jù)劃分過程引入額外的偏差而對最終結(jié)果產(chǎn)生影響,這就需要從不同類別的并行域中進(jìn)行層次采樣。本文根據(jù)采集到的PAPI特征對數(shù)據(jù)集進(jìn)行層次聚類分析(HierarchicalClusterAnalysis),聚類結(jié)果如圖5-1所示。圖5-1并行域聚類結(jié)果及訓(xùn)練集劃分基準(zhǔn)測試程序描述選中的并行域個(gè)數(shù)NPB/BT求解3對角線方程組3NPB/CG求解大型稀疏對稱正定矩陣的最小特征值的近似值2NPB/EP計(jì)算Gauss偽隨機(jī)數(shù)1NPB/FT快速傅里葉變換3NPB/MG多柵格基準(zhǔn)測試2NPB/SP求解5對角線方程組3STREAM測量內(nèi)存帶寬實(shí)際性能4CoMD經(jīng)典分子動力學(xué)算法1LULESH爆炸流體力學(xué)3

模型圖,測試集,能耗,絕對誤差


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-36-圖5-2測試集使用RF和SVR訓(xùn)練能耗模型的平均絕對誤差MAPE圖5-3是測試集各個(gè)并行域分別使用RF和SVR訓(xùn)練的AjustedR2結(jié)果。從圖中可以看出,(1)整體上RF模型的AjustedR2值要大于SVR模型,只有FT_1的AjustedR2值RF小于SVR;(2)RF模型整體的AjustedR2值可以保持在0.60以上,其平均AjustedR2值為0.85,最大值0.96(FT_1),最小值為0.70(SP_3);SVR模型在LULESH_1上的預(yù)測效果較差,AjustedR2值為-42.12,其余的預(yù)測平均AjustedR2值為0.69,最大為0.97(FT_1),最小值為0.19(BT_2)。圖5-3測試集使用RF和SVR訓(xùn)練能耗模型的校正決定系數(shù)AdjustedR2

【參考文獻(xiàn)】:
期刊論文
[1]2018年中國高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫?  計(jì)算機(jī)科學(xué). 2019(01)
[2]全球高性能計(jì)算發(fā)展態(tài)勢分析[J]. 鄭曉歡,陳明奇,唐川,張娟,房俊民.  世界科技研究與發(fā)展. 2018(03)
[3]數(shù)據(jù)中心中DVFS對程序性能影響模型的設(shè)計(jì)[J]. 李登輝,趙家程,崔慧敏,馮曉兵.  軟件學(xué)報(bào). 2017(04)
[4]高性能計(jì)算的發(fā)展[J]. 臧大偉,曹政,孫凝暉.  科技導(dǎo)報(bào). 2016(14)
[5]并行計(jì)算技術(shù)綜述[J]. 王磊.  信息技術(shù). 2012(10)
[6]改進(jìn)的能量最優(yōu)OpenMP靜態(tài)調(diào)度算法[J]. 董勇,陳娟,楊學(xué)軍.  軟件學(xué)報(bào). 2011(09)

博士論文
[1]眾核系統(tǒng)動態(tài)能耗管理技術(shù)研究[D]. 賴志權(quán).國防科學(xué)技術(shù)大學(xué) 2015
[2]面向分布共享存儲體系結(jié)構(gòu)的高效能OpenMP關(guān)鍵技術(shù)研究[D]. 黃春.國防科學(xué)技術(shù)大學(xué) 2007



本文編號:3005680

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3005680.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶de335***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
99久久免费中文字幕| 91熟女大屁股偷偷对白| 中文字幕日韩欧美一区| 日本妇女高清一区二区三区| 亚洲视频在线观看免费中文字幕| 中文字幕欧美精品人妻一区| 九九热精品视频免费在线播放| 欧美一区二区三区十区| 好吊日在线视频免费观看| 黄色激情视频中文字幕| 欧美一区二区三区性视频| 日韩成人h视频在线观看| 亚洲一区二区三区有码| 免费黄片视频美女一区| 亚洲国产另类久久精品| 中文字幕亚洲精品人妻| 麻豆看片麻豆免费视频| 中文字幕91在线观看| 色哟哟国产精品免费视频| 国产精品一区日韩欧美| 中文字幕人妻日本一区二区| 成年人黄片大全在线观看| 国产不卡免费高清视频| 国产精欧美一区二区三区久久| 久久精品亚洲精品国产欧美| 国产精品涩涩成人一区二区三区| 五月婷婷六月丁香亚洲| 国产又粗又猛又爽色噜噜| 91精品视频全国免费| 欧美日不卡无在线一区| 国产又大又硬又粗又黄| 狠色婷婷久久一区二区三区| 精品日韩中文字幕视频在线| 国产又粗又猛又大爽又黄同志| 国产老熟女乱子人伦视频| 国产欧美日本在线播放| 国产一区二区三区香蕉av| 欧美日不卡无在线一区| 国产精品福利一二三区| 国产女性精品一区二区三区| 99久久精品午夜一区二|