天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

用于高性能計算程序經(jīng)驗性能建模的主動學(xué)習(xí)方法研究

發(fā)布時間:2021-09-27 19:53
  高性能計算(HPC,High Performance Computing)在天文地球物理、大氣海洋環(huán)境等眾多領(lǐng)域具有廣泛的應(yīng)用,而性能是高性能計算程序的關(guān)鍵。HPC程序通常包含一些可以調(diào)節(jié)的參數(shù),例如并行核數(shù)、算法選擇等,研究表明,經(jīng)過性能調(diào)優(yōu)的程序可以達(dá)到10甚至100倍的性能加速。然而HPC程序的參數(shù)和性能往往呈現(xiàn)出復(fù)雜的非線性函數(shù),因此性能調(diào)優(yōu)變得異常困難。經(jīng)驗性能建模(EPM,Empirical Performance Modeling)可以很好地擬合這種復(fù)雜的關(guān)系,實現(xiàn)高效的啟發(fā)式參數(shù)搜索。然而,經(jīng)驗性能建模需要大量的樣本作為訓(xùn)練數(shù)據(jù),再加上HPC程序通常占用大量的計算資源,并且運行時間較長,例如幾個小時甚至幾個月,這些因素導(dǎo)致了 EPM高昂的計算和時間開銷。為了減少建模開銷,已有工作提出了一種基于主動學(xué)習(xí)的建模方法PBUS(Performance Biased Uncertainty Sampling),它首先采樣出可能的高性能樣本,然后采用主動學(xué)習(xí)算法選擇其中不確定性最高的樣本,進而減少數(shù)據(jù)冗余。相對于隨機均勻采樣,PBUS在一定程度上減少了所需的樣本數(shù)據(jù),但是本文的實驗... 

【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校

【文章頁數(shù)】:74 頁

【學(xué)位級別】:碩士

【部分圖文】:

用于高性能計算程序經(jīng)驗性能建模的主動學(xué)習(xí)方法研究


圖2.2決策樹模型示意圖??決策樹具有眾多的優(yōu)點,比較關(guān)鍵的兩點包括:具有較好的可解釋性和對特??征友好

性能,主動學(xué)習(xí)


?第6章實驗驗證與分析???在字典結(jié)構(gòu)中。這樣,主動學(xué)習(xí)中的標(biāo)注步驟,即字典查詢操作來實現(xiàn),相比于??主動學(xué)習(xí)的迭代過程,這個操作的開銷可以忽略不計。另一方面,這也保證了不??同的實驗輪次中的數(shù)據(jù)集能夠保持一致,避免了由于數(shù)據(jù)集波動(盡管已經(jīng)通過??自適應(yīng)標(biāo)注方法降到了很。┮鸬挠绊。??圖6.2展示了?12個計算核的10000個配置參數(shù)的性能分布。可以看出,(1)它??們的性能分布大致分為兩類:單峰分布和多峰分布。其中,只有ADI、DGEMV3、??FDTD這3個計算核呈單峰分布,其余則是明顯的多峰分布,典型的例子包括??GEMVER、GESUMMV、TENSOR,其中TENSOR的兩個峰值甚至都沒有交集,??說明其某些參數(shù)對性能具有顯著的影響。(2)另外,從性能的浮動范圍來看,最??壞性能與最優(yōu)性能的差異非常顯著。以計算核BICG為例,其最短執(zhí)行時間為??0.3^而最長執(zhí)行時間達(dá)到了?性能相差整整十倍,并且高性能樣本只占很小??的比例,即大部分樣本的性能較差,恰好說明了盡量避免選擇差性能樣本的必要??性。(3)從性能分布的集中位置來看,有一半的程序集中在高性能區(qū)域,包括??ATAX、DGEMV3、FDTD、GEMVER、ADI,其余程序則要么集中在差性能區(qū)??域,例如MM、TENSOR等,要么不表現(xiàn)出明顯的趨勢。從以上分析可以看出,??不同程序的性能分布沒有規(guī)律可循,這給采樣方法帶來了巨大的挑戰(zhàn)。??kripke?hypre??1200?-I???—???500-??1000-??400?-??800-??er?5??§?600-?I?300'?|????I?I??U-?

誤差曲線,加速比,建模,策略


/?3S000-?/??J?30-?40000?■?30000'??〇?100?200?300?400?500?0?100?200?300?400?500?0?100?200?300?400?500?0?100?200?300?400?500??#samples?#samples?#samples?#samples??BRS?-f1-?MaxU?-i ̄?BestPerf?-f-?PBUS?PWU?BRS?-f-?MaxU?BestPerf?PBUS?PWU??圖6.5兩個并行應(yīng)用的RMSE?圖6.6兩個并行應(yīng)用的CC??隨樣本數(shù)量的變化?隨樣本數(shù)量的變化???21.8???20.0-??Kernels/Applications??圖6.7相比于PBUS,采用PWU采樣策略進行建模的時間開銷加速比(3.3為加速比的幾??何平均值)??間開銷的變化上來看,在為并行應(yīng)用程序建模時,PWU依然具有明顯的優(yōu)勢。??6.3.2不同目標(biāo)程序的建模結(jié)果??在對12個計算核程序的經(jīng)驗建模過程中,本文提出了?PWU采樣策略在其??中11個計算核(除了?ADI)上的表現(xiàn)都是最好,無論它們的性能分布多么復(fù)雜,??例如單峰或者多峰分布。它們的RMSE誤差曲線的趨勢大致相同,采用PWU采??樣策略都是在學(xué)習(xí)到少量的樣本之后,RMSE誤差曲線迅速下降,并且率先收??斂,這說明PWU采樣策略從巨大的參數(shù)空間中成功識別并選擇出了高價值的樣??本,鮮有信息冗余,也因此達(dá)到了如此高效的建模效率。另一方面,在不同采樣??方法的CC開銷方面,相比于PBUS方法,PWU方法在其屮12個樣本上都花費??了更少或者至少相當(dāng)?shù)?

【參考文獻】:
期刊論文
[1]高性能計算之源起——科學(xué)計算的應(yīng)用現(xiàn)狀及發(fā)展思考[J]. 金鐘,陸忠華,李會元,遲學(xué)斌,孫家昶.  中國科學(xué)院院刊. 2019(06)
[2]一種典型的高性能計算:地球系統(tǒng)模擬[J]. 王斌.  物理. 2009(08)
[3]海洋環(huán)流模式的發(fā)展和應(yīng)用 Ⅰ.全球海洋環(huán)流模式[J]. 張學(xué)洪,俞永強,劉海龍.  大氣科學(xué). 2003(04)

碩士論文
[1]基于歷史日志的作業(yè)運行時間預(yù)測[D]. 許倫凡.中國工程物理研究院 2019
[2]并行程序解析性能模型的自動生成技術(shù)研究[D]. 王學(xué)惠.哈爾濱工業(yè)大學(xué) 2014



本文編號:3410525

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3410525.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶70212***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日韩亚洲精品国产第二页| 婷婷九月在线中文字幕| 中文字幕区自拍偷拍区| 国产精品一区二区不卡中文| 开心激情网 激情五月天| 日韩丝袜诱惑一区二区| 日本丁香婷婷欧美激情| 精品少妇人妻av免费看| 中文字幕日韩欧美一区| 欧美一区二区黑人在线| 中文字幕中文字幕一区二区| 亚洲国产性生活高潮免费视频 | 91国内视频一区二区三区| 又色又爽又黄的三级视频| 久久香蕉综合网精品视频| 国产精品流白浆无遮挡| 国产视频在线一区二区| 不卡中文字幕在线免费看| 国产av乱了乱了一区二区三区| 国产又黄又猛又粗又爽的片| 亚洲视频偷拍福利来袭| 国产成人在线一区二区三区 | 丝袜av一区二区三区四区五区| 中文字日产幕码三区国产| 中文字幕日韩欧美一区| 少妇丰满a一区二区三区| 婷婷色香五月综合激激情| 欧美午夜色视频国产精品| 日本一二三区不卡免费| 亚洲高清中文字幕一区二区三区 | 国产三级黄片在线免费看| 日本高清二区视频久二区| 久久精品偷拍视频观看| 日本在线视频播放91| 一区二区三区日韩在线| 国产不卡免费高清视频| 国产丝袜女优一区二区三区| 在线日本不卡一区二区| 日韩精品一区二区三区四区| 91人妻人人揉人人澡人| 国产又猛又黄又粗又爽无遮挡|