基于運(yùn)行時(shí)特征和機(jī)器學(xué)習(xí)的并行程序性能預(yù)測(cè)
發(fā)布時(shí)間:2021-06-09 10:07
隨著高性能計(jì)算系統(tǒng)計(jì)算能力不斷提升,其體系結(jié)構(gòu)和軟件系統(tǒng)的復(fù)雜性和規(guī)模也不斷增加,這對(duì)各種大規(guī)模并行應(yīng)用的設(shè)計(jì)和優(yōu)化帶來(lái)極大的挑戰(zhàn),因此面向高性能系統(tǒng)的大規(guī)模并行應(yīng)用性能建模的研究越來(lái)越重要。準(zhǔn)確地預(yù)測(cè)大規(guī)模并行程序的性能,不僅能夠?yàn)橛脩舴治龀绦蛐阅?使其能在高性能計(jì)算系統(tǒng)上高效地執(zhí)行應(yīng)用程序,還能幫助用戶管理和調(diào)度作業(yè),合理地分配調(diào)度策略,減少作業(yè)等待時(shí)間,并且能夠進(jìn)行資源評(píng)估,指導(dǎo)用戶申請(qǐng)資源。本文提出一個(gè)并行程序性能預(yù)測(cè)框架,由特征獲取、性能建模和性能預(yù)測(cè)三部分組成。該框架使用基本塊頻率作為程序特征,然后利用機(jī)器學(xué)習(xí)算法構(gòu)建多輸入?yún)?shù)的性能預(yù)測(cè)模型。在獲取特征的過(guò)程中,首先通過(guò)插樁技術(shù)獲取小規(guī)模并行程序運(yùn)行時(shí)特征,然后使用預(yù)處理技術(shù)選擇有用的特征。在性能建模部分,以基本塊頻率和進(jìn)程為輸入,程序運(yùn)行時(shí)間為輸出,進(jìn)行性能建模。在性能預(yù)測(cè)部分,為了降低獲取大規(guī)模并行程序特征的開(kāi)銷(xiāo),提出了混合插樁算法和程序刪減算法。在本文的最后,通過(guò)在天河二號(hào)平臺(tái)上執(zhí)行六種常用的并行測(cè)試程序,對(duì)提出的性能預(yù)測(cè)框架進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,當(dāng)該性能預(yù)測(cè)框架采用支持向量機(jī)回歸建模時(shí)預(yù)測(cè)效果最好,平均預(yù)測(cè)誤差低...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
種并行程序以基本塊為特征的預(yù)測(cè)時(shí)間與真實(shí)時(shí)間對(duì)比圖
e) NPB LU f) NPB EP圖 5-2 六種并行程序以基本快頻率為特征的 MAPE 的箱型圖5.3 對(duì)比實(shí)驗(yàn)本小節(jié)將對(duì)本文提出的方法與另外兩種基于輸入?yún)?shù)的經(jīng)典性能預(yù)測(cè)模型進(jìn)行對(duì)比。這兩種方法是 Branes 的方法[56][57]和 Hoefler 的方法[58]。這兩種方法是基于回歸的建模,通過(guò)改變輸入變量的值(x1,x2,…,xn),構(gòu)建線性模型,模擬輸入變量和觀察到的執(zhí)行時(shí)間 T 之間的聯(lián)系。Branes 的方法提出了一種新的黑盒技術(shù)來(lái)預(yù)測(cè)并行程序的縮放行為。其基本思想是,使用從較小數(shù)量的進(jìn)程獲得的訓(xùn)練數(shù)據(jù),然后通過(guò)多變量回歸來(lái)預(yù)測(cè)大規(guī)模進(jìn)程配置的性能。為了提高統(tǒng)計(jì)精度,在評(píng)估一個(gè)模型在不同輸入配置下的擬合時(shí),必須將 log 縮放中的誤差降到最低。如果沒(méi)有將變換尺度的參數(shù)的誤差降到最小,則參數(shù)的最大值的誤差將控制參數(shù)較小值時(shí)的誤差,從而使模型不準(zhǔn)確。因此 log2(f(x1,x2,…,xn,q)函數(shù)的參數(shù)化至關(guān)重要。Branes 的方法采用如下模型:
圖 5-3 三種方法誤差的對(duì)比圖5.4 性能預(yù)測(cè)開(kāi)銷(xiāo)在預(yù)測(cè)并行應(yīng)用程序的性能時(shí),只需要執(zhí)行相應(yīng)的刪減后串行程序來(lái)收集基本塊頻率,而不需要執(zhí)行原始并行應(yīng)用程序。生成的數(shù)據(jù)只包含幾個(gè)基本塊(本文中的 6 個(gè))的基本塊頻率,其存儲(chǔ)開(kāi)銷(xiāo)可以忽略不計(jì)。因此,在本節(jié)中,主要評(píng)估刪減后的串行程序在預(yù)測(cè)的執(zhí)行開(kāi)銷(xiāo)。超級(jí)計(jì)算機(jī)上的計(jì)算資源是根據(jù)核時(shí)計(jì)費(fèi)的,因此,在本實(shí)驗(yàn)中,預(yù)測(cè)開(kāi)銷(xiāo)也用核時(shí)表示。表 5-5 顯示了在預(yù)測(cè) 6 個(gè)選定應(yīng)用程序的性能時(shí),本文的方法消耗的核時(shí)與最初并行應(yīng)用程序執(zhí)行的核時(shí)數(shù)的比較�?梢詮倪@個(gè)表中發(fā)現(xiàn),在 6 個(gè)應(yīng)用程序上執(zhí)行本文方法的所有開(kāi)銷(xiāo)都大大低于原始應(yīng)用程序執(zhí)行的開(kāi)銷(xiāo)。平均管理費(fèi)用僅占原執(zhí)行費(fèi)用的 0.1219%。這意味著的方法可以幫助 HPC 用戶有效地預(yù)測(cè)并行應(yīng)用程序的性能。這是因?yàn)閯h減后的程序是一個(gè)獨(dú)立的串行程序,它只用一個(gè)節(jié)點(diǎn)或一個(gè)核就能執(zhí)行。此外,還通過(guò)減少插入計(jì)數(shù)器的數(shù)量和消除許多死碼來(lái)優(yōu)化這個(gè)串行程序,這進(jìn)一步提高了它的性能。
【參考文獻(xiàn)】:
期刊論文
[1]全球高性能計(jì)算發(fā)展態(tài)勢(shì)分析[J]. 鄭曉歡,陳明奇,唐川,張娟,房俊民. 世界科技研究與發(fā)展. 2018(03)
[2]基于多核平臺(tái)無(wú)關(guān)屬性的程序并行度分析工具[J]. 熬冉,譚光明,陳明宇. 高技術(shù)通訊. 2015(01)
[3]“天河二號(hào)”超級(jí)計(jì)算機(jī)[J]. 王濤. 科學(xué). 2013(04)
本文編號(hào):3220384
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
種并行程序以基本塊為特征的預(yù)測(cè)時(shí)間與真實(shí)時(shí)間對(duì)比圖
e) NPB LU f) NPB EP圖 5-2 六種并行程序以基本快頻率為特征的 MAPE 的箱型圖5.3 對(duì)比實(shí)驗(yàn)本小節(jié)將對(duì)本文提出的方法與另外兩種基于輸入?yún)?shù)的經(jīng)典性能預(yù)測(cè)模型進(jìn)行對(duì)比。這兩種方法是 Branes 的方法[56][57]和 Hoefler 的方法[58]。這兩種方法是基于回歸的建模,通過(guò)改變輸入變量的值(x1,x2,…,xn),構(gòu)建線性模型,模擬輸入變量和觀察到的執(zhí)行時(shí)間 T 之間的聯(lián)系。Branes 的方法提出了一種新的黑盒技術(shù)來(lái)預(yù)測(cè)并行程序的縮放行為。其基本思想是,使用從較小數(shù)量的進(jìn)程獲得的訓(xùn)練數(shù)據(jù),然后通過(guò)多變量回歸來(lái)預(yù)測(cè)大規(guī)模進(jìn)程配置的性能。為了提高統(tǒng)計(jì)精度,在評(píng)估一個(gè)模型在不同輸入配置下的擬合時(shí),必須將 log 縮放中的誤差降到最低。如果沒(méi)有將變換尺度的參數(shù)的誤差降到最小,則參數(shù)的最大值的誤差將控制參數(shù)較小值時(shí)的誤差,從而使模型不準(zhǔn)確。因此 log2(f(x1,x2,…,xn,q)函數(shù)的參數(shù)化至關(guān)重要。Branes 的方法采用如下模型:
圖 5-3 三種方法誤差的對(duì)比圖5.4 性能預(yù)測(cè)開(kāi)銷(xiāo)在預(yù)測(cè)并行應(yīng)用程序的性能時(shí),只需要執(zhí)行相應(yīng)的刪減后串行程序來(lái)收集基本塊頻率,而不需要執(zhí)行原始并行應(yīng)用程序。生成的數(shù)據(jù)只包含幾個(gè)基本塊(本文中的 6 個(gè))的基本塊頻率,其存儲(chǔ)開(kāi)銷(xiāo)可以忽略不計(jì)。因此,在本節(jié)中,主要評(píng)估刪減后的串行程序在預(yù)測(cè)的執(zhí)行開(kāi)銷(xiāo)。超級(jí)計(jì)算機(jī)上的計(jì)算資源是根據(jù)核時(shí)計(jì)費(fèi)的,因此,在本實(shí)驗(yàn)中,預(yù)測(cè)開(kāi)銷(xiāo)也用核時(shí)表示。表 5-5 顯示了在預(yù)測(cè) 6 個(gè)選定應(yīng)用程序的性能時(shí),本文的方法消耗的核時(shí)與最初并行應(yīng)用程序執(zhí)行的核時(shí)數(shù)的比較�?梢詮倪@個(gè)表中發(fā)現(xiàn),在 6 個(gè)應(yīng)用程序上執(zhí)行本文方法的所有開(kāi)銷(xiāo)都大大低于原始應(yīng)用程序執(zhí)行的開(kāi)銷(xiāo)。平均管理費(fèi)用僅占原執(zhí)行費(fèi)用的 0.1219%。這意味著的方法可以幫助 HPC 用戶有效地預(yù)測(cè)并行應(yīng)用程序的性能。這是因?yàn)閯h減后的程序是一個(gè)獨(dú)立的串行程序,它只用一個(gè)節(jié)點(diǎn)或一個(gè)核就能執(zhí)行。此外,還通過(guò)減少插入計(jì)數(shù)器的數(shù)量和消除許多死碼來(lái)優(yōu)化這個(gè)串行程序,這進(jìn)一步提高了它的性能。
【參考文獻(xiàn)】:
期刊論文
[1]全球高性能計(jì)算發(fā)展態(tài)勢(shì)分析[J]. 鄭曉歡,陳明奇,唐川,張娟,房俊民. 世界科技研究與發(fā)展. 2018(03)
[2]基于多核平臺(tái)無(wú)關(guān)屬性的程序并行度分析工具[J]. 熬冉,譚光明,陳明宇. 高技術(shù)通訊. 2015(01)
[3]“天河二號(hào)”超級(jí)計(jì)算機(jī)[J]. 王濤. 科學(xué). 2013(04)
本文編號(hào):3220384
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3220384.html
最近更新
教材專著