高性能計(jì)算系統(tǒng)內(nèi)存子系統(tǒng)的性能預(yù)測模型研究
發(fā)布時(shí)間:2020-05-22 07:45
【摘要】: 隨著高性能計(jì)算技術(shù)在社會(huì)生產(chǎn)生活各方面的應(yīng)用日益廣泛,高性能計(jì)算的性能評(píng)測尤其是性能預(yù)測在高性能計(jì)算領(lǐng)域內(nèi)逐漸受到重視。目前研究最廣泛的是使用性能模型進(jìn)行預(yù)測。建立性能模型,只需要收集關(guān)于應(yīng)用程序及目標(biāo)機(jī)器的一些相關(guān)信息進(jìn)行分析,然后通過一些計(jì)算得出應(yīng)用程序在目標(biāo)機(jī)器上運(yùn)行所需要的時(shí)間。相對(duì)于其他方法來說,整個(gè)預(yù)測過程花費(fèi)的時(shí)間大大縮短,而且其預(yù)測精度也比較高。 現(xiàn)有的一些性能模型與程序所使用的數(shù)值算法密切相關(guān),建立過程需要花費(fèi)大量的專家人力,模型計(jì)算時(shí)間較長,無法實(shí)現(xiàn)自動(dòng)化;另一些性能模型所使用的工具和建模方法基于某種類型的計(jì)算平臺(tái),且只對(duì)其少數(shù)戰(zhàn)略同盟直接可用。 本文著重于高性能計(jì)算機(jī)系統(tǒng)的內(nèi)存系統(tǒng)性能模型,分析了使用機(jī)器特征操作能力與應(yīng)用程序中循環(huán)的內(nèi)存訪問模式相結(jié)合的性能模型框架,并在充分分析的基礎(chǔ)上,對(duì)性能模型工具進(jìn)行了移植,在Intel X86結(jié)構(gòu)上實(shí)現(xiàn)了對(duì)應(yīng)的模型計(jì)算工具,對(duì)應(yīng)用程序中的循環(huán)而不是基本塊進(jìn)行處理,精簡所需要考慮的內(nèi)存訪問特征;并針對(duì)該性能模型框架中為獲取應(yīng)用程序內(nèi)存訪問模式使用的Multi-MAPS測試工具可能存在的、不能覆蓋所有的HPC應(yīng)用程序中的內(nèi)存訪問模式的問題進(jìn)行了討論并提出了解決辦法。 實(shí)驗(yàn)數(shù)據(jù)表明,使用移植到Intel X86結(jié)構(gòu)上的性能模型進(jìn)行性能預(yù)測能夠達(dá)到預(yù)期的精度;通過插值的算法后可以使用已獲取Multi-MAPS循環(huán)中的數(shù)據(jù)來計(jì)算其他應(yīng)用程序中其他可能的內(nèi)存訪問模式所對(duì)應(yīng)的機(jī)器內(nèi)存帶寬,從而可以加快整個(gè)性能模型計(jì)算的時(shí)間。
【圖文】:
3.使用模擬器如simPlescalar[9〕進(jìn)行模擬simplescalar工具集能為計(jì)算機(jī)系統(tǒng)性能及功耗分析、體系結(jié)構(gòu)建模等提供了有效的支持。由于模擬是使實(shí)際應(yīng)用程序在模擬的硬件環(huán)境下進(jìn)行實(shí)際的運(yùn)行,所以使用模擬的方法可以獲得很精確的性能預(yù)測時(shí)間,而且通過修改模擬器的參數(shù),可以對(duì)當(dāng)時(shí)還沒有生產(chǎn)出來的硬件進(jìn)行性能預(yù)測。但是一般的科學(xué)計(jì)算程序運(yùn)行時(shí)間較長,而使用模擬器對(duì)程序的每一條指令進(jìn)行模擬執(zhí)行則更會(huì)大大增加整個(gè)過程的時(shí)間(一般會(huì)產(chǎn)生10一100倍的時(shí)間延長)。尤其是精確到時(shí)鐘周期的模擬,由于要模擬處理器的所有行為,整個(gè)模擬過程所花費(fèi)的時(shí)間大約是實(shí)際應(yīng)用程序執(zhí)行時(shí)間的10“倍〔10〕。為了避免如此之大的延時(shí),通常只使用時(shí)鐘周期精度的模擬器模擬執(zhí)行應(yīng)用程序數(shù)分鐘,然后根據(jù)在這段時(shí)間里獲得的一些應(yīng)用程序信息來進(jìn)行性能預(yù)測。但是顯然對(duì)于大多數(shù)的科學(xué)計(jì)算程序,其中某一部分的行為無法代表整個(gè)程序的行為,因此獲得的預(yù)測精度不高。4.建立性能模型進(jìn)行計(jì)算
存性能模型與通信系統(tǒng)性能模型中的系統(tǒng)特征文件和程序特性操作文件以獲得該應(yīng)用程序最終的運(yùn)行時(shí)間預(yù)測。其中使用 MetasimConvolver對(duì)內(nèi)存性能模型中的系統(tǒng)特征文件和程序特性操作的合成過程如表2一3和圖2一7所示。對(duì)應(yīng)于表2一3和圖2一7所示的系統(tǒng)特征文件和程序特性操作進(jìn)行合成可以用下面的計(jì)算公式來表示:執(zhí)行時(shí)間=藝(Mem伽職/MemRate照)(公式2一2)i=1執(zhí)行時(shí)間二藝{(、,伽BB,/、m,a,。。盡)+(、a,伽職/。。a,,a,。)}i=l(公式2一3)其中
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2008
【分類號(hào)】:TP302.1
【圖文】:
3.使用模擬器如simPlescalar[9〕進(jìn)行模擬simplescalar工具集能為計(jì)算機(jī)系統(tǒng)性能及功耗分析、體系結(jié)構(gòu)建模等提供了有效的支持。由于模擬是使實(shí)際應(yīng)用程序在模擬的硬件環(huán)境下進(jìn)行實(shí)際的運(yùn)行,所以使用模擬的方法可以獲得很精確的性能預(yù)測時(shí)間,而且通過修改模擬器的參數(shù),可以對(duì)當(dāng)時(shí)還沒有生產(chǎn)出來的硬件進(jìn)行性能預(yù)測。但是一般的科學(xué)計(jì)算程序運(yùn)行時(shí)間較長,而使用模擬器對(duì)程序的每一條指令進(jìn)行模擬執(zhí)行則更會(huì)大大增加整個(gè)過程的時(shí)間(一般會(huì)產(chǎn)生10一100倍的時(shí)間延長)。尤其是精確到時(shí)鐘周期的模擬,由于要模擬處理器的所有行為,整個(gè)模擬過程所花費(fèi)的時(shí)間大約是實(shí)際應(yīng)用程序執(zhí)行時(shí)間的10“倍〔10〕。為了避免如此之大的延時(shí),通常只使用時(shí)鐘周期精度的模擬器模擬執(zhí)行應(yīng)用程序數(shù)分鐘,然后根據(jù)在這段時(shí)間里獲得的一些應(yīng)用程序信息來進(jìn)行性能預(yù)測。但是顯然對(duì)于大多數(shù)的科學(xué)計(jì)算程序,其中某一部分的行為無法代表整個(gè)程序的行為,因此獲得的預(yù)測精度不高。4.建立性能模型進(jìn)行計(jì)算
存性能模型與通信系統(tǒng)性能模型中的系統(tǒng)特征文件和程序特性操作文件以獲得該應(yīng)用程序最終的運(yùn)行時(shí)間預(yù)測。其中使用 MetasimConvolver對(duì)內(nèi)存性能模型中的系統(tǒng)特征文件和程序特性操作的合成過程如表2一3和圖2一7所示。對(duì)應(yīng)于表2一3和圖2一7所示的系統(tǒng)特征文件和程序特性操作進(jìn)行合成可以用下面的計(jì)算公式來表示:執(zhí)行時(shí)間=藝(Mem伽職/MemRate照)(公式2一2)i=1執(zhí)行時(shí)間二藝{(、,伽BB,/、m,a,。。盡)+(、a,伽職/。。a,,a,。)}i=l(公式2一3)其中
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2008
【分類號(hào)】:TP302.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 黃翔;張文博;張波;魏峻;;基于方面模板的分布式組件系統(tǒng)性能預(yù)測方法[J];計(jì)算機(jī)科學(xué);2009年08期
2 謝茗濤;高性能計(jì)算頂級(jí)會(huì)議在京 IBM論道“深度計(jì)算”[J];計(jì)算機(jī)與網(wǎng)絡(luò);2000年10期
3 陳曉鵬;中國高性能計(jì)算沖擊新高標(biāo)[J];中國計(jì)算機(jī)用戶;2003年29期
4 ;高性能計(jì)算可服務(wù)于全民[J];中國教育網(wǎng)絡(luò);2009年12期
5 ;高性能發(fā)展重在應(yīng)用 浪潮與中科院建立高性能戰(zhàn)略合作[J];科技浪潮;2009年03期
6 ;曙光推動(dòng)高性能計(jì)算走向普及[J];中國信息界;2005年16期
7 王r
本文編號(hào):2675672
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2675672.html
最近更新
教材專著