提高機(jī)群OpenMP系統(tǒng)性能的關(guān)鍵技術(shù)研究
發(fā)布時間:2020-12-12 21:31
隨著微處理器和高速網(wǎng)絡(luò)技術(shù)的發(fā)展,機(jī)群由于性能價格比高和可擴(kuò)展性好等特點,正逐漸成為并行計算的主流平臺。適合機(jī)群的并行編程模型能夠促進(jìn)機(jī)群的廣泛應(yīng)用,從而促進(jìn)并行應(yīng)用的發(fā)展普及,成為當(dāng)前關(guān)注熱點。目前消息傳遞是機(jī)群上主流的并行編程模型。但是程序員在機(jī)群上使用消息傳遞編程相當(dāng)困難,這一點阻礙了機(jī)群的廣泛應(yīng)用。一般認(rèn)為,共享存儲比消息傳遞易于編程。OpenMP作為當(dāng)前共享存儲的事實編程標(biāo)準(zhǔn),具有易于編程和支持增量并行的特點。機(jī)群OpenMP系統(tǒng)在機(jī)群上提供了共享存儲的OpenMP計算環(huán)境,它結(jié)合了OpenMP的易編程性和機(jī)群的可擴(kuò)展性,引起了廣泛的研究。由于機(jī)群通常采用廉價的商業(yè)網(wǎng)絡(luò)互連,通信開銷較大,機(jī)群OpenMP系統(tǒng)要想獲得理想的性能較為困難,而具有良好的性能是它能否得到廣泛應(yīng)用的關(guān)鍵,因此如何有效提高機(jī)群OpenMP系統(tǒng)的性能成為當(dāng)前研究熱點。 本文研究了提高機(jī)群OpenMP系統(tǒng)性能的關(guān)鍵技術(shù),并利用擴(kuò)展OpenMP制導(dǎo)的方式進(jìn)行了實現(xiàn)。機(jī)群OpenMP系統(tǒng)通過將OpenMP程序轉(zhuǎn)換成軟件DSM程序在機(jī)群上運(yùn)行;贖ome的軟件DSM系統(tǒng)在機(jī)群上構(gòu)造了類似NUMA結(jié)構(gòu)的共享...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院計算技術(shù)研究所)北京市
【文章頁數(shù)】:83 頁
【學(xué)位級別】:博士
【部分圖文】:
SGI數(shù)據(jù)分布模式
OPeMnP標(biāo)準(zhǔn)是基于一致存儲訪問的SMp并行處理系統(tǒng),。然而在機(jī)群系統(tǒng)中,擁有者計算的實現(xiàn)程度直接決定了一個nP/AJIJ認(rèn)中,我們擴(kuò)展了OPe川邊p的制導(dǎo)集,允許程序員顯模式。而在缺省情況下,數(shù)據(jù)采用block模式分布。制導(dǎo)格式制導(dǎo)說明其被制導(dǎo)的數(shù)組對象在各結(jié)點的Home中的分布局共享的數(shù)組變量。由于數(shù)據(jù)分布以頁為單位且不支持嵌套并的最高維,所以我們設(shè)計的制導(dǎo)語法比較簡單:aomPdsitrbiuet(array-nmae,lyaouteemode)mode:=BLOCK}CYCLIC}CYCLIC(ehunks七e)BLocK方式是將數(shù)組aarryespame按最高維長度均分在每個knsize)是將數(shù)據(jù)最高維按ehuknsize大小以Round~Robni方式現(xiàn)中進(jìn)行頁對齊):cycLIc則表示以cYcLIC()l方式進(jìn)行[1024][1024],B[1024]11024];aomPdsirtibuet(A,BLOCK)aomPdsirtbiuet(B,CYCLIC(128))
中國科學(xué)院計算技術(shù)研究所博士后出站報告差不多;LU程序比GS程序計算通信比小,加速比為2.90,L妙程序具有相似的數(shù)據(jù)訪問模式,計算通信比較好,八70。多機(jī)運(yùn)行時的加速比如圖4.5所示。由此可以看出,在我們S調(diào)度是非常有效的。表.43應(yīng)用程序規(guī)模、串行和八機(jī)運(yùn)行時間及開銷規(guī)模及迭代代共享空空串行時時8機(jī)運(yùn)行時間及開銷(s)))次數(shù)數(shù)間間bJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJl(((((((MB)))(s)))總時間間訓(xùn)一算算SEGVVVys...c2048x204888l666341.222280.977742.211113.055521.14442048x2048883222242.355583.688829.800024.100023.48884096x4096,,1288883.733314.34446.92221.91113.6333111110000000000000000004096x4096,,25666269.388840,188815.466610.97777055511111000000000000000000
本文編號:2913308
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院計算技術(shù)研究所)北京市
【文章頁數(shù)】:83 頁
【學(xué)位級別】:博士
【部分圖文】:
SGI數(shù)據(jù)分布模式
OPeMnP標(biāo)準(zhǔn)是基于一致存儲訪問的SMp并行處理系統(tǒng),。然而在機(jī)群系統(tǒng)中,擁有者計算的實現(xiàn)程度直接決定了一個nP/AJIJ認(rèn)中,我們擴(kuò)展了OPe川邊p的制導(dǎo)集,允許程序員顯模式。而在缺省情況下,數(shù)據(jù)采用block模式分布。制導(dǎo)格式制導(dǎo)說明其被制導(dǎo)的數(shù)組對象在各結(jié)點的Home中的分布局共享的數(shù)組變量。由于數(shù)據(jù)分布以頁為單位且不支持嵌套并的最高維,所以我們設(shè)計的制導(dǎo)語法比較簡單:aomPdsitrbiuet(array-nmae,lyaouteemode)mode:=BLOCK}CYCLIC}CYCLIC(ehunks七e)BLocK方式是將數(shù)組aarryespame按最高維長度均分在每個knsize)是將數(shù)據(jù)最高維按ehuknsize大小以Round~Robni方式現(xiàn)中進(jìn)行頁對齊):cycLIc則表示以cYcLIC()l方式進(jìn)行[1024][1024],B[1024]11024];aomPdsirtibuet(A,BLOCK)aomPdsirtbiuet(B,CYCLIC(128))
中國科學(xué)院計算技術(shù)研究所博士后出站報告差不多;LU程序比GS程序計算通信比小,加速比為2.90,L妙程序具有相似的數(shù)據(jù)訪問模式,計算通信比較好,八70。多機(jī)運(yùn)行時的加速比如圖4.5所示。由此可以看出,在我們S調(diào)度是非常有效的。表.43應(yīng)用程序規(guī)模、串行和八機(jī)運(yùn)行時間及開銷規(guī)模及迭代代共享空空串行時時8機(jī)運(yùn)行時間及開銷(s)))次數(shù)數(shù)間間bJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJl(((((((MB)))(s)))總時間間訓(xùn)一算算SEGVVVys...c2048x204888l666341.222280.977742.211113.055521.14442048x2048883222242.355583.688829.800024.100023.48884096x4096,,1288883.733314.34446.92221.91113.6333111110000000000000000004096x4096,,25666269.388840,188815.466610.97777055511111000000000000000000
本文編號:2913308
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2913308.html
最近更新
教材專著