有限元網(wǎng)格積分算法在MIC眾核平臺(tái)上的并行實(shí)現(xiàn)
本文選題:集成眾核 + 卸載模式; 參考:《計(jì)算機(jī)科學(xué)》2015年11期
【摘要】:基于英特爾集成眾核(Many Integrated Core,MIC)架構(gòu),將有限元網(wǎng)格積分算法在至強(qiáng)融核(Xeon Phi)協(xié)處理器做了移植和性能分析。該應(yīng)用全面測(cè)試了有限元分析的核心計(jì)算過(guò)程在MIC上的加速效果,實(shí)現(xiàn)了卸載模式(offload)[1]下利用OpenMP在MIC上的線程并行化。計(jì)算性能測(cè)試結(jié)果顯示集成眾核平臺(tái)可以有效地加速有限元網(wǎng)格積分算法:1)一塊被充分利用的MIC設(shè)備卡(3115A)的計(jì)算能力超過(guò)兩路16核Intel XeonTM E5-2670CPU;2)MIC并發(fā)的物理線程可能由于公共緩存訪問(wèn)存在競(jìng)爭(zhēng)而降低程序的擴(kuò)展性。測(cè)試結(jié)果還顯示了在多CPU多MIC平臺(tái)上進(jìn)一步移植完整的MPI并行有限元模擬軟件的可行性。這項(xiàng)工作有助于推動(dòng)與有限元網(wǎng)格相關(guān)的科學(xué)和工程高性能計(jì)算的研究。
[Abstract]:Based on the Many Integrated Core (MIC) architecture, the finite element mesh integration algorithm has been transplanted and performance analyzed in the most strong fusion kernel (Xeon Phi) coprocessor. The application tests the acceleration effect of the core calculation process of the finite element analysis on MIC and realizes the use of OpenMP in MIC under the unloading mode (offload) [1]. The results of the computational performance test show that the integrated public kernel platform can effectively accelerate the finite element mesh integration algorithm: 1) a fully utilized MIC device card (3115A) has more computing power than two 16 core Intel XeonTM E5-2670CPU; 2) MIC concurrent physical threads may be reduced due to the competition of public cache access. The test results also show the feasibility of further transplantation of the complete MPI parallel finite element simulation software on multiple CPU multiple MIC platforms. This work helps to promote the research of scientific and engineering high performance computing related to the finite element grid.
【作者單位】: 上海超級(jí)計(jì)算中心;?巳卮髮W(xué)數(shù)學(xué)系;
【基金】:國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863)(2012AA01A308) 國(guó)家自然科學(xué)基金(11473014) 上海市科學(xué)技術(shù)委員會(huì)科研計(jì)劃項(xiàng)目(13DZ2294500)資助
【分類號(hào)】:O241.82;TP338.6
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 王迎瑞;任江勇;田榮;;基于GPU的高性能稀疏矩陣向量乘及CG求解器優(yōu)化[J];計(jì)算機(jī)科學(xué);2013年03期
2 沈鉑;張廣勇;吳韶華;盧曉偉;張清;;基于MIC平臺(tái)的offload并行方法研究[J];計(jì)算機(jī)科學(xué);2014年S1期
3 劉躍進(jìn);薛孟君;;LDLT分塊求解計(jì)算方法在有限元分析中的編程實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2014年S2期
4 劉建華;王朝尉;任江勇;田榮;;面向異構(gòu)架構(gòu)的混合精度有限元算法及其CUDA實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2012年06期
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 陽(yáng)王東;李肯立;石林;;一種準(zhǔn)對(duì)角矩陣的混合壓縮算法及其與向量相乘在GPU上的實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2014年07期
2 方寶輝;徐金秀;魏敏;周明忠;;BCC_AGCM_T106在Intel眾核上混合異構(gòu)編程與優(yōu)化研究[J];計(jì)算機(jī)科學(xué)與探索;2015年09期
相關(guān)博士學(xué)位論文 前2條
1 楊蒙召;人體面部真實(shí)感快速渲染方法研究[D];哈爾濱工業(yè)大學(xué);2014年
2 馮曉文;基于GPU的相似度計(jì)算關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2014年
相關(guān)碩士學(xué)位論文 前1條
1 趙仙勇;基于區(qū)域分解法的鋁電解槽電場(chǎng)有限元分析并行計(jì)算研究[D];中南大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 唐天兵;謝祥宏;申文杰;韋凌云;嚴(yán)毅;;多核CPU環(huán)境下的并行遺傳算法的研究[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳淑芳,王艷春;有限元網(wǎng)格造型系統(tǒng)[J];長(zhǎng)春光學(xué)精密機(jī)械學(xué)院學(xué)報(bào);1998年01期
2 羅特軍,羅季軍,汪榴;有限元網(wǎng)格優(yōu)化方法[J];四川聯(lián)合大學(xué)學(xué)報(bào)(工程科學(xué)版);1999年03期
3 劉愛(ài)榮,曹中清,周本寬;一種自動(dòng)劃分三維有限元網(wǎng)格的新方法[J];西南交通大學(xué)學(xué)報(bào);1997年03期
4 嚴(yán)登俊,黃學(xué)良,胡敏強(qiáng);二維平面任意區(qū)域有限元網(wǎng)格自適應(yīng)生成算法[J];微電機(jī)(伺服技術(shù));1999年03期
5 孔德清;一種特殊設(shè)計(jì)約束面的有限元網(wǎng)格優(yōu)化問(wèn)題[J];力學(xué)與實(shí)踐;2001年02期
6 陳立崗;鄭耀;陳建軍;;全四邊形有限元網(wǎng)格的拓?fù)鋬?yōu)化策略[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2007年01期
7 高峰;武殿梁;程奐,
本文編號(hào):1958787
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1958787.html