Intel多核與集成眾核上CFD程序的OpenMP性能分析
本文選題:多核 + 集成眾核; 參考:《計算機科學與探索》2015年10期
【摘要】:多核與眾核已成為當前主流的高性能計算體系結構,Open MP編程是開發(fā)其并行計算能力的主要手段之一。針對一個實際高階精度結構網(wǎng)格CFD(computational fluids dynamics)應用程序,采用基于硬件計數(shù)器的性能測試和模型分析的方法,系統(tǒng)地研究了其在Intel Xeon E5 Sandy Bridge多核處理器和Intel Knights Corner集成眾核協(xié)處理器上的Open MP性能。重點分析了Open MP庫開銷、線程負載均衡性、主存訪問帶寬對性能的影響,發(fā)現(xiàn)因Open MP并行引入的冗余計算對并行效率影響很小,但串行計算部分和負載不均衡性對并行效率影響大,主存訪問帶寬對浮點性能的影響大。還比較了該程序兩種體系結構上的性能差異,討論了性能進一步優(yōu)化的方向。
[Abstract]:OpenMP programming is one of the main methods to develop its parallel computing capability.For an actual high-order precision structured grid CFD(computational fluids dynamic program, the method of performance testing and model analysis based on hardware counter is adopted.The performance of Open MP on Intel Xeon E5 Sandy Bridge multi-core processor and Intel Knights Corner integrated multi-core coprocessor is systematically studied.The effects of Open MP library overhead, thread load balance and main memory access bandwidth on performance are analyzed. It is found that redundant computing introduced by Open MP parallel has little effect on parallel efficiency.However, the parallel efficiency is greatly affected by the unbalance of the serial computing part and the load, and the main memory access bandwidth has a great influence on the floating-point performance.The performance differences between the two architectures are compared and the direction of further performance optimization is discussed.
【作者單位】: 國防科技大學并行與分布處理重點實驗室;國防科技大學計算機學院;
【基金】:國家自然科學基金~~
【分類號】:TP332
【相似文獻】
相關期刊論文 前10條
1 徐海水,李顯濟;兩種路障同步變量并行訪問策略及性能分析[J];現(xiàn)代計算機;1997年04期
2 李孝忠,杜玉越;兩類組合Petri網(wǎng)與性能分析[J];軟件學報;1998年08期
3 陳虎,戴葵,楊曉東,胡守仁;JE-Java芯片中取指部件的設計和性能分析[J];計算機研究與發(fā)展;2001年03期
4 李建江;路川;張磊;;基于指導語句的CUDA程序性能分析工具研究與實現(xiàn)[J];電子科技大學學報;2012年02期
5 魏海;;三種存儲技術的性能分析[J];硅谷;2008年16期
6 邵平凡;陳華斌;;基于Atmega8無線信號軟件編解碼的實現(xiàn)方法及性能分析[J];福建電腦;2009年08期
7 楊波,,劉希民,劉滌石;80386/486微機系統(tǒng)緩沖存貯器的硬件結構及其性能分析[J];山東建材學院學報;1994年03期
8 曾令將;王繼紅;舒紅霞;;并行嵌入式系統(tǒng)可視化性能分析工具的設計與實現(xiàn)[J];計算機與數(shù)字工程;2012年03期
9 Sheraz Anjum;陳杰;;一種高效的指令緩存單元架構及其性能分析(英文)[J];電子器件;2007年05期
10 劉建華,焦麗梅,孟丹;Windows終端模式下NC服務器的性能分析[J];計算機應用;2004年03期
相關重要報紙文章 前3條
1 《網(wǎng)絡世界》記者 蒙克;福祿克推出應用性能分析解決方案[N];網(wǎng)絡世界;2013年
2 何亮;英特爾推性能分析器軟件[N];中國計算機報;2003年
3 ;采用HT技術的P4 3.06GHz處理器的測試數(shù)據(jù)[N];電子資訊時報;2002年
相關博士學位論文 前1條
1 馮權友;大規(guī)模眾核微處理器互連網(wǎng)絡體系結構及性能分析研究[D];國防科學技術大學;2012年
相關碩士學位論文 前1條
1 周國建;龍芯嵌入式系統(tǒng)的性能分析與優(yōu)化研究[D];中國石油大學;2008年
本文編號:1770984
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1770984.html