天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Intel多核與集成眾核上CFD程序的OpenMP性能分析

發(fā)布時(shí)間:2018-04-19 01:25

  本文選題:多核 + 集成眾核。 參考:《計(jì)算機(jī)科學(xué)與探索》2015年10期


【摘要】:多核與眾核已成為當(dāng)前主流的高性能計(jì)算體系結(jié)構(gòu),Open MP編程是開(kāi)發(fā)其并行計(jì)算能力的主要手段之一。針對(duì)一個(gè)實(shí)際高階精度結(jié)構(gòu)網(wǎng)格CFD(computational fluids dynamics)應(yīng)用程序,采用基于硬件計(jì)數(shù)器的性能測(cè)試和模型分析的方法,系統(tǒng)地研究了其在Intel Xeon E5 Sandy Bridge多核處理器和Intel Knights Corner集成眾核協(xié)處理器上的Open MP性能。重點(diǎn)分析了Open MP庫(kù)開(kāi)銷、線程負(fù)載均衡性、主存訪問(wèn)帶寬對(duì)性能的影響,發(fā)現(xiàn)因Open MP并行引入的冗余計(jì)算對(duì)并行效率影響很小,但串行計(jì)算部分和負(fù)載不均衡性對(duì)并行效率影響大,主存訪問(wèn)帶寬對(duì)浮點(diǎn)性能的影響大。還比較了該程序兩種體系結(jié)構(gòu)上的性能差異,討論了性能進(jìn)一步優(yōu)化的方向。
[Abstract]:OpenMP programming is one of the main methods to develop its parallel computing capability.For an actual high-order precision structured grid CFD(computational fluids dynamic program, the method of performance testing and model analysis based on hardware counter is adopted.The performance of Open MP on Intel Xeon E5 Sandy Bridge multi-core processor and Intel Knights Corner integrated multi-core coprocessor is systematically studied.The effects of Open MP library overhead, thread load balance and main memory access bandwidth on performance are analyzed. It is found that redundant computing introduced by Open MP parallel has little effect on parallel efficiency.However, the parallel efficiency is greatly affected by the unbalance of the serial computing part and the load, and the main memory access bandwidth has a great influence on the floating-point performance.The performance differences between the two architectures are compared and the direction of further performance optimization is discussed.
【作者單位】: 國(guó)防科技大學(xué)并行與分布處理重點(diǎn)實(shí)驗(yàn)室;國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金~~
【分類號(hào)】:TP332

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐海水,李顯濟(jì);兩種路障同步變量并行訪問(wèn)策略及性能分析[J];現(xiàn)代計(jì)算機(jī);1997年04期

2 李孝忠,杜玉越;兩類組合Petri網(wǎng)與性能分析[J];軟件學(xué)報(bào);1998年08期

3 陳虎,戴葵,楊曉東,胡守仁;JE-Java芯片中取指部件的設(shè)計(jì)和性能分析[J];計(jì)算機(jī)研究與發(fā)展;2001年03期

4 李建江;路川;張磊;;基于指導(dǎo)語(yǔ)句的CUDA程序性能分析工具研究與實(shí)現(xiàn)[J];電子科技大學(xué)學(xué)報(bào);2012年02期

5 魏海;;三種存儲(chǔ)技術(shù)的性能分析[J];硅谷;2008年16期

6 邵平凡;陳華斌;;基于Atmega8無(wú)線信號(hào)軟件編解碼的實(shí)現(xiàn)方法及性能分析[J];福建電腦;2009年08期

7 楊波,,劉希民,劉滌石;80386/486微機(jī)系統(tǒng)緩沖存貯器的硬件結(jié)構(gòu)及其性能分析[J];山東建材學(xué)院學(xué)報(bào);1994年03期

8 曾令將;王繼紅;舒紅霞;;并行嵌入式系統(tǒng)可視化性能分析工具的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與數(shù)字工程;2012年03期

9 Sheraz Anjum;陳杰;;一種高效的指令緩存單元架構(gòu)及其性能分析(英文)[J];電子器件;2007年05期

10 劉建華,焦麗梅,孟丹;Windows終端模式下NC服務(wù)器的性能分析[J];計(jì)算機(jī)應(yīng)用;2004年03期

相關(guān)重要報(bào)紙文章 前3條

1 《網(wǎng)絡(luò)世界》記者 蒙克;福祿克推出應(yīng)用性能分析解決方案[N];網(wǎng)絡(luò)世界;2013年

2 何亮;英特爾推性能分析器軟件[N];中國(guó)計(jì)算機(jī)報(bào);2003年

3 ;采用HT技術(shù)的P4 3.06GHz處理器的測(cè)試數(shù)據(jù)[N];電子資訊時(shí)報(bào);2002年

相關(guān)博士學(xué)位論文 前1條

1 馮權(quán)友;大規(guī)模眾核微處理器互連網(wǎng)絡(luò)體系結(jié)構(gòu)及性能分析研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年

相關(guān)碩士學(xué)位論文 前1條

1 周國(guó)建;龍芯嵌入式系統(tǒng)的性能分析與優(yōu)化研究[D];中國(guó)石油大學(xué);2008年



本文編號(hào):1770984

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1770984.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7f70f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com