天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于3D-EW算法的Intel KNC架構(gòu)下的性能分析與調(diào)優(yōu)

發(fā)布時(shí)間:2017-08-22 04:08

  本文關(guān)鍵詞:基于3D-EW算法的Intel KNC架構(gòu)下的性能分析與調(diào)優(yōu)


  更多相關(guān)文章: XeonPhi 高性能計(jì)算 性能優(yōu)化


【摘要】:在地球物理的研究過(guò)程中,由于彈性波波場(chǎng)攜帶著與地下介質(zhì)性質(zhì)相關(guān)的大量信息,所以一直以來(lái)是個(gè)重要的研究領(lǐng)域。在實(shí)際的工業(yè)生產(chǎn)過(guò)程中,利用計(jì)算機(jī)對(duì)于彈性波波場(chǎng)進(jìn)行數(shù)值模擬更是地震預(yù)測(cè)和石油勘探等領(lǐng)域中的一項(xiàng)重要技術(shù)。在其數(shù)值模擬過(guò)程中,針對(duì)混合波場(chǎng)的三維縱橫波波場(chǎng)分離問(wèn)題的數(shù)值模擬算法3D-EW(3D pure P and S wave elastic wave equation modelling)需要大量的迭代計(jì)算過(guò)程,屬于計(jì)算密集型問(wèn)題。本文從異構(gòu)并行計(jì)算的角度出發(fā),首先將3D-EW算法通過(guò)線(xiàn)程級(jí)并行編程模型OpenMP成功地移植到Intel眾核(Many Integrated Core)架構(gòu)協(xié)處理器平臺(tái)上,相較運(yùn)行在Intel Xeon處理器平臺(tái)上的串行版本實(shí)現(xiàn)了3.7倍的加速比。通過(guò)針對(duì)眾核協(xié)處理器平臺(tái)的Knights Corner微架構(gòu)的研究,總結(jié)該架構(gòu)的潛在性能瓶頸以及架構(gòu)設(shè)計(jì)特性。在實(shí)驗(yàn)過(guò)程中,結(jié)合性能分析工具的性能指標(biāo)測(cè)試和分析,基于傳統(tǒng)的處理器調(diào)優(yōu)技巧,進(jìn)一步地歸納了基于Knights Corner架構(gòu)的數(shù)據(jù)級(jí)和指令級(jí)并行的性能優(yōu)化技巧。發(fā)現(xiàn)了KNC架構(gòu)下的計(jì)算性能與向量化程度以及緩存性能的緊密關(guān)系,進(jìn)而采用C intrinsic的底層接口改寫(xiě)代碼增強(qiáng)程序的向量化程度,使用cache blocking技術(shù)提高數(shù)據(jù)局部性。最終將3D-EW算法在Intel5110P協(xié)處理器上的加速比提高至17.7倍,從而顯著提升了程序運(yùn)行效率。同時(shí)也為更多應(yīng)用在Knights Corner架構(gòu)下的性能調(diào)優(yōu)提供了參考。
【關(guān)鍵詞】:XeonPhi 高性能計(jì)算 性能優(yōu)化
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:P631.4
【目錄】:
  • 摘要3-4
  • ABSTRACT4-10
  • 第一章 研究背景10-20
  • 1.1 彈性波波場(chǎng)問(wèn)題10-12
  • 1.1.1 三維彈性波10
  • 1.1.2 波場(chǎng)分離10
  • 1.1.3 3D-EW算法10-12
  • 1.2 高性能計(jì)算12-14
  • 1.3 Xeon Phi協(xié)處理器14-16
  • 1.3.1 架構(gòu)概要14-15
  • 1.3.2 編程模型15-16
  • 1.4 性能分析16-17
  • 1.5 相關(guān)研究工作17-18
  • 1.6 研究目的18-20
  • 第二章 Knight Corner微架構(gòu)的分析與研究20-28
  • 2.1 架構(gòu)綜述20-22
  • 2.1.1 核芯技術(shù)20-21
  • 2.1.2 向量處理單元21-22
  • 2.1.3 眾核互聯(lián)技術(shù)22
  • 2.2 存儲(chǔ)架構(gòu)22-26
  • 2.2.1 緩存機(jī)制23-25
  • 2.2.2 內(nèi)存帶寬25-26
  • 2.3 線(xiàn)程模型26-28
  • 第三章 基于KNC架構(gòu)的 3D-EW算法性能分析28-34
  • 3.1 性能分析工具28-30
  • 3.2 線(xiàn)程級(jí)并行30
  • 3.3 數(shù)據(jù)級(jí)并行30-31
  • 3.4 指令級(jí)并行31-32
  • 3.5 緩存使用情況32-34
  • 第四章 基于KNC架構(gòu)的 3D-EW算法性能優(yōu)化34-48
  • 4.1 線(xiàn)程級(jí)優(yōu)化34-37
  • 4.1.1 熱點(diǎn)分析34-36
  • 4.1.2 Open MP并行化36-37
  • 4.2 數(shù)據(jù)級(jí)優(yōu)化37-43
  • 4.2.1 數(shù)據(jù)對(duì)齊37-38
  • 4.2.2 SIMD38-40
  • 4.2.3 數(shù)據(jù)局部性40
  • 4.2.4 數(shù)據(jù)預(yù)取40-43
  • 4.3 指令級(jí)優(yōu)化43-46
  • 4.3.1 C intrinsic編程43-44
  • 4.3.2 FMA44-45
  • 4.3.3 gather/scatter45-46
  • 4.4 緩存使用優(yōu)化46-48
  • 第五章 實(shí)驗(yàn)結(jié)果與分析48-54
  • 5.1 實(shí)驗(yàn)環(huán)境48-49
  • 5.1.1 硬件環(huán)境48
  • 5.1.2 軟件環(huán)境48-49
  • 5.2 實(shí)驗(yàn)結(jié)果49-50
  • 5.3 實(shí)驗(yàn)分析50-54
  • 第六章 總結(jié)與展望54-56
  • 6.1 總結(jié)54-55
  • 6.2 未來(lái)工作的展望55-56
  • 參考文獻(xiàn)56-60
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄60-62

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條

1 陳祖銀;王用軍;彭達(dá);;彈性波波場(chǎng)分離數(shù)值模擬[J];中國(guó)石油勘探;2014年06期

2 馬德堂,朱光明;彈性波波場(chǎng)P波和S波分解的數(shù)值模擬[J];石油地球物理勘探;2003年05期



本文編號(hào):716944

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/716944.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)795cd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com