天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于3D-EW算法的Intel KNC架構(gòu)下的性能分析與調(diào)優(yōu)

發(fā)布時(shí)間:2017-08-22 04:08

  本文關(guān)鍵詞:基于3D-EW算法的Intel KNC架構(gòu)下的性能分析與調(diào)優(yōu)


  更多相關(guān)文章: XeonPhi 高性能計(jì)算 性能優(yōu)化


【摘要】:在地球物理的研究過(guò)程中,由于彈性波波場(chǎng)攜帶著與地下介質(zhì)性質(zhì)相關(guān)的大量信息,所以一直以來(lái)是個(gè)重要的研究領(lǐng)域。在實(shí)際的工業(yè)生產(chǎn)過(guò)程中,利用計(jì)算機(jī)對(duì)于彈性波波場(chǎng)進(jìn)行數(shù)值模擬更是地震預(yù)測(cè)和石油勘探等領(lǐng)域中的一項(xiàng)重要技術(shù)。在其數(shù)值模擬過(guò)程中,針對(duì)混合波場(chǎng)的三維縱橫波波場(chǎng)分離問(wèn)題的數(shù)值模擬算法3D-EW(3D pure P and S wave elastic wave equation modelling)需要大量的迭代計(jì)算過(guò)程,屬于計(jì)算密集型問(wèn)題。本文從異構(gòu)并行計(jì)算的角度出發(fā),首先將3D-EW算法通過(guò)線程級(jí)并行編程模型OpenMP成功地移植到Intel眾核(Many Integrated Core)架構(gòu)協(xié)處理器平臺(tái)上,相較運(yùn)行在Intel Xeon處理器平臺(tái)上的串行版本實(shí)現(xiàn)了3.7倍的加速比。通過(guò)針對(duì)眾核協(xié)處理器平臺(tái)的Knights Corner微架構(gòu)的研究,總結(jié)該架構(gòu)的潛在性能瓶頸以及架構(gòu)設(shè)計(jì)特性。在實(shí)驗(yàn)過(guò)程中,結(jié)合性能分析工具的性能指標(biāo)測(cè)試和分析,基于傳統(tǒng)的處理器調(diào)優(yōu)技巧,進(jìn)一步地歸納了基于Knights Corner架構(gòu)的數(shù)據(jù)級(jí)和指令級(jí)并行的性能優(yōu)化技巧。發(fā)現(xiàn)了KNC架構(gòu)下的計(jì)算性能與向量化程度以及緩存性能的緊密關(guān)系,進(jìn)而采用C intrinsic的底層接口改寫(xiě)代碼增強(qiáng)程序的向量化程度,使用cache blocking技術(shù)提高數(shù)據(jù)局部性。最終將3D-EW算法在Intel5110P協(xié)處理器上的加速比提高至17.7倍,從而顯著提升了程序運(yùn)行效率。同時(shí)也為更多應(yīng)用在Knights Corner架構(gòu)下的性能調(diào)優(yōu)提供了參考。
【關(guān)鍵詞】:XeonPhi 高性能計(jì)算 性能優(yōu)化
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:P631.4
【目錄】:
  • 摘要3-4
  • ABSTRACT4-10
  • 第一章 研究背景10-20
  • 1.1 彈性波波場(chǎng)問(wèn)題10-12
  • 1.1.1 三維彈性波10
  • 1.1.2 波場(chǎng)分離10
  • 1.1.3 3D-EW算法10-12
  • 1.2 高性能計(jì)算12-14
  • 1.3 Xeon Phi協(xié)處理器14-16
  • 1.3.1 架構(gòu)概要14-15
  • 1.3.2 編程模型15-16
  • 1.4 性能分析16-17
  • 1.5 相關(guān)研究工作17-18
  • 1.6 研究目的18-20
  • 第二章 Knight Corner微架構(gòu)的分析與研究20-28
  • 2.1 架構(gòu)綜述20-22
  • 2.1.1 核芯技術(shù)20-21
  • 2.1.2 向量處理單元21-22
  • 2.1.3 眾核互聯(lián)技術(shù)22
  • 2.2 存儲(chǔ)架構(gòu)22-26
  • 2.2.1 緩存機(jī)制23-25
  • 2.2.2 內(nèi)存帶寬25-26
  • 2.3 線程模型26-28
  • 第三章 基于KNC架構(gòu)的 3D-EW算法性能分析28-34
  • 3.1 性能分析工具28-30
  • 3.2 線程級(jí)并行30
  • 3.3 數(shù)據(jù)級(jí)并行30-31
  • 3.4 指令級(jí)并行31-32
  • 3.5 緩存使用情況32-34
  • 第四章 基于KNC架構(gòu)的 3D-EW算法性能優(yōu)化34-48
  • 4.1 線程級(jí)優(yōu)化34-37
  • 4.1.1 熱點(diǎn)分析34-36
  • 4.1.2 Open MP并行化36-37
  • 4.2 數(shù)據(jù)級(jí)優(yōu)化37-43
  • 4.2.1 數(shù)據(jù)對(duì)齊37-38
  • 4.2.2 SIMD38-40
  • 4.2.3 數(shù)據(jù)局部性40
  • 4.2.4 數(shù)據(jù)預(yù)取40-43
  • 4.3 指令級(jí)優(yōu)化43-46
  • 4.3.1 C intrinsic編程43-44
  • 4.3.2 FMA44-45
  • 4.3.3 gather/scatter45-46
  • 4.4 緩存使用優(yōu)化46-48
  • 第五章 實(shí)驗(yàn)結(jié)果與分析48-54
  • 5.1 實(shí)驗(yàn)環(huán)境48-49
  • 5.1.1 硬件環(huán)境48
  • 5.1.2 軟件環(huán)境48-49
  • 5.2 實(shí)驗(yàn)結(jié)果49-50
  • 5.3 實(shí)驗(yàn)分析50-54
  • 第六章 總結(jié)與展望54-56
  • 6.1 總結(jié)54-55
  • 6.2 未來(lái)工作的展望55-56
  • 參考文獻(xiàn)56-60
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄60-62

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條

1 陳祖銀;王用軍;彭達(dá);;彈性波波場(chǎng)分離數(shù)值模擬[J];中國(guó)石油勘探;2014年06期

2 馬德堂,朱光明;彈性波波場(chǎng)P波和S波分解的數(shù)值模擬[J];石油地球物理勘探;2003年05期

,

本文編號(hào):716944

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/716944.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶795cd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
一区二区三区日韩经典| 成年女人下边潮喷毛片免费| 国产精品视频一区麻豆专区| 欧美精品日韩精品一区| 天堂热东京热男人天堂| 国产午夜在线精品视频| 日本少妇三级三级三级| 欧美成人精品国产成人综合| 日韩中文无线码在线视频| 日本免费一本一二区三区| 亚洲视频一区二区久久久| 国产91人妻精品一区二区三区| 欧美激情一区=区三区| 久久热在线视频免费观看| 伊人色综合久久伊人婷婷| 一区二区三区四区亚洲专区| 日本免费一区二区三女| 亚洲av又爽又色又色| 99久久精品国产麻豆| 日本欧美一区二区三区就| 中国一区二区三区人妻| 日韩精品一区二区三区四区 | 91在线爽的少妇嗷嗷叫| 精品欧美一区二区三久久| 美国女大兵激情豪放视频播放| 国产性色精品福利在线观看| 热情的邻居在线中文字幕| 国内胖女人做爰视频有没有| 中国日韩一级黄色大片| 91久久精品国产成人| 国产精品一区二区视频大全| 亚洲少妇人妻一区二区| 中文字幕一区久久综合| 中日韩免费一区二区三区| 色婷婷国产精品视频一区二区保健| 欧美一级特黄特色大色大片| 中文字幕日韩欧美一区| 亚洲精品中文字幕欧美| 日韩欧美二区中文字幕| 邻居人妻人公侵犯人妻视频| 97人妻精品一区二区三区男同|