基于3D-EW算法的Intel KNC架構(gòu)下的性能分析與調(diào)優(yōu)
發(fā)布時(shí)間:2017-08-22 04:08
本文關(guān)鍵詞:基于3D-EW算法的Intel KNC架構(gòu)下的性能分析與調(diào)優(yōu)
更多相關(guān)文章: XeonPhi 高性能計(jì)算 性能優(yōu)化
【摘要】:在地球物理的研究過(guò)程中,由于彈性波波場(chǎng)攜帶著與地下介質(zhì)性質(zhì)相關(guān)的大量信息,所以一直以來(lái)是個(gè)重要的研究領(lǐng)域。在實(shí)際的工業(yè)生產(chǎn)過(guò)程中,利用計(jì)算機(jī)對(duì)于彈性波波場(chǎng)進(jìn)行數(shù)值模擬更是地震預(yù)測(cè)和石油勘探等領(lǐng)域中的一項(xiàng)重要技術(shù)。在其數(shù)值模擬過(guò)程中,針對(duì)混合波場(chǎng)的三維縱橫波波場(chǎng)分離問(wèn)題的數(shù)值模擬算法3D-EW(3D pure P and S wave elastic wave equation modelling)需要大量的迭代計(jì)算過(guò)程,屬于計(jì)算密集型問(wèn)題。本文從異構(gòu)并行計(jì)算的角度出發(fā),首先將3D-EW算法通過(guò)線程級(jí)并行編程模型OpenMP成功地移植到Intel眾核(Many Integrated Core)架構(gòu)協(xié)處理器平臺(tái)上,相較運(yùn)行在Intel Xeon處理器平臺(tái)上的串行版本實(shí)現(xiàn)了3.7倍的加速比。通過(guò)針對(duì)眾核協(xié)處理器平臺(tái)的Knights Corner微架構(gòu)的研究,總結(jié)該架構(gòu)的潛在性能瓶頸以及架構(gòu)設(shè)計(jì)特性。在實(shí)驗(yàn)過(guò)程中,結(jié)合性能分析工具的性能指標(biāo)測(cè)試和分析,基于傳統(tǒng)的處理器調(diào)優(yōu)技巧,進(jìn)一步地歸納了基于Knights Corner架構(gòu)的數(shù)據(jù)級(jí)和指令級(jí)并行的性能優(yōu)化技巧。發(fā)現(xiàn)了KNC架構(gòu)下的計(jì)算性能與向量化程度以及緩存性能的緊密關(guān)系,進(jìn)而采用C intrinsic的底層接口改寫(xiě)代碼增強(qiáng)程序的向量化程度,使用cache blocking技術(shù)提高數(shù)據(jù)局部性。最終將3D-EW算法在Intel5110P協(xié)處理器上的加速比提高至17.7倍,從而顯著提升了程序運(yùn)行效率。同時(shí)也為更多應(yīng)用在Knights Corner架構(gòu)下的性能調(diào)優(yōu)提供了參考。
【關(guān)鍵詞】:XeonPhi 高性能計(jì)算 性能優(yōu)化
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:P631.4
【目錄】:
- 摘要3-4
- ABSTRACT4-10
- 第一章 研究背景10-20
- 1.1 彈性波波場(chǎng)問(wèn)題10-12
- 1.1.1 三維彈性波10
- 1.1.2 波場(chǎng)分離10
- 1.1.3 3D-EW算法10-12
- 1.2 高性能計(jì)算12-14
- 1.3 Xeon Phi協(xié)處理器14-16
- 1.3.1 架構(gòu)概要14-15
- 1.3.2 編程模型15-16
- 1.4 性能分析16-17
- 1.5 相關(guān)研究工作17-18
- 1.6 研究目的18-20
- 第二章 Knight Corner微架構(gòu)的分析與研究20-28
- 2.1 架構(gòu)綜述20-22
- 2.1.1 核芯技術(shù)20-21
- 2.1.2 向量處理單元21-22
- 2.1.3 眾核互聯(lián)技術(shù)22
- 2.2 存儲(chǔ)架構(gòu)22-26
- 2.2.1 緩存機(jī)制23-25
- 2.2.2 內(nèi)存帶寬25-26
- 2.3 線程模型26-28
- 第三章 基于KNC架構(gòu)的 3D-EW算法性能分析28-34
- 3.1 性能分析工具28-30
- 3.2 線程級(jí)并行30
- 3.3 數(shù)據(jù)級(jí)并行30-31
- 3.4 指令級(jí)并行31-32
- 3.5 緩存使用情況32-34
- 第四章 基于KNC架構(gòu)的 3D-EW算法性能優(yōu)化34-48
- 4.1 線程級(jí)優(yōu)化34-37
- 4.1.1 熱點(diǎn)分析34-36
- 4.1.2 Open MP并行化36-37
- 4.2 數(shù)據(jù)級(jí)優(yōu)化37-43
- 4.2.1 數(shù)據(jù)對(duì)齊37-38
- 4.2.2 SIMD38-40
- 4.2.3 數(shù)據(jù)局部性40
- 4.2.4 數(shù)據(jù)預(yù)取40-43
- 4.3 指令級(jí)優(yōu)化43-46
- 4.3.1 C intrinsic編程43-44
- 4.3.2 FMA44-45
- 4.3.3 gather/scatter45-46
- 4.4 緩存使用優(yōu)化46-48
- 第五章 實(shí)驗(yàn)結(jié)果與分析48-54
- 5.1 實(shí)驗(yàn)環(huán)境48-49
- 5.1.1 硬件環(huán)境48
- 5.1.2 軟件環(huán)境48-49
- 5.2 實(shí)驗(yàn)結(jié)果49-50
- 5.3 實(shí)驗(yàn)分析50-54
- 第六章 總結(jié)與展望54-56
- 6.1 總結(jié)54-55
- 6.2 未來(lái)工作的展望55-56
- 參考文獻(xiàn)56-60
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄60-62
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 陳祖銀;王用軍;彭達(dá);;彈性波波場(chǎng)分離數(shù)值模擬[J];中國(guó)石油勘探;2014年06期
2 馬德堂,朱光明;彈性波波場(chǎng)P波和S波分解的數(shù)值模擬[J];石油地球物理勘探;2003年05期
,本文編號(hào):716944
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/716944.html
最近更新
教材專(zhuān)著