天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

OpenACC 2.0性能可移植性分析

發(fā)布時(shí)間:2021-09-17 16:48
  在高性能計(jì)算領(lǐng)域,應(yīng)用的性能可以伴隨著處理器的“摩爾定律”而提升,編程者不需要改寫代碼便能獲得處理器性能提升所帶來(lái)的“免費(fèi)午餐”,F(xiàn)如今這一趨勢(shì)已經(jīng)由于主頻的功耗瓶頸而無(wú)法延續(xù)下去,于是在高性能計(jì)算中興起了采用加速器的異構(gòu)并行計(jì)算實(shí)現(xiàn)計(jì)算性能的進(jìn)一步提升。Open ACC是一種基于指導(dǎo)語(yǔ)句的異構(gòu)并行編程標(biāo)準(zhǔn),能使編程者脫離異構(gòu)加速器的復(fù)雜底層架構(gòu)進(jìn)行編程,簡(jiǎn)化了異構(gòu)并行的難度。此外,Open ACC編譯器能通過(guò)這一高層的編程模型生成不同平臺(tái)上的并行代碼,從而使采用Open ACC編寫的應(yīng)用具備了優(yōu)良的跨平臺(tái)性。在Top500榜單上的不少超級(jí)計(jì)算機(jī)都已大量采用異構(gòu)并行計(jì)算作為其性能的來(lái)源,例如天河二號(hào)、Titan和TSUBAME 2.5。高性能計(jì)算的應(yīng)用開發(fā)者面臨著在采用不同加速器設(shè)備的超級(jí)計(jì)算機(jī)上需要編寫不同的代碼進(jìn)行并行計(jì)算,例如CUDA、Open CL和Open MP。而Open ACC則基于上述的優(yōu)點(diǎn),成為解決這一問(wèn)題的一種簡(jiǎn)便方法。本文主要針對(duì)Open ACC在NVIDIA Kepler架構(gòu)的GPU和Intel Knights Corner架構(gòu)的協(xié)處理器上的應(yīng)用性能可移植性進(jìn)行... 

【文章來(lái)源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:90 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
List of Abbreviations
第一章 Introduction
    1.1 High Performance Computing (HPC)
    1.2 Problem de?nition
        1.2.1 Portability
        1.2.2 Productivity
        1.2.3 Performance
    1.3 Objectives
    1.4 Summary of contributions
    1.5 Related works
        1.5.1 The investigated work on GPU
        1.5.2 The investigated work on MIC and a Hybrid system
第二章 Programming in Heterogeneous System
    2.1 The Architectures for Heterogeneous System
        2.1.1 Graphics Processing Units (GPUs)
        2.1.2 Intel Many Integrated Core (MIC)
    2.2 Programming languages and frameworks
        2.2.1 Parallel Thread Execution (PTX)
        2.2.2 Open ACC
        2.2.3 What is HMPP Codelet and how to get HMPP codelet, PTX,and MIC machine code files
        2.2.4 Comparison of Open ACC and low-level programming model
        2.2.5 Open ACC 2.0
第三章 Methodologies and Tuning techniques
    3.1 Open CL optimization
    3.2 Open ACC optimizations
        3.2.1 Independent optimization
        3.2.2 Directive organize optimization
        3.2.3 ILP optimization
        3.2.4 Grid Thread Mapping optimization
        3.2.5 Compiler ?ags
        3.2.6 Tiling optimization
第四章 Experimental setup
    4.1 Testbed machine
        4.1.1 π Supercomputer
    4.2 Banchmarks
        4.2.1 Rodinia benchmark suite and selected benchmarks
        4.2.2 Hydro Benchmark
        4.2.3 EPCC Benchmark
    4.3 Pro?ling tools
第五章 Results and Discussion
    5.1 Discussion of each optimizations
        5.1.1 Directive organize optimization and Simple restructuring
        5.1.2 Independent optimization
        5.1.3 ILP optimizations
        5.1.4 Grid thread mapping optimization
        5.1.5 Tiling optimization
        5.1.6 Compiler ?ags
    5.2 Analyze each applications
        5.2.1 Breadth First Search (BFS)
        5.2.2 Gaussian Elimination (GE)
        5.2.3 Back Propagation (BP)
        5.2.4 LU Decomposition (LUD)
        5.2.5 Hydro Benchmark
第六章 Conclusion
第七章 Future Work
參考文獻(xiàn)
Publication



本文編號(hào):3399127

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3399127.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d6f44***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
精品高清美女精品国产区| 国产精品偷拍一区二区| 午夜亚洲精品理论片在线观看| 国产免费一区二区不卡| 亚洲国产婷婷六月丁香| 国产超薄黑色肉色丝袜| 欧洲自拍偷拍一区二区| av在线免费观看一区二区三区| 国产精品久久精品国产| 精品日韩国产高清毛片| 国产精品午夜性色视频| 中文字幕日韩无套内射| 国产亚洲欧美日韩国亚语| 观看日韩精品在线视频| 国产二级一级内射视频播放| 国产剧情欧美日韩中文在线| 青青草草免费在线视频| 黄色激情视频中文字幕| 国内自拍偷拍福利视频| 日本亚洲精品在线观看| 日本不卡一本二本三区| 国产白丝粉嫩av在线免费观看| 亚洲一区二区三区四区性色av| 精品一区二区三区中文字幕| 国产精品亚洲精品亚洲| 国产精品美女午夜视频| 久久国内午夜福利直播| 自拍偷拍一区二区三区| 亚洲国产丝袜一区二区三区四| 欧美日本精品视频在线观看| 东京热电东京热一区二区三区| 国产熟女一区二区精品视频| 大香蕉久久精品一区二区字幕| 久久综合亚洲精品蜜桃| 又大又长又粗又黄国产| 午夜资源在线观看免费高清| 国产色偷丝袜麻豆亚洲| 一区二区欧美另类稀缺| 欧美精品久久99九九| 国产传媒欧美日韩成人精品| 欧美日韩中国性生活视频|