天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于峰值架構(gòu)的跨平臺(tái)編譯器分析優(yōu)化技術(shù)研究

發(fā)布時(shí)間:2021-07-28 12:00
  近年來,由于國內(nèi)外半導(dǎo)體行業(yè)的發(fā)展,國內(nèi)在芯片領(lǐng)域上的發(fā)展方興未艾。因?yàn)橛布夹g(shù)的蓬勃發(fā)展,傳統(tǒng)芯片和人工智能芯片的種類豐富多彩,傳統(tǒng)編譯器已向定制化編譯器發(fā)展。編譯器是計(jì)算機(jī)平臺(tái)與應(yīng)用程序之間的橋梁,編譯器依據(jù)機(jī)器平臺(tái)的參數(shù)信息將應(yīng)用程序源碼正確且高效地編譯轉(zhuǎn)換成為可執(zhí)行程序。在編譯過程中,常常會(huì)疊加不同的優(yōu)化選項(xiàng)對(duì)應(yīng)用程序做不同的優(yōu)化處理。編譯器的優(yōu)化能力受機(jī)器平臺(tái)參數(shù)和自身編譯器架構(gòu)特征的影響。在編譯器優(yōu)化工作中,以編譯器與機(jī)器平臺(tái)形成的架構(gòu)組合為分析的基礎(chǔ)對(duì)象。由于編譯器優(yōu)化工作的難度,在以往工作中常常弱化參照架構(gòu)組合的選擇。但只有多架構(gòu)組合情況下才能為目標(biāo)編譯器優(yōu)化提供最大可能的性能提升空間。但是增加架構(gòu)組合數(shù)量,往往會(huì)使測(cè)試任務(wù)量大、分析數(shù)據(jù)量多、優(yōu)化工作難。為此本文提出了一種基于峰值架構(gòu)的跨平臺(tái)編譯器分析技術(shù),以此技術(shù)減輕編譯器性能分析的工作量,減小編譯器優(yōu)化的工作難度。本論文的主要研究工作概括為以下幾個(gè)部分:(1)提出基于峰值架構(gòu)的跨平臺(tái)編譯器分析優(yōu)化技術(shù)。該技術(shù)通過二維動(dòng)態(tài)測(cè)試、峰值架構(gòu)分析、粗粒度優(yōu)勢(shì)優(yōu)化定位和細(xì)粒度核心差異化分析四個(gè)步驟詳細(xì)分析目標(biāo)編譯器與參照編譯... 

【文章來源】:西華師范大學(xué)四川省

【文章頁數(shù)】:58 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于峰值架構(gòu)的跨平臺(tái)編譯器分析優(yōu)化技術(shù)研究


多核處理器架構(gòu)圖

架構(gòu)圖,編譯器,平臺(tái),架構(gòu)


焦于編譯器自身,F(xiàn)有主流分析方法通過專注于某一款高性能編譯器來減輕分析壓力。業(yè)界主流芯片廠商均提供了適合自己芯片的商用高性能編譯器。如Intel公司所研發(fā)的icc編譯器以及AMD公司所研發(fā)的aocc編譯器均是這些尖端企業(yè)為自己的處理器產(chǎn)品打造的高性能、高標(biāo)準(zhǔn)的編譯器。它們是自己芯片架構(gòu)的最佳組合,同時(shí)它們也給業(yè)界同行提供了極佳的參照機(jī)會(huì)。例如基于安騰處理器的ORC編譯器將同期的商用編譯器ecc(icc編譯器的前身)與X86平臺(tái)作為參照編譯器[11],基于MIPS架構(gòu)的龍芯編譯器也將同期的icc編譯器作為參照編譯器。圖1-2Intel平臺(tái)和AMD平臺(tái)上SPECCPU2017定點(diǎn)測(cè)試Fig.1-2ThetestingofSPECspeed2017IntegerbenchmarksonIntelandAMDplatforms因此在以往編譯器優(yōu)化工作中,常常不得已選擇弱化架構(gòu)組合方案,因?yàn)闊o法承受跨架構(gòu)組合所引發(fā)的龐大的人工分析開銷。公式(1-1)對(duì)跨架構(gòu)編譯器分析的時(shí)間成本進(jìn)行了估算。結(jié)合平臺(tái)因素的編譯器分析需在平臺(tái)(platforms)、編譯器(compilers)以及性能分析選項(xiàng)(options)、測(cè)試集和測(cè)試時(shí)間(runtime)之間建立關(guān)系。其中,性能分析選項(xiàng)往往是引爆性能測(cè)試與分析的主因,通用編譯器的優(yōu)化模塊多達(dá)數(shù)百種[5],由此衍生出的性能分析的時(shí)間成本和復(fù)雜度是難以估量。如在Intel機(jī)器平臺(tái)對(duì)gcc和icc編譯器進(jìn)行4種常用選項(xiàng)內(nèi)聯(lián)(inline)、O2、O3、性能分析引導(dǎo)優(yōu)化(profiling)等分析,需要至少16(24)組實(shí)驗(yàn),每組SPECCPU2017完整測(cè)試(20個(gè)測(cè)試用例)需要至少12個(gè)小時(shí),這組實(shí)驗(yàn)就需要至少16

編譯器,目標(biāo)機(jī),預(yù)取,平臺(tái)


第1章前言5優(yōu)化選項(xiàng),即影響測(cè)試用例性能的關(guān)鍵優(yōu)化選項(xiàng);最后通過人工分析,借助編譯分析工具線性對(duì)比目標(biāo)編譯器與參照編譯器對(duì)測(cè)試用例源碼編譯出的中間文件或最終優(yōu)化之后的匯編碼指令文件,細(xì)粒度分析出核心的差異化,并提供切實(shí)可行的優(yōu)化方案,最終將優(yōu)化實(shí)施于目標(biāo)編譯器上,使其獲得實(shí)質(zhì)的性能提升。在理想性能區(qū)間的指引下,PFCA最終會(huì)使目標(biāo)編譯器獲益于更多架構(gòu)組合,逐步縮小與理想性能區(qū)間的差距。圖1-3Intel平臺(tái)上gcc、icc、aocc峰值測(cè)試Fig.1-3Thepeaktestingofthegcc、iccandaocccompilersontheIntelplatforms依據(jù)PFCA方法理論知識(shí)與實(shí)際編譯器分析優(yōu)化相結(jié)合,最終在目標(biāo)機(jī)器平臺(tái)上為目標(biāo)編譯器提供切實(shí)可行的優(yōu)化方向,并實(shí)現(xiàn)其中一個(gè)預(yù)取優(yōu)化方向點(diǎn)。預(yù)取優(yōu)化(PrefetchOptimization)從實(shí)現(xiàn)方式上可以分為硬件預(yù)取和軟件預(yù)取,從功能方式上主要分為指令預(yù)取和數(shù)據(jù)預(yù)取[12]。影響預(yù)取優(yōu)化的關(guān)鍵因素是發(fā)生預(yù)取的時(shí)間點(diǎn)和預(yù)取距離,做到及時(shí)、有效、低開銷是預(yù)取優(yōu)化的目標(biāo)。1.3本文主要貢獻(xiàn)根據(jù)上文所述的主要研究內(nèi)容,本文的主要?jiǎng)?chuàng)新點(diǎn)及貢獻(xiàn)包括如下幾點(diǎn):(1)提出一種基于優(yōu)勢(shì)選擇的跨架構(gòu)分析技術(shù)PFCA,它可以在多平臺(tái)與多編譯器構(gòu)成的多架構(gòu)組合下對(duì)編譯優(yōu)化技術(shù)進(jìn)行深入分析。(2)提出一種基于理想性能區(qū)間指導(dǎo)的性能分析方法,它通過對(duì)多架構(gòu)組合下的峰值性能進(jìn)行匯集,峰值架構(gòu)的數(shù)據(jù)與目標(biāo)編譯器數(shù)據(jù)之間的差距構(gòu)成理想性能差,代表了一個(gè)目標(biāo)編譯器切實(shí)可行的提升空間。(3)為目標(biāo)平臺(tái)上的目標(biāo)編譯器提供了多個(gè)準(zhǔn)確可行的優(yōu)化方向,并成功提升了其中一個(gè)預(yù)取優(yōu)化方向點(diǎn)的性能。

【參考文獻(xiàn)】:
期刊論文
[1]面向神威·太湖之光的國產(chǎn)異構(gòu)眾核處理器OpenCL編譯系統(tǒng)[J]. 伍明川,黃磊,劉穎,何先波,馮曉兵.  計(jì)算機(jī)學(xué)報(bào). 2018(10)
[2]GCC編譯器中循環(huán)數(shù)組預(yù)取優(yōu)化的實(shí)現(xiàn)及效果[J]. 董鈺山,李春江,徐穎.  計(jì)算機(jī)工程與應(yīng)用. 2016(06)
[3]面向媒體處理器可重定目標(biāo)編譯器的代碼生成[J]. 琚小明,張召,史冊(cè).  計(jì)算機(jī)工程. 2009(11)
[4]基于GCC的抽象語法樹對(duì)C++源程序結(jié)構(gòu)的分析[J]. 王相懂,張毅坤.  計(jì)算機(jī)工程與應(yīng)用. 2006(23)
[5]基于GCC的交叉編譯器研究與開發(fā)[J]. 馮鋼,鄭扣根.  計(jì)算機(jī)工程與設(shè)計(jì). 2004(11)
[6]動(dòng)態(tài)編譯技術(shù)研究[J]. 崔慧敏,戴桂蘭,王生原,張素琴.  計(jì)算機(jī)科學(xué). 2004(07)
[7]一個(gè)重建GCC抽象語法樹的方法[J]. 劉文偉,劉堅(jiān).  計(jì)算機(jī)工程與應(yīng)用. 2004(18)
[8]GCC的中間語言及后端信息的轉(zhuǎn)換[J]. 任珊虹,趙克佳,趙雄芳.  計(jì)算機(jī)工程與科學(xué). 1995(02)

碩士論文
[1]基于編譯實(shí)現(xiàn)微線程的故障檢測(cè)機(jī)制關(guān)鍵技術(shù)研究[D]. 趙千千.哈爾濱工業(yè)大學(xué) 2012



本文編號(hào):3307876

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3307876.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶77772***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com