天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

面向異構(gòu)多核處理器并行化編譯中的數(shù)據(jù)優(yōu)化

發(fā)布時(shí)間:2017-09-19 16:16

  本文關(guān)鍵詞:面向異構(gòu)多核處理器并行化編譯中的數(shù)據(jù)優(yōu)化


  更多相關(guān)文章: 異構(gòu)多核處理器 并行化編譯 OpenACC 數(shù)據(jù)優(yōu)化 循環(huán)分塊 分塊交叉?zhèn)鬏?/b>


【摘要】:近年來,異構(gòu)多核處理器迅速發(fā)展,并已逐漸應(yīng)用于高性能計(jì)算領(lǐng)域。異構(gòu)多核處理器在單芯片上集成了不同結(jié)構(gòu)的處理器核,可以將不同類型的任務(wù)分配給不同的處理器核,執(zhí)行任務(wù)更有效率,可以更優(yōu)的利用資源。但同時(shí)也帶來了更多挑戰(zhàn),比如編程問題、性能優(yōu)化問題。這些問題的解決,是發(fā)揮異構(gòu)多核處理器的性能優(yōu)勢(shì)的關(guān)鍵。運(yùn)用并行化編譯技術(shù)是解決編程和性能問題的一條有效途徑。本課題選擇OpenACC作為異構(gòu)多核處理器的編程模型,基于Open64開發(fā)了一個(gè)面向異構(gòu)多核處理器的“源-源”并行化編譯系統(tǒng)Auto-ACC,用于實(shí)現(xiàn)OpenACC并行程序的自動(dòng)生成。異構(gòu)多核處理器通常有多層次的存儲(chǔ)系統(tǒng),數(shù)據(jù)的存儲(chǔ)和傳輸優(yōu)化是面向異構(gòu)多核處理器并行化編譯中的關(guān)鍵技術(shù)。本文對(duì)數(shù)據(jù)優(yōu)化進(jìn)行了深入的研究,主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)有:(1)完善了面向異構(gòu)多核處理器的數(shù)據(jù)優(yōu)化架構(gòu)。基于數(shù)據(jù)優(yōu)化架構(gòu)中已有的數(shù)組分塊方法,設(shè)計(jì)并實(shí)現(xiàn)了循環(huán)分塊優(yōu)化方法,有效改善了原有數(shù)組分塊方法在訪問數(shù)組較多且訪問方式復(fù)雜時(shí)復(fù)雜度高的問題,而且可以有效改善程序的數(shù)據(jù)局部性。并在數(shù)據(jù)優(yōu)化架構(gòu)中設(shè)計(jì)并實(shí)現(xiàn)了分塊交叉數(shù)據(jù)傳輸方式,使數(shù)據(jù)傳輸更加準(zhǔn)確高效。(2)提出了面向異構(gòu)多核處理器的循環(huán)分塊方法。循環(huán)分塊是提高程序數(shù)據(jù)局部性的常用方法,本文提出的循環(huán)分塊方法通過在程序中添加編譯指示實(shí)現(xiàn),跟以往的基于程序變換的分塊方法相比,無需進(jìn)行復(fù)雜的程序數(shù)據(jù)依賴關(guān)系分析,更加簡(jiǎn)單高效,而且也不需要嵌套循環(huán)是可置換循環(huán),使用范圍更廣。在此基礎(chǔ)上,提出了面向異構(gòu)多核處理器的循環(huán)分塊子句生成算法,并在Auto-ACC中進(jìn)行了實(shí)現(xiàn)。(3)實(shí)現(xiàn)了面向異構(gòu)多核處理器的分塊交叉數(shù)據(jù)傳輸。通過對(duì)OpenACC的數(shù)據(jù)拷貝子句進(jìn)行擴(kuò)展,實(shí)現(xiàn)了用OpenACC編譯指示指導(dǎo)的分塊交叉數(shù)據(jù)傳輸。并基于程序的多面體表示,在Auto-ACC中實(shí)現(xiàn)了擴(kuò)展數(shù)據(jù)拷貝子句的自動(dòng)生成。分塊交叉數(shù)據(jù)傳輸能夠在循環(huán)分塊的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)塊更加精確的傳輸,提高了設(shè)備內(nèi)存的利用率并減少了冗余的數(shù)據(jù)傳輸。本文提出的相關(guān)數(shù)據(jù)優(yōu)化方法已在Auto-ACC系統(tǒng)中實(shí)現(xiàn),測(cè)試結(jié)果表明了方法的有效性。
【關(guān)鍵詞】:異構(gòu)多核處理器 并行化編譯 OpenACC 數(shù)據(jù)優(yōu)化 循環(huán)分塊 分塊交叉?zhèn)鬏?/strong>
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP332;TP314
【目錄】:
  • 摘要4-5
  • Abstract5-12
  • 第一章 緒論12-26
  • 1.1 異構(gòu)多核處理器12-15
  • 1.1.1 異構(gòu)多核處理器的發(fā)展12-13
  • 1.1.2 異構(gòu)體系結(jié)構(gòu)13-14
  • 1.1.3 異構(gòu)多核處理器面臨的挑戰(zhàn)14-15
  • 1.2 Open ACC編程模型15-19
  • 1.2.1 異構(gòu)編程模型15-16
  • 1.2.2 Open ACC編程模型概述16-17
  • 1.2.3 Open ACC執(zhí)行模型17
  • 1.2.4 Open ACC存儲(chǔ)模型17-18
  • 1.2.5 Open ACC程序編譯流程18-19
  • 1.3 并行化編譯19
  • 1.4 課題來源19-20
  • 1.5 Auto-ACC并行編譯系統(tǒng)20-22
  • 1.6 研究?jī)?nèi)容22
  • 1.7 論文組織結(jié)構(gòu)22-23
  • 1.8 基本術(shù)語23-26
  • 第二章 面向異構(gòu)多核處理器的數(shù)據(jù)優(yōu)化架構(gòu)26-36
  • 2.1 相關(guān)研究26-27
  • 2.2 數(shù)據(jù)流分析27-30
  • 2.2.1 定義-使用圖27-28
  • 2.2.2 局部數(shù)據(jù)流分析28
  • 2.2.3 全局?jǐn)?shù)據(jù)流分析28-29
  • 2.2.4 過程間數(shù)據(jù)流分析29-30
  • 2.3 數(shù)據(jù)優(yōu)化架構(gòu)30-35
  • 2.3.1 數(shù)組轉(zhuǎn)置31-33
  • 2.3.2 數(shù)據(jù)傳輸合并33-34
  • 2.3.3 數(shù)據(jù)緩存34-35
  • 2.4 本章小結(jié)35-36
  • 第三章 面向異構(gòu)多核處理器的循環(huán)分塊36-48
  • 3.1 問題的提出36
  • 3.2 相關(guān)研究36-37
  • 3.3 循環(huán)分塊子句的引入37-39
  • 3.4 循環(huán)分塊子句生成算法39-44
  • 3.4.1 問題的數(shù)學(xué)模型39-40
  • 3.4.2 數(shù)據(jù)重用40-43
  • 3.4.3 算法的具體實(shí)現(xiàn)43-44
  • 3.5 實(shí)例分析44-46
  • 3.6 本章小結(jié)46-48
  • 第四章 面向異構(gòu)多核處理器的分塊交叉數(shù)據(jù)傳輸48-62
  • 4.1 研究基礎(chǔ)48
  • 4.2 分塊交叉的數(shù)據(jù)傳輸48-54
  • 4.2.1 Open ACC數(shù)據(jù)拷貝子句49
  • 4.2.2 分塊規(guī)則數(shù)組區(qū)域49-50
  • 4.2.3 分塊交叉數(shù)據(jù)傳輸50-54
  • 4.3 擴(kuò)展數(shù)據(jù)拷貝子句的自動(dòng)生成54-60
  • 4.3.1 多面體模型程序表示54-55
  • 4.3.2 單個(gè)數(shù)組引用的分塊規(guī)則數(shù)組區(qū)域求解55-56
  • 4.3.3 分塊規(guī)則數(shù)組區(qū)域的合并運(yùn)算56-59
  • 4.3.4 數(shù)據(jù)拷貝子句的生成59-60
  • 4.4 本章小結(jié)60-62
  • 第五章 測(cè)試與實(shí)驗(yàn)分析62-70
  • 5.1 測(cè)試環(huán)境和測(cè)試程序62-64
  • 5.1.1 硬件平臺(tái)62-63
  • 5.1.2 軟件環(huán)境63
  • 5.1.3 測(cè)試用例63-64
  • 5.2 循環(huán)分塊測(cè)試64-66
  • 5.2.1 測(cè)試方法64
  • 5.2.2 分塊方案測(cè)試64
  • 5.2.3 不同規(guī)模測(cè)試64-65
  • 5.2.4 加速比提升測(cè)試65-66
  • 5.3 分塊交叉?zhèn)鬏敎y(cè)試66-67
  • 5.3.1 測(cè)試方法66
  • 5.3.2 分塊交叉?zhèn)鬏斝Ч麥y(cè)試66
  • 5.3.3 自動(dòng)生成方法測(cè)試66-67
  • 5.4 整體性能測(cè)試67-68
  • 5.4.1 測(cè)試方法68
  • 5.4.3 測(cè)試結(jié)果68
  • 5.5 本章小結(jié)68-70
  • 第六章 結(jié)論70-72
  • 一、工作總結(jié)70
  • 二、展望與計(jì)劃70-72
  • 致謝72-74
  • 參考文獻(xiàn)74-78
  • 作者簡(jiǎn)歷78

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前6條

1 劉曉嫻;黃品豐;;面向異構(gòu)系統(tǒng)的OpenMP程序自動(dòng)生成[J];信息工程大學(xué)學(xué)報(bào);2012年04期

2 曹倩;胡長(zhǎng)軍;張?jiān)菩?朱于畋;;一種面向非規(guī)則引用的Cell多核處理器自適應(yīng)Cache行策略[J];計(jì)算機(jī)學(xué)報(bào);2011年05期

3 劉俊;劉志祥;;應(yīng)用Amdahl定律對(duì)多核處理器性能的分析[J];信息技術(shù);2010年06期

4 張春元;文梅;伍楠;任巨;管茂林;何義;;流體系結(jié)構(gòu)技術(shù)發(fā)展探討[J];國防科技大學(xué)學(xué)報(bào);2009年05期

5 杜靜;敖富江;唐滔;楊學(xué)軍;;流處理器上基于參數(shù)模型的長(zhǎng)流分段技術(shù)[J];軟件學(xué)報(bào);2009年09期

6 銀波;徐典;安亦然;陳耀松;;Aerodynamic optimization of 3D wing based on iSIGHT[J];Applied Mathematics and Mechanics(English Edition);2008年05期

,

本文編號(hào):882639


本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/882639.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶88c19***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com