天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

面向科學(xué)計算流處理器的編譯存儲優(yōu)化技術(shù)研究

發(fā)布時間:2021-04-20 10:42
  流處理器以其強大的計算能力、較低的功耗和靈活的可編程性,成為當(dāng)前高效能計算系統(tǒng)定制加速部件的主要選擇之一,已成功運用于2008年TOP500排名第一的IBM Roadrunner系統(tǒng)。然而,原本面向多媒體領(lǐng)域開發(fā)的流編譯器,在處理數(shù)據(jù)依賴關(guān)系更加復(fù)雜的科學(xué)計算應(yīng)用時,表現(xiàn)出較差的適應(yīng)性,對流存儲系統(tǒng)特征的利用十分有限,致使存儲墻問題更為嚴(yán)重,成為制約其性能發(fā)揮的瓶頸。因此,研究面向科學(xué)計算流處理器的編譯存儲優(yōu)化技術(shù)成為釋放流處理器強大計算能力,有效緩解存儲墻問題的關(guān)鍵。本文重點研究了如何通過編譯優(yōu)化技術(shù)來改善流處理器的存儲性能。流存儲系統(tǒng)包括三級存儲層次:本地寄存器文件(Local Register File,簡稱LRF)、流寄存器文件(Stream Register File,簡稱SRF)和片外存儲系統(tǒng)。優(yōu)化片上存儲器的局部性、隱藏訪存延遲和避免片上存儲器溢出,能有效改進流處理器性能。本文在分析了大量具有不同性能特征的科學(xué)計算流程序的訪存行為后,面向科學(xué)計算從優(yōu)化片上存儲器局部性、隱藏訪存延遲和避免SRF溢出等方面進行了深入的研究。本文的主要工作和創(chuàng)新如下:1.當(dāng)前流編譯器通過簇間通... 

【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁數(shù)】:180 頁

【學(xué)位級別】:博士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 課題研究背景
        1.1.1 高性能體系結(jié)構(gòu)發(fā)展趨勢
        1.1.2 高性能流計算模型及其存儲瓶頸分析
    1.2 課題研究重點
        1.2.1 基本概念
        1.2.2 LRF 局部性優(yōu)化
        1.2.3 SRF 局部性優(yōu)化
        1.2.4 隱藏訪存延遲優(yōu)化
        1.2.5 避免SRF 溢出的優(yōu)化
    1.3 相關(guān)研究工作
        1.3.1 面向傳統(tǒng)體系結(jié)構(gòu)存儲優(yōu)化的編譯技術(shù)
        1.3.2 已有的優(yōu)化流處理器存儲性能的編譯技術(shù)
    1.4 本文工作和創(chuàng)新
    1.5 章節(jié)組織
第二章 流科學(xué)計算概述及存儲瓶頸分析
    2.1 流、流編程模型和流體系結(jié)構(gòu)
        2.1.1 流
        2.1.2 流編程模型、編程語言及編譯器
        2.1.3 流體系結(jié)構(gòu)
    2.2 流科學(xué)計算的優(yōu)勢與存儲瓶頸分析
        2.2.1 流科學(xué)計算的優(yōu)勢
        2.2.2 存儲瓶頸分析
    2.3 典型科學(xué)計算應(yīng)用的流化及其存儲性能分析
        2.3.1 測試程序
        2.3.2 流化
        2.3.3 面向存儲性能的手工優(yōu)化
        2.3.4 性能評測
        2.3.5 結(jié)論
    2.4 本章小結(jié)
第三章 發(fā)掘簇間記錄復(fù)用的流轉(zhuǎn)置方法
    3.1 簇間記錄復(fù)用分析
    3.2 流的重組算法
    3.3 避免存儲體沖突的MBCA 算法
        3.3.1 流片外存儲系統(tǒng)
        3.3.2 SRO 算法與存儲體沖突
        3.3.3 MBCA 算法
    3.4 ST 方法及其編譯實現(xiàn)
    3.5 實驗建立和結(jié)果分析
    3.6 本章小結(jié)
第四章 發(fā)掘變界流完整復(fù)用的定界流替換方法
    4.1 問題提出與方法概述
        4.1.1 問題提出
        4.1.2 方法概述
    4.2 流完整復(fù)用的判別理論
        4.2.1 定義與假設(shè)
        4.2.2 流完整復(fù)用判別
    4.3 SRG 及其構(gòu)建算法
        4.3.1 構(gòu)建流有向無環(huán)圖的BSDAG 算法.
        4.3.2 構(gòu)建復(fù)用圖的BRG 算法
    4.4 SRG 的優(yōu)化
    4.5 流級程序的變換算法SLPT.
    4.6 SRF 壓力評估與緩解
    4.7 編譯實現(xiàn)與實驗評測
        4.7.1 編譯實現(xiàn)
        4.7.2 實驗評測
    4.8 相關(guān)工作
    4.9 本章小結(jié)
第五章 發(fā)掘變界流部分復(fù)用的擴展的定界流替換方法
    5.1 流部分復(fù)用
    5.2 方法概述
    5.3 流部分復(fù)用的判別理論
    5.4 SRG 的改進算法BPRE
    5.5 擴展的流級程序變換算法E-SLPT
    5.6 實驗建立與評測
        5.6.1 實驗建立
        5.6.2 評測結(jié)果
    5.7 本章小結(jié)
第六章 基于SRG 的SRF 資源分配沖突避免算法.
    6.1 SRF 資源分配沖突分析
    6.2 SRF 資源分配沖突避免算法SRFACA
        6.2.1 流片外存儲系統(tǒng)狀態(tài)評估
        6.2.2 算法實現(xiàn)
    6.3 編譯實現(xiàn)與實驗評測
        6.3.1 編譯框架
        6.3.2 實驗評測
    6.4 相關(guān)工作
    6.5 本章小結(jié)
第七章 基于SRG 自動確定塊大小的循環(huán)分塊算法
    7.1 問題提出
    7.2 自動確定塊大小的循環(huán)分塊算法
        7.2.1 循環(huán)分塊算法
        7.2.2 基于SRG 自動確定塊大小的算法
    7.3 編譯實現(xiàn)與實驗評測
        7.3.1 編譯實現(xiàn)
        7.3.2 實驗評測
    7.4 本章小結(jié)
結(jié)束語
致謝
參考文獻
攻讀博士學(xué)位期間已發(fā)表和待發(fā)表的主要學(xué)術(shù)論文
攻讀博士學(xué)位期間參加的主要科研工作


【參考文獻】:
期刊論文
[1]指令級并行編譯器的數(shù)據(jù)預(yù)取及優(yōu)化方法[J]. 連瑞琦,張兆慶,喬如良.  計算機學(xué)報. 2000(06)

碩士論文
[1]面向科學(xué)計算的流應(yīng)用開發(fā)與優(yōu)化[D]. 王桂彬.國防科學(xué)技術(shù)大學(xué) 2006



本文編號:3149527

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3149527.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶64e5d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com