天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

UPPA:面向異構(gòu)眾核系統(tǒng)的統(tǒng)一并行編程架構(gòu)

發(fā)布時間:2024-06-01 06:05
  主流異構(gòu)并行編程方法如CUDA和OpenCL,其編程抽象層次低,編程接口靠近底層,無法為用戶屏蔽底層硬件和運行時細(xì)節(jié),導(dǎo)致編程邏輯復(fù)雜,編程困難易錯.同時應(yīng)用性能綁定于底層運行時環(huán)境,在硬件架構(gòu)變化時需要根據(jù)硬件特征進行針對性改動和優(yōu)化,無法保證上層應(yīng)用的統(tǒng)一.為了簡化異構(gòu)并行編程,提高編程效率,實現(xiàn)上層應(yīng)用的統(tǒng)一和跨平臺,本文提出了一種面向異構(gòu)眾核系統(tǒng)的高層統(tǒng)一并行編程架構(gòu)UPPA(Unified Parallel Programming Architecture).架構(gòu)中首先提出了數(shù)據(jù)關(guān)聯(lián)計算編程模型,實現(xiàn)了不同層級不同模式并行性的統(tǒng)一描述,簡化了異構(gòu)并行編程邏輯,提供了高層統(tǒng)一的并行編程抽象;繼而設(shè)計了數(shù)據(jù)關(guān)聯(lián)計算描述語言為用戶提供簡便易用的統(tǒng)一編程接口,通過高層語義結(jié)構(gòu)保留了應(yīng)用的并行特征,可以指導(dǎo)編譯和運行時系統(tǒng)實現(xiàn)向不同硬件架構(gòu)的自動映射,保證了上層應(yīng)用的統(tǒng)一,并采用C語言兼容的語法提供針對高層語義結(jié)構(gòu)的語言擴展,保證編程接口的易學(xué)易用;最后提供了基于OpenCL的編譯和運行時原型系統(tǒng),以O(shè)penCL為中間語言實現(xiàn)了高層應(yīng)用在不同異構(gòu)系統(tǒng)上的執(zhí)行,提供了良好的跨平臺特性.我...

【文章頁數(shù)】:20 頁

【文章目錄】:
1 引言
2 相關(guān)工作
3 高層統(tǒng)一的并行編程抽象
    3.1 數(shù)據(jù)關(guān)聯(lián)計算編程模型
    3.2 運行時無關(guān)的統(tǒng)一并行表達
    3.3 編程模型應(yīng)用示例
4 統(tǒng)一的并行編程接口
    4.1 數(shù)據(jù)
    4.2 計算
    4.3 關(guān)聯(lián)結(jié)構(gòu)
    4.4 數(shù)據(jù)關(guān)聯(lián)計算表達式
    4.5 矩陣相乘實現(xiàn)示例
5 跨平臺的編譯與運行時原型系統(tǒng)
    5.1 運行時接口
    5.2 編譯過程
        5.2.1 內(nèi)核生成
        5.2.2 主機端文件生成
    5.3 執(zhí)行管理
        5.3.1 線程映射
        5.3.2 數(shù)據(jù)管理
        5.3.3 同步操作
6 實驗測試
    6.1 基于數(shù)據(jù)關(guān)聯(lián)計算方法的測試用例重構(gòu)
        (1)SGEMM
        (2)SpMV
        (3)Stencil
        (4)Histo
        (5)BFS
        (6)NN
        (7)Kmeans
    6.2 代碼量對比
    6.3 跨平臺可移植性分析
7 結(jié)論與未來工作
Background



本文編號:3985530

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3985530.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fbe75***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com