天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

異構平臺上協(xié)同計算的相關研究

發(fā)布時間:2023-04-02 14:33
  近年來,高性能計算機體系結構的發(fā)展日新月異,其中基于GPU的異構體系結構成為一種主流的設計方法。相比傳統(tǒng)的同構多處理機系統(tǒng),集成CPU和GPU的異構系統(tǒng)能夠提供更好的計算性能和功耗效率,非常適合處理數(shù)據(jù)并行應用,在工業(yè)制造、生物醫(yī)藥、石油物探、氣象預測等領域有著廣泛的應用前景。目前,限制異構計算的瓶頸在于異構編程環(huán)境仍不夠成熟,如何高效地利用異構系統(tǒng)中多核CPU和眾核GPU進行協(xié)同計算是目前高性能計算領域中研究的熱點和難點問題。 MD5 Crypt破解算法和Lared-P激光等離子體模擬算法是兩道典型的數(shù)據(jù)并行程序,分別在信息安全和物理模型模擬領域有著十分重要的應用價值。這兩個應用代表了兩類典型的數(shù)據(jù)并行應用:MD5 Crypt破解算法在并行求解過程中數(shù)據(jù)相互獨立不相關;Lared-P算法則在并行求解過程中存在十分復雜的數(shù)據(jù)相關。本文針對這兩類應用對異構系統(tǒng)上CPU和GPU的協(xié)同計算進行了研究。主要取得了如下成果: (1)采用了一種基于MPI-OpenMP-CUDA混合編程模型實現(xiàn)了異構系統(tǒng)上的的協(xié)同計算。使用MPI編程接口實現(xiàn)同構節(jié)點之間的協(xié)作;采用OpenMP實現(xiàn)節(jié)點內(nèi)CPU和GP...

【文章頁數(shù)】:72 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 引言
    1.1 課題背景
        1.1.1 異構體系結構
        1.1.2 數(shù)據(jù)并行應用
    1.2 研究現(xiàn)狀
        1.2.1 MD5 Crypt 破解算法的相關研究
        1.2.2 Lared-P 程序的相關研究
        1.2.3 異構平臺上的相關研究
    1.3 本文研究內(nèi)容與主要工作
    1.4 本文結構
第二章 背景知識
    2.1 異構系統(tǒng)
        2.1.1 GPU 系統(tǒng)結構
        2.1.2 GPU 編程模型
        2.1.3 基于GPU 的異構系統(tǒng)
    2.2 MD5 Crypt 破解算法
        2.2.1 MD5 加密算法
        2.2.2 MD5 Crypt 算法
        2.2.3 MD5 Crypt 算法的暴力破解
    2.3 Lared-P 應用
        2.3.1 Lared-P 算法簡介
        2.3.2 粒子運動方程
        2.3.3 粒子云方程
    2.4 本章小結
第三章 MD5 Crypt 破解算法在異構系統(tǒng)上的協(xié)同計算
    3.1 基于MPI-OpenMP-CUDA 的層次化設計方法
    3.2 大規(guī)模異構系統(tǒng)上MD5 Crypt 破解算法的設計
        3.2.1 破解算法的層次化設計方法
        3.2.2 并行破解算法中的任務劃分
    3.3 GPU 平臺上的實現(xiàn)與優(yōu)化
        3.3.1 破解算法在GPU 平臺上的實現(xiàn)
        3.3.2 MD5 Crypt 算法在GPU 平臺上的性能優(yōu)化
    3.4 CPU 與GPU 之間的協(xié)同計算
    3.5 大規(guī)模節(jié)點間的擴展
    3.6 本章小結
第四章 Lared-P 算法在異構系統(tǒng)上的協(xié)同計算
    4.1 Lared-P 算法中的數(shù)據(jù)相關分析
    4.2 多核CPU 上的并行實現(xiàn)
    4.3 GPU 上的并行實現(xiàn)
        4.3.1 基于SIMT 的并行方案
        4.3.2 八色分解方案
        4.3.3 數(shù)據(jù)組織與共享
    4.4 CPU 與GPU 之間的協(xié)同計算
        4.4.1 數(shù)據(jù)傳輸優(yōu)化
        4.4.2 多進程共享GPU
        4.4.3 任務劃分與映射
    4.5 本章小結
第五章 性能評測
    5.1 實驗環(huán)境
    5.2 MD5 Crypt 破解算法性能評測
        5.2.1 GPU 程序的測試結果
        5.2.2 單個節(jié)點內(nèi)的測試結果
        5.2.3 多個節(jié)點上的測試結果
    5.3 Lared-P 程序性能評測
        5.3.1 GPU 程序的測試結果
        5.3.2 單個節(jié)點內(nèi)的測試結果
    5.4 本章小結
第六章 結束語
    6.1 工作總結
    6.2 進一步的工作
致謝
參考文獻
作者在學期間取得的學術成果



本文編號:3779393

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3779393.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶1c9c7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com