天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

GPU上SM4算法并行實現(xiàn)

發(fā)布時間:2025-01-01 00:12
   密碼算法的運(yùn)算速度與算力成正比,一些學(xué)者通過提高CPU速度、使用硬件加密卡等方案提高密碼算法運(yùn)算速度。隨著圖形處理器(GPU)在高性能并行計算領(lǐng)域的廣泛應(yīng)用,國內(nèi)外學(xué)者已經(jīng)展開了基于GPU加速密碼運(yùn)算的研究,但這些研究基本都是基于DES、AES等國際公開算法的,針對國產(chǎn)商用密碼算法SM4的研究還較少。文章在深入研究GPU并行計算機(jī)制的基礎(chǔ)上,通過研究最優(yōu)明文數(shù)據(jù)塊、GPU存儲類型和線程塊對SM4加密的加速比問題,結(jié)合CPU與GPU的特性,提出一種GPU上并行SM4算法的最優(yōu)加解密方案。結(jié)果表明,當(dāng)明文數(shù)據(jù)塊小于8 KB時,加速比(Ep)小于1;明文數(shù)據(jù)塊大小為64 KB時,加速比開始大幅增加;明文數(shù)據(jù)塊大小為256 KB時,加速比達(dá)到最大。當(dāng)選擇常量存儲作為中間數(shù)據(jù)存儲時,加密速度有所提升,對于大數(shù)據(jù)量、高速運(yùn)算的需求來說,這種提升是很有必要的。最優(yōu)線程塊的大小為128~512(必須為32的倍數(shù))個線程數(shù)。實驗環(huán)境下,文章中實現(xiàn)的最優(yōu)GPU加密方案的速度為普通CPU加密方案速度的26倍。

【文章頁數(shù)】:8 頁

【文章目錄】:
0 引言
1 GPU結(jié)構(gòu)
2 SM4密碼算法
    2.1 輪密鑰生成
    2.2 輪函數(shù)F計算
    2.3 加密與解密運(yùn)算
3 基于CUDA的SM4并行計算設(shè)計
    3.1 并行方案
    3.2 CUDA并行實現(xiàn)
4 最優(yōu)化設(shè)計
    4.1 明文數(shù)據(jù)塊大小選擇
    4.2 參數(shù)存放位置選擇
    4.3 線程塊大小劃分
5 結(jié)束語



本文編號:4021749

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4021749.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶caf72***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com