GPU上SM4算法并行實現(xiàn)
發(fā)布時間:2025-01-01 00:12
密碼算法的運(yùn)算速度與算力成正比,一些學(xué)者通過提高CPU速度、使用硬件加密卡等方案提高密碼算法運(yùn)算速度。隨著圖形處理器(GPU)在高性能并行計算領(lǐng)域的廣泛應(yīng)用,國內(nèi)外學(xué)者已經(jīng)展開了基于GPU加速密碼運(yùn)算的研究,但這些研究基本都是基于DES、AES等國際公開算法的,針對國產(chǎn)商用密碼算法SM4的研究還較少。文章在深入研究GPU并行計算機(jī)制的基礎(chǔ)上,通過研究最優(yōu)明文數(shù)據(jù)塊、GPU存儲類型和線程塊對SM4加密的加速比問題,結(jié)合CPU與GPU的特性,提出一種GPU上并行SM4算法的最優(yōu)加解密方案。結(jié)果表明,當(dāng)明文數(shù)據(jù)塊小于8 KB時,加速比(Ep)小于1;明文數(shù)據(jù)塊大小為64 KB時,加速比開始大幅增加;明文數(shù)據(jù)塊大小為256 KB時,加速比達(dá)到最大。當(dāng)選擇常量存儲作為中間數(shù)據(jù)存儲時,加密速度有所提升,對于大數(shù)據(jù)量、高速運(yùn)算的需求來說,這種提升是很有必要的。最優(yōu)線程塊的大小為128~512(必須為32的倍數(shù))個線程數(shù)。實驗環(huán)境下,文章中實現(xiàn)的最優(yōu)GPU加密方案的速度為普通CPU加密方案速度的26倍。
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 GPU結(jié)構(gòu)
2 SM4密碼算法
2.1 輪密鑰生成
2.2 輪函數(shù)F計算
2.3 加密與解密運(yùn)算
3 基于CUDA的SM4并行計算設(shè)計
3.1 并行方案
3.2 CUDA并行實現(xiàn)
4 最優(yōu)化設(shè)計
4.1 明文數(shù)據(jù)塊大小選擇
4.2 參數(shù)存放位置選擇
4.3 線程塊大小劃分
5 結(jié)束語
本文編號:4021749
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 GPU結(jié)構(gòu)
2 SM4密碼算法
2.1 輪密鑰生成
2.2 輪函數(shù)F計算
2.3 加密與解密運(yùn)算
3 基于CUDA的SM4并行計算設(shè)計
3.1 并行方案
3.2 CUDA并行實現(xiàn)
4 最優(yōu)化設(shè)計
4.1 明文數(shù)據(jù)塊大小選擇
4.2 參數(shù)存放位置選擇
4.3 線程塊大小劃分
5 結(jié)束語
本文編號:4021749
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4021749.html
最近更新
教材專著