GPU上SM4算法并行實(shí)現(xiàn)
發(fā)布時(shí)間:2025-01-01 00:12
密碼算法的運(yùn)算速度與算力成正比,一些學(xué)者通過(guò)提高CPU速度、使用硬件加密卡等方案提高密碼算法運(yùn)算速度。隨著圖形處理器(GPU)在高性能并行計(jì)算領(lǐng)域的廣泛應(yīng)用,國(guó)內(nèi)外學(xué)者已經(jīng)展開(kāi)了基于GPU加速密碼運(yùn)算的研究,但這些研究基本都是基于DES、AES等國(guó)際公開(kāi)算法的,針對(duì)國(guó)產(chǎn)商用密碼算法SM4的研究還較少。文章在深入研究GPU并行計(jì)算機(jī)制的基礎(chǔ)上,通過(guò)研究最優(yōu)明文數(shù)據(jù)塊、GPU存儲(chǔ)類型和線程塊對(duì)SM4加密的加速比問(wèn)題,結(jié)合CPU與GPU的特性,提出一種GPU上并行SM4算法的最優(yōu)加解密方案。結(jié)果表明,當(dāng)明文數(shù)據(jù)塊小于8 KB時(shí),加速比(Ep)小于1;明文數(shù)據(jù)塊大小為64 KB時(shí),加速比開(kāi)始大幅增加;明文數(shù)據(jù)塊大小為256 KB時(shí),加速比達(dá)到最大。當(dāng)選擇常量存儲(chǔ)作為中間數(shù)據(jù)存儲(chǔ)時(shí),加密速度有所提升,對(duì)于大數(shù)據(jù)量、高速運(yùn)算的需求來(lái)說(shuō),這種提升是很有必要的。最優(yōu)線程塊的大小為128~512(必須為32的倍數(shù))個(gè)線程數(shù)。實(shí)驗(yàn)環(huán)境下,文章中實(shí)現(xiàn)的最優(yōu)GPU加密方案的速度為普通CPU加密方案速度的26倍。
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
0 引言
1 GPU結(jié)構(gòu)
2 SM4密碼算法
2.1 輪密鑰生成
2.2 輪函數(shù)F計(jì)算
2.3 加密與解密運(yùn)算
3 基于CUDA的SM4并行計(jì)算設(shè)計(jì)
3.1 并行方案
3.2 CUDA并行實(shí)現(xiàn)
4 最優(yōu)化設(shè)計(jì)
4.1 明文數(shù)據(jù)塊大小選擇
4.2 參數(shù)存放位置選擇
4.3 線程塊大小劃分
5 結(jié)束語(yǔ)
本文編號(hào):4021749
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
0 引言
1 GPU結(jié)構(gòu)
2 SM4密碼算法
2.1 輪密鑰生成
2.2 輪函數(shù)F計(jì)算
2.3 加密與解密運(yùn)算
3 基于CUDA的SM4并行計(jì)算設(shè)計(jì)
3.1 并行方案
3.2 CUDA并行實(shí)現(xiàn)
4 最優(yōu)化設(shè)計(jì)
4.1 明文數(shù)據(jù)塊大小選擇
4.2 參數(shù)存放位置選擇
4.3 線程塊大小劃分
5 結(jié)束語(yǔ)
本文編號(hào):4021749
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4021749.html
最近更新
教材專著