基于機(jī)器學(xué)習(xí)的密碼體制識別研究
發(fā)布時間:2020-05-15 02:14
【摘要】:近年來,互聯(lián)網(wǎng)所產(chǎn)生的數(shù)據(jù)量飛速增長。海量數(shù)據(jù)對于數(shù)據(jù)分析者是巨大的潛在資源,但是網(wǎng)絡(luò)數(shù)據(jù)通常種類繁多、結(jié)構(gòu)復(fù)雜,其中包含大量密數(shù)據(jù),這些因素對研究者構(gòu)成了挑戰(zhàn)。密碼體制識別是密數(shù)據(jù)分析的前提,屬于密碼分析學(xué)中區(qū)分攻擊的范疇,具有重要的理論意義與應(yīng)用價(jià)值。本文圍繞密文特征提取、密碼體制識別的分類器構(gòu)建,開展了機(jī)器學(xué)習(xí)技術(shù)在密碼體制識別中的應(yīng)用研究,論文主要內(nèi)容和創(chuàng)新點(diǎn)如下:1.密碼體制識別的效果在實(shí)際應(yīng)用中通常受到多種條件制約,對可能影響識別效果的因素的探究,將有助于后續(xù)更好地開展密碼體制識別任務(wù)。為此采集14種密文特征并基于支持向量機(jī)算法構(gòu)建了密碼體制識別分類器,針對AES、Blowfish、Camellia、DES和IDEA等5種分組密碼體制開展密碼體制識別實(shí)驗(yàn)中,對密文特征、密鑰設(shè)置、不同文件大小等對于識別性能的影響進(jìn)行了分析,選擇誤報(bào)率、精確率和召回率等指標(biāo)分析評價(jià)了密碼體制的識別情況,初步嘗試了基于隨機(jī)性測試的密文特征在密碼體制識別中的應(yīng)用。2.受隨機(jī)性測試在密碼體制識別中的應(yīng)用啟發(fā),首次基于NIST測試集中的15種隨機(jī)性測試提出了54種基于隨機(jī)性測試的新密文特征,并在由隨機(jī)森林算法構(gòu)成的分類器中廣泛開展了分類訓(xùn)練和測試。分別完成了針對明密文數(shù)據(jù)的區(qū)分、分組密碼工作模式的區(qū)分以及針對AES、DES、3DES、IDEA、Blowfish和Camellia等6種分組密碼體制的區(qū)分實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果進(jìn)一步證實(shí)了基于隨機(jī)性測試特征在密碼體制識別中的有效性,通過對比分析挖掘出多種性質(zhì)優(yōu)良的密文特征。3.基于9種典型的機(jī)器學(xué)習(xí)算法構(gòu)建了密碼體制識別分類器,針對AES、DES、IDEA、Blowfish、SMS4、Camellia等5種分組密碼算法的密文進(jìn)行了兩兩識別,并對各種分類器區(qū)分密文的能力進(jìn)行了比較和分析。為提高密碼體制分類器的識別效率,分別采用降維算法和并行優(yōu)化方法對3種分類器進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果顯示基于t-SNE的特征降維技術(shù)能夠?qū)daboosting和Bagging這兩類決策樹的運(yùn)行時間減少61%以上,并行化執(zhí)行隨機(jī)森林算法的運(yùn)行時間減少58%以上。4.針對Grain-128密碼體制與AES、DES、IDEA、Blowfish、SMS4、Camellia、Trivium、Sosemanuk、Salsa、Dragon和RC4等11種對稱密碼體制開展了兩兩識別的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示出Grain-128與其它密碼體制的加密密文之間存在能夠被區(qū)分的差異,且比較了各類特征對于Grain-128的識別性能,對部分高維特征進(jìn)行了降維優(yōu)化,在保持識別準(zhǔn)確率穩(wěn)定的情況下,將特征的數(shù)據(jù)存儲量降至原先的1/8,分類算法的運(yùn)行時間只需原先的1/18。
【圖文】:
圖 4.1 卡方分布的概率密度曲線及其 α 分位點(diǎn)alue 法,2 分布的概率密度曲線同上圖 4.1,計(jì)算統(tǒng)計(jì)量 X,再分,將積分結(jié)果(即 P-value 值,圖中的陰影部分面積)與 α 進(jìn)原假設(shè)。NIST 隨機(jī)性測試正是通過構(gòu)造的各種測試統(tǒng)計(jì)量來計(jì)將 P-value 值作為判斷是否接受原假設(shè)的依據(jù)。如果 P-value 機(jī)的,值為 0 則是完全非隨機(jī)的。給定顯著性水平 α,對于介于,如果P value ,則認(rèn)為序列是隨機(jī)的,反之序列是非隨誤類型 1 的概率,通常 α 的取值范圍是[0.001,0.01]。機(jī)性測試的密文特征提取方法2 中對隨機(jī)性測試的介紹中也可以了解到,NIST 隨機(jī)性測試對于較廣泛的覆蓋面,對于序列的全局或部分的隨機(jī)性均有針對性的性測試返回值有意義的前提下,對密文進(jìn)行分塊或改變部分測試 NIST 隨機(jī)性測試,得到了密數(shù)據(jù)集數(shù)量不等的測試返回值(的特征數(shù)據(jù)。
圖 4.2 54 種基于隨機(jī)性測試特征在各識別場景下的識別準(zhǔn)確率箱式圖結(jié)合表 4.6 和圖 4.2,可以發(fā)現(xiàn),上述 54 種密文特征的識別結(jié)果雖然存在較大差異但總體上,,多數(shù)特征能以高于是隨機(jī)的識別成功率區(qū)分兩種密碼體制,且部分特征具有較高的識別準(zhǔn)確率。這說明基于隨機(jī)性測試返回值所構(gòu)造的密文特征對于密文確實(shí)具有一定的區(qū)分作用。在圖 4.2 和表 4.6 中,隨著維數(shù)增大,Aet 系列特征的識別準(zhǔn)確率波動幅度也在增大,Bf 系列、Cus 系列、Fre 系列、Run 系列、Us 系列、Rev 系列和 Re 系列特征的識別準(zhǔn)確率隨著維數(shù)增大而提高,Dft 系列、Nt 系列特征識別準(zhǔn)確率與維數(shù)的關(guān)系不明顯,Rt 系列特征的識別準(zhǔn)確率隨著維數(shù)增大呈現(xiàn)出下降趨勢?傮w來看,基于隨機(jī)性測試的密文特征維數(shù)與其識別準(zhǔn)確率并沒有必然的關(guān)系。不同密碼體制加密的密文其隨機(jī)性存在差異,如果隨機(jī)性測試可以反映出這種差異,其對應(yīng)密文特征的識別準(zhǔn)確率就會高。在提取密文特征時,密文分塊數(shù)、密文數(shù)據(jù)量等因素顯然對于隨機(jī)性測試返回值的準(zhǔn)確性(即反映密文隨機(jī)性水平的能力)有一定影響,這種影響既可能是正向的也可能是反向的,其具體地作用機(jī)理有待進(jìn)一步研究。在對各密文特征在具體識別場景中的識別性能時,也發(fā)現(xiàn)部分特征的識別成功率與所識別的密碼體制存在明顯的相關(guān)性關(guān)系。如下表4.7,Bf系列特征對于區(qū)分3DES、IDEA
【學(xué)位授予單位】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN918.1;TP181
本文編號:2664308
【圖文】:
圖 4.1 卡方分布的概率密度曲線及其 α 分位點(diǎn)alue 法,2 分布的概率密度曲線同上圖 4.1,計(jì)算統(tǒng)計(jì)量 X,再分,將積分結(jié)果(即 P-value 值,圖中的陰影部分面積)與 α 進(jìn)原假設(shè)。NIST 隨機(jī)性測試正是通過構(gòu)造的各種測試統(tǒng)計(jì)量來計(jì)將 P-value 值作為判斷是否接受原假設(shè)的依據(jù)。如果 P-value 機(jī)的,值為 0 則是完全非隨機(jī)的。給定顯著性水平 α,對于介于,如果P value ,則認(rèn)為序列是隨機(jī)的,反之序列是非隨誤類型 1 的概率,通常 α 的取值范圍是[0.001,0.01]。機(jī)性測試的密文特征提取方法2 中對隨機(jī)性測試的介紹中也可以了解到,NIST 隨機(jī)性測試對于較廣泛的覆蓋面,對于序列的全局或部分的隨機(jī)性均有針對性的性測試返回值有意義的前提下,對密文進(jìn)行分塊或改變部分測試 NIST 隨機(jī)性測試,得到了密數(shù)據(jù)集數(shù)量不等的測試返回值(的特征數(shù)據(jù)。
圖 4.2 54 種基于隨機(jī)性測試特征在各識別場景下的識別準(zhǔn)確率箱式圖結(jié)合表 4.6 和圖 4.2,可以發(fā)現(xiàn),上述 54 種密文特征的識別結(jié)果雖然存在較大差異但總體上,,多數(shù)特征能以高于是隨機(jī)的識別成功率區(qū)分兩種密碼體制,且部分特征具有較高的識別準(zhǔn)確率。這說明基于隨機(jī)性測試返回值所構(gòu)造的密文特征對于密文確實(shí)具有一定的區(qū)分作用。在圖 4.2 和表 4.6 中,隨著維數(shù)增大,Aet 系列特征的識別準(zhǔn)確率波動幅度也在增大,Bf 系列、Cus 系列、Fre 系列、Run 系列、Us 系列、Rev 系列和 Re 系列特征的識別準(zhǔn)確率隨著維數(shù)增大而提高,Dft 系列、Nt 系列特征識別準(zhǔn)確率與維數(shù)的關(guān)系不明顯,Rt 系列特征的識別準(zhǔn)確率隨著維數(shù)增大呈現(xiàn)出下降趨勢?傮w來看,基于隨機(jī)性測試的密文特征維數(shù)與其識別準(zhǔn)確率并沒有必然的關(guān)系。不同密碼體制加密的密文其隨機(jī)性存在差異,如果隨機(jī)性測試可以反映出這種差異,其對應(yīng)密文特征的識別準(zhǔn)確率就會高。在提取密文特征時,密文分塊數(shù)、密文數(shù)據(jù)量等因素顯然對于隨機(jī)性測試返回值的準(zhǔn)確性(即反映密文隨機(jī)性水平的能力)有一定影響,這種影響既可能是正向的也可能是反向的,其具體地作用機(jī)理有待進(jìn)一步研究。在對各密文特征在具體識別場景中的識別性能時,也發(fā)現(xiàn)部分特征的識別成功率與所識別的密碼體制存在明顯的相關(guān)性關(guān)系。如下表4.7,Bf系列特征對于區(qū)分3DES、IDEA
【學(xué)位授予單位】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN918.1;TP181
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 吳楊;王韜;李進(jìn)東;;分組密碼算法密文的統(tǒng)計(jì)檢測新方法研究[J];軍械工程學(xué)院學(xué)報(bào);2015年03期
2 吳楊;王韜;邢萌;李進(jìn)東;;基于密文隨機(jī)性度量值分布特征的分組密碼算法識別方案[J];通信學(xué)報(bào);2015年04期
3 藍(lán)欣兒;;心有“靈犀”一點(diǎn)通——大話靈犀語音助手[J];少年電腦世界;2013年09期
4 吳喜之;;統(tǒng)計(jì)學(xué):從數(shù)據(jù)到結(jié)論(第四版)[J];中國統(tǒng)計(jì);2013年06期
5 侯樹范;孫英娟;;機(jī)器學(xué)習(xí)的研究[J];長春師范學(xué)院學(xué)報(bào);2012年06期
6 荊霞;張金城;黃作明;;基于數(shù)據(jù)挖掘的審計(jì)數(shù)據(jù)分析[J];中國管理信息化;2011年17期
相關(guān)博士學(xué)位論文 前2條
1 劉飚;基于機(jī)器學(xué)習(xí)的密碼芯片電磁攻擊技術(shù)研究[D];北京郵電大學(xué);2014年
2 張海納;eSTREAM序列密碼候選算法的安全性分析[D];山東大學(xué);2009年
本文編號:2664308
本文鏈接:http://sikaile.net/kejilunwen/wltx/2664308.html
最近更新
教材專著