基于多階段網(wǎng)絡(luò)欺騙博弈的主動防御研究
發(fā)布時間:2021-08-05 22:51
針對網(wǎng)絡(luò)攻擊者需要依賴探測到的信息決定下一步動作這一特點,將非合作信號博弈理論應(yīng)用于網(wǎng)絡(luò)攻防分析。通過構(gòu)建多階段網(wǎng)絡(luò)欺騙博弈模型,對網(wǎng)絡(luò)攻防過程中存在的信號欺騙機制進行深入研究,充分考慮網(wǎng)絡(luò)欺騙信號衰減作用,實現(xiàn)多階段網(wǎng)絡(luò)攻防對抗的動態(tài)分析推演;诠シ婪治龈倪M了多階段網(wǎng)絡(luò)欺騙博弈均衡求解方法,并設(shè)計出最優(yōu)網(wǎng)絡(luò)欺騙防御策略選取算法。仿真實驗驗證了所提模型和方法的有效性,根據(jù)實驗結(jié)果對多階段網(wǎng)絡(luò)欺騙博弈存在的規(guī)律進行了分析總結(jié),能夠為網(wǎng)絡(luò)安全主動防御研究提供有效指導。
【文章來源】:通信學報. 2020,41(08)北大核心EICSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
多階段網(wǎng)絡(luò)欺騙博弈過程
表示防御欺騙信號集合,滿足{|1,2,,}jMmjN且M,網(wǎng)絡(luò)防御者通過釋放防御欺騙信號,以達到欺騙攻擊者的作用。5)AAP(P,P)表示攻擊者的博弈信念集合,其中,12AADADAD{(),(),,()}nPPTPTPT表示攻擊者對不同防御者類型的先驗判斷,AAD(|)ijPPTm表示攻擊者結(jié)合防御信號和先驗概率計算得出的后驗概率。6)DAU(U,U)表示攻防雙方的收益函數(shù)集合。針對CDGM,基于網(wǎng)絡(luò)攻防實際應(yīng)用,構(gòu)建單階段網(wǎng)絡(luò)欺騙攻防博弈樹,具體如圖2所示。針對單階段網(wǎng)絡(luò)欺騙博弈過程,通過精煉貝葉斯均衡[15]求解方法進行博弈均衡求解。將此博弈的博弈均衡表示為DAADEQ(S(m),S(m),P(T)),當滿足式(1)所示條件時即達到該博弈的精煉貝葉斯均衡,從而求出單階段最優(yōu)網(wǎng)絡(luò)欺騙防御策略。ADADADDDADAAD()argmax(|)((),,)()argmax(,(),)(|)ijijNmMSmPTmUmTSTSmUmSmTPPTm,(1)其中,AS(m)表示攻擊者的信號依存策略;DS(m)表示防御者釋放m信號后基于最優(yōu)攻擊策略AS(m)的最優(yōu)防御策略;AP表示攻擊者收到m信號后對防御者類型判斷的后驗概率。2.3多階段網(wǎng)絡(luò)欺騙博弈模型的構(gòu)建基于單階段網(wǎng)絡(luò)欺騙博弈分析,結(jié)合攻防實際應(yīng)用,構(gòu)建多階段網(wǎng)絡(luò)欺騙博弈模型,具體如下。定義2多階段網(wǎng)絡(luò)欺騙博弈模型(MCDGM,multi-stagecyberdeceptiongamemodel)為八元組MCDGM=(N,K,S,T,M,,P,U),具體如下。1)DAN(N,N)表示博弈參與者集合,其中,DN
*2D2A2AD2EQ((S(m)),(S(m)),(P(T)))。其中,D2(S(m))即為第二階段的最優(yōu)防御策略。同理,可對后續(xù)階段的最優(yōu)防御策略D(())iSm進行分析求解。3)第k階段網(wǎng)絡(luò)欺騙博弈均衡求解在博弈過程中,由于01,當博弈階段數(shù)k趨于較大甚至無窮且防御者釋放虛假信號次數(shù)較多時,滿足10kr,其中r表示防御者釋放真實防御信號的階段數(shù)。此時,防御欺騙信號無法對攻擊者進行網(wǎng)絡(luò)欺騙,博弈階段G(k)變?yōu)椴煌耆畔㈧o態(tài)博弈,如圖4所示。不完全信息靜態(tài)博弈求解方法可參考文獻[20],本文不再贅述。圖4第k階段網(wǎng)絡(luò)攻防博弈樹綜上,求出所有k個博弈階段的精煉貝葉斯均衡解,所有博弈階段的最優(yōu)網(wǎng)絡(luò)防御策略構(gòu)成整個攻防博弈過程的最優(yōu)防御策略,即D11D22D33D{(()),(()),(()),,(())}kkSmSmSmSm。3.3算法設(shè)計與分析基于上述多階段網(wǎng)絡(luò)欺騙博弈的分析與求解過程,設(shè)計最優(yōu)防御策略選取算法,具體如下。算法多階段網(wǎng)絡(luò)欺騙博弈的最優(yōu)防御策略選取算法輸入N,K,S,T,M,,P,U輸出各階段分別對應(yīng)的最優(yōu)防御策略D()kSm開始1)初始化MCDGM=(N,K,S,T,M,,P,U)2)構(gòu)建防御行動空間DD{|1,jkSS≤k≤K1≤j≤n}和攻擊行動空間1≤i≤m},k表示博弈階段數(shù)3)構(gòu)建防御者類型空間DD{|1,iTTi2,,N}和攻擊者類型空間AT()4)初始化防御者防御信號空間{|1,jMmj2,,N}且M5)初始化攻擊者對防御者類型的先驗信念空間12AADADAD
【參考文獻】:
期刊論文
[1]基于攻防博弈的軍事信息網(wǎng)絡(luò)安全風險評估[J]. 王增光,盧昱,李璽. 軍事運籌與系統(tǒng)工程. 2019(02)
[2]基于信號博弈的移動目標防御最優(yōu)策略選取方法[J]. 蔣侶,張恒巍,王晉東. 通信學報. 2019(06)
[3]基于攻防博弈和蒙特卡洛模擬的網(wǎng)站防御策略選取方法[J]. 吳昊,范九倫,賴成喆,劉建華. 通信學報. 2018(08)
[4]基于不完全信息隨機博弈與Q-learning的防御決策方法[J]. 張紅旗,楊峻楠,張傳富. 通信學報. 2018(08)
[5]基于不完全信息隨機博弈的防御決策方法.[J]. 楊峻楠,張紅旗,張傳富. 網(wǎng)絡(luò)與信息安全學報. 2018(08)
[6]網(wǎng)絡(luò)欺騙技術(shù)綜述[J]. 賈召鵬,方濱興,劉潮歌,劉奇旭,林建寶. 通信學報. 2017(12)
[7]基于攻防信號博弈模型的防御策略選取方法[J]. 張恒巍,余定坤,韓繼紅,王晉東,李濤. 通信學報. 2016(05)
[8]基于博弈論的網(wǎng)絡(luò)空間安全若干問題分析[J]. 朱建明,王秦. 網(wǎng)絡(luò)與信息安全學報. 2015(01)
[9]從層次角度看網(wǎng)絡(luò)空間安全技術(shù)的覆蓋領(lǐng)域[J]. 方濱興. 網(wǎng)絡(luò)與信息安全學報. 2015(01)
[10]計算機網(wǎng)絡(luò)對抗行動策略的Markov博弈模型[J]. 王長春,程曉航,朱永文,董志強. 系統(tǒng)工程理論與實踐. 2014(09)
本文編號:3324601
【文章來源】:通信學報. 2020,41(08)北大核心EICSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
多階段網(wǎng)絡(luò)欺騙博弈過程
表示防御欺騙信號集合,滿足{|1,2,,}jMmjN且M,網(wǎng)絡(luò)防御者通過釋放防御欺騙信號,以達到欺騙攻擊者的作用。5)AAP(P,P)表示攻擊者的博弈信念集合,其中,12AADADAD{(),(),,()}nPPTPTPT表示攻擊者對不同防御者類型的先驗判斷,AAD(|)ijPPTm表示攻擊者結(jié)合防御信號和先驗概率計算得出的后驗概率。6)DAU(U,U)表示攻防雙方的收益函數(shù)集合。針對CDGM,基于網(wǎng)絡(luò)攻防實際應(yīng)用,構(gòu)建單階段網(wǎng)絡(luò)欺騙攻防博弈樹,具體如圖2所示。針對單階段網(wǎng)絡(luò)欺騙博弈過程,通過精煉貝葉斯均衡[15]求解方法進行博弈均衡求解。將此博弈的博弈均衡表示為DAADEQ(S(m),S(m),P(T)),當滿足式(1)所示條件時即達到該博弈的精煉貝葉斯均衡,從而求出單階段最優(yōu)網(wǎng)絡(luò)欺騙防御策略。ADADADDDADAAD()argmax(|)((),,)()argmax(,(),)(|)ijijNmMSmPTmUmTSTSmUmSmTPPTm,(1)其中,AS(m)表示攻擊者的信號依存策略;DS(m)表示防御者釋放m信號后基于最優(yōu)攻擊策略AS(m)的最優(yōu)防御策略;AP表示攻擊者收到m信號后對防御者類型判斷的后驗概率。2.3多階段網(wǎng)絡(luò)欺騙博弈模型的構(gòu)建基于單階段網(wǎng)絡(luò)欺騙博弈分析,結(jié)合攻防實際應(yīng)用,構(gòu)建多階段網(wǎng)絡(luò)欺騙博弈模型,具體如下。定義2多階段網(wǎng)絡(luò)欺騙博弈模型(MCDGM,multi-stagecyberdeceptiongamemodel)為八元組MCDGM=(N,K,S,T,M,,P,U),具體如下。1)DAN(N,N)表示博弈參與者集合,其中,DN
*2D2A2AD2EQ((S(m)),(S(m)),(P(T)))。其中,D2(S(m))即為第二階段的最優(yōu)防御策略。同理,可對后續(xù)階段的最優(yōu)防御策略D(())iSm進行分析求解。3)第k階段網(wǎng)絡(luò)欺騙博弈均衡求解在博弈過程中,由于01,當博弈階段數(shù)k趨于較大甚至無窮且防御者釋放虛假信號次數(shù)較多時,滿足10kr,其中r表示防御者釋放真實防御信號的階段數(shù)。此時,防御欺騙信號無法對攻擊者進行網(wǎng)絡(luò)欺騙,博弈階段G(k)變?yōu)椴煌耆畔㈧o態(tài)博弈,如圖4所示。不完全信息靜態(tài)博弈求解方法可參考文獻[20],本文不再贅述。圖4第k階段網(wǎng)絡(luò)攻防博弈樹綜上,求出所有k個博弈階段的精煉貝葉斯均衡解,所有博弈階段的最優(yōu)網(wǎng)絡(luò)防御策略構(gòu)成整個攻防博弈過程的最優(yōu)防御策略,即D11D22D33D{(()),(()),(()),,(())}kkSmSmSmSm。3.3算法設(shè)計與分析基于上述多階段網(wǎng)絡(luò)欺騙博弈的分析與求解過程,設(shè)計最優(yōu)防御策略選取算法,具體如下。算法多階段網(wǎng)絡(luò)欺騙博弈的最優(yōu)防御策略選取算法輸入N,K,S,T,M,,P,U輸出各階段分別對應(yīng)的最優(yōu)防御策略D()kSm開始1)初始化MCDGM=(N,K,S,T,M,,P,U)2)構(gòu)建防御行動空間DD{|1,jkSS≤k≤K1≤j≤n}和攻擊行動空間1≤i≤m},k表示博弈階段數(shù)3)構(gòu)建防御者類型空間DD{|1,iTTi2,,N}和攻擊者類型空間AT()4)初始化防御者防御信號空間{|1,jMmj2,,N}且M5)初始化攻擊者對防御者類型的先驗信念空間12AADADAD
【參考文獻】:
期刊論文
[1]基于攻防博弈的軍事信息網(wǎng)絡(luò)安全風險評估[J]. 王增光,盧昱,李璽. 軍事運籌與系統(tǒng)工程. 2019(02)
[2]基于信號博弈的移動目標防御最優(yōu)策略選取方法[J]. 蔣侶,張恒巍,王晉東. 通信學報. 2019(06)
[3]基于攻防博弈和蒙特卡洛模擬的網(wǎng)站防御策略選取方法[J]. 吳昊,范九倫,賴成喆,劉建華. 通信學報. 2018(08)
[4]基于不完全信息隨機博弈與Q-learning的防御決策方法[J]. 張紅旗,楊峻楠,張傳富. 通信學報. 2018(08)
[5]基于不完全信息隨機博弈的防御決策方法.[J]. 楊峻楠,張紅旗,張傳富. 網(wǎng)絡(luò)與信息安全學報. 2018(08)
[6]網(wǎng)絡(luò)欺騙技術(shù)綜述[J]. 賈召鵬,方濱興,劉潮歌,劉奇旭,林建寶. 通信學報. 2017(12)
[7]基于攻防信號博弈模型的防御策略選取方法[J]. 張恒巍,余定坤,韓繼紅,王晉東,李濤. 通信學報. 2016(05)
[8]基于博弈論的網(wǎng)絡(luò)空間安全若干問題分析[J]. 朱建明,王秦. 網(wǎng)絡(luò)與信息安全學報. 2015(01)
[9]從層次角度看網(wǎng)絡(luò)空間安全技術(shù)的覆蓋領(lǐng)域[J]. 方濱興. 網(wǎng)絡(luò)與信息安全學報. 2015(01)
[10]計算機網(wǎng)絡(luò)對抗行動策略的Markov博弈模型[J]. 王長春,程曉航,朱永文,董志強. 系統(tǒng)工程理論與實踐. 2014(09)
本文編號:3324601
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3324601.html
最近更新
教材專著