針對機器學習算法的投毒及其防御技術(shù)研究
發(fā)布時間:2021-03-07 22:36
機器學習是當前計算機科學中最流行的技術(shù)之一,它已被廣泛應用于圖像處理,自然語言處理以及網(wǎng)絡安全等領(lǐng)域。盡管機器學習算法在許多實際應用中都取得了良好的效果,但近幾年研究表明其本身面臨著來自攻擊者的各類安全威脅。在這些安全威脅中,投毒攻擊是一種可以嚴重破壞機器學習模型有效性、完整性、可用性的誘發(fā)性攻擊,它通過在訓練階段修改原始訓練數(shù)據(jù)集中的樣本或者向原始訓練集中注入投毒樣本,以誘導訓練數(shù)據(jù)發(fā)生漂移,造成目標機器學習模型的性能明顯下降。本文主要針對常見的機器學習算法,提出兩種構(gòu)造投毒樣本的方法,并在此基礎(chǔ)上進一步提出針對黑盒機器學習模型的投毒策略,研究它們對機器學習算法造成的安全威脅和性能影響。此外,針對投毒樣本的特點,本文提出一種樣本合法性評估方法,提高機器學習算法對投毒攻擊的魯棒性。本文的主要貢獻有以下三個方面:(1)提出兩種基于數(shù)據(jù)漂移的邊界模式數(shù)據(jù)投毒攻擊方法。當訓練數(shù)據(jù)中的數(shù)據(jù)分布偏離實際數(shù)據(jù)分布時,就會出現(xiàn)數(shù)據(jù)漂移。而攻擊者會刻意向原始訓練數(shù)據(jù)集注入投毒數(shù)據(jù),使訓練數(shù)據(jù)集發(fā)生數(shù)據(jù)漂移。本文首先提出一種可以引起數(shù)據(jù)漂移的邊界模式數(shù)據(jù)的定義以及檢測方法,并在此基礎(chǔ)上提出兩種構(gòu)造邊界模...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
針對基于PCA的人臉識別系統(tǒng)的投毒樣本和目標樣本的中心變化
國防科技大學研究生院碩士學位論文第17頁圖2.6SMOTE算法2.5本章小結(jié)本章首先介紹了當前投毒攻擊的分類和敵手建模技術(shù),并說明了當前投毒攻擊的主要應用場景。接著圍繞離群點檢測算和RONI介紹了一些主要的數(shù)據(jù)清洗方法。本章還介紹了譜聚類實現(xiàn)聚類的具體原理,為第五章中基于多譜聚類聚合算法實現(xiàn)對訓練數(shù)據(jù)集的合法性評估提供理論參考。此外,本章還介紹了SMOTE技術(shù),并對其算法過程進行了描述。
國防科技大學研究生院碩士學位論文第31頁圖3.3BEPP在KDDCUP99上對六種機器學習算法的投毒效果圖3.4BEPP在NSL-KDD上對六種機器學習算法的投毒效果圖3.5BEPP在Kyoto2006+驗證集上對六種機器學習算法的投毒效果為了進一步展示了BEPP投毒方法的效果,本節(jié)中還針對目前文獻中最先進的一種網(wǎng)絡入侵檢測系統(tǒng)(FMIFS-LSSVM-IDS)[54]上進行了投毒攻擊的放著實驗。除了本研究中提出的BEPP外,實驗還選取了另外兩種投毒方法作為比較基準,BASIC方法和RANDOM方法[23]。在BASIC方法中,如果將N個投毒樣本添加到訓練數(shù)據(jù),則從正常樣本中隨機選擇N個數(shù)據(jù)加入原來的訓練數(shù)據(jù)。RANDOM方法是在樣本的特征空間隨機生成了一些樣本,將這些樣本中被FMIFS-LSSVM-IDS分類為正常的樣本作為有效的投毒樣本。圖3.6顯示出不同的投毒方法比較結(jié)果。
【參考文獻】:
期刊論文
[1]淺析計算機科學技術(shù)對智能生活的影響——以人工智能為切入[J]. 楊勵卓. 數(shù)字通信世界. 2018(01)
[2]機器學習安全性問題及其防御技術(shù)研究綜述[J]. 李盼,趙文濤,劉強,崔建京,殷建平. 計算機科學與探索. 2018(02)
[3]首次寫入政府工作報告的人工智能解讀[J]. 本刊編輯部. 黑龍江檔案. 2017(04)
[4]基于K-Means聚類算法入侵檢測系統(tǒng)研究[J]. 鳳祥云. 電腦知識與技術(shù). 2016(16)
[5]基于正則割(Ncut)的多閾值圖像分割方法[J]. 鄒小林,馮國燦. 計算機工程與應用. 2012(19)
[6]基于改進的K-means算法的異常檢測[J]. 蘇巴提,張曉. 軟件導刊. 2011(11)
本文編號:3069923
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
針對基于PCA的人臉識別系統(tǒng)的投毒樣本和目標樣本的中心變化
國防科技大學研究生院碩士學位論文第17頁圖2.6SMOTE算法2.5本章小結(jié)本章首先介紹了當前投毒攻擊的分類和敵手建模技術(shù),并說明了當前投毒攻擊的主要應用場景。接著圍繞離群點檢測算和RONI介紹了一些主要的數(shù)據(jù)清洗方法。本章還介紹了譜聚類實現(xiàn)聚類的具體原理,為第五章中基于多譜聚類聚合算法實現(xiàn)對訓練數(shù)據(jù)集的合法性評估提供理論參考。此外,本章還介紹了SMOTE技術(shù),并對其算法過程進行了描述。
國防科技大學研究生院碩士學位論文第31頁圖3.3BEPP在KDDCUP99上對六種機器學習算法的投毒效果圖3.4BEPP在NSL-KDD上對六種機器學習算法的投毒效果圖3.5BEPP在Kyoto2006+驗證集上對六種機器學習算法的投毒效果為了進一步展示了BEPP投毒方法的效果,本節(jié)中還針對目前文獻中最先進的一種網(wǎng)絡入侵檢測系統(tǒng)(FMIFS-LSSVM-IDS)[54]上進行了投毒攻擊的放著實驗。除了本研究中提出的BEPP外,實驗還選取了另外兩種投毒方法作為比較基準,BASIC方法和RANDOM方法[23]。在BASIC方法中,如果將N個投毒樣本添加到訓練數(shù)據(jù),則從正常樣本中隨機選擇N個數(shù)據(jù)加入原來的訓練數(shù)據(jù)。RANDOM方法是在樣本的特征空間隨機生成了一些樣本,將這些樣本中被FMIFS-LSSVM-IDS分類為正常的樣本作為有效的投毒樣本。圖3.6顯示出不同的投毒方法比較結(jié)果。
【參考文獻】:
期刊論文
[1]淺析計算機科學技術(shù)對智能生活的影響——以人工智能為切入[J]. 楊勵卓. 數(shù)字通信世界. 2018(01)
[2]機器學習安全性問題及其防御技術(shù)研究綜述[J]. 李盼,趙文濤,劉強,崔建京,殷建平. 計算機科學與探索. 2018(02)
[3]首次寫入政府工作報告的人工智能解讀[J]. 本刊編輯部. 黑龍江檔案. 2017(04)
[4]基于K-Means聚類算法入侵檢測系統(tǒng)研究[J]. 鳳祥云. 電腦知識與技術(shù). 2016(16)
[5]基于正則割(Ncut)的多閾值圖像分割方法[J]. 鄒小林,馮國燦. 計算機工程與應用. 2012(19)
[6]基于改進的K-means算法的異常檢測[J]. 蘇巴提,張曉. 軟件導刊. 2011(11)
本文編號:3069923
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3069923.html
最近更新
教材專著