工業(yè)控制網(wǎng)絡(luò)安全事件挖掘模型研究與實現(xiàn)
發(fā)布時間:2020-03-28 18:57
【摘要】:工業(yè)控制網(wǎng)絡(luò)是國家和社會的重要基礎(chǔ)設(shè)施的控制網(wǎng)絡(luò),這些重要的基礎(chǔ)設(shè)施關(guān)系到人民的正常生活。隨著工業(yè)控制網(wǎng)絡(luò)與互聯(lián)網(wǎng)的高度融合,漏洞、攻擊、病毒等網(wǎng)絡(luò)威脅接踵而至。防御工控網(wǎng)絡(luò)攻擊需要挖掘出日志中的異常模式,數(shù)據(jù)挖掘能夠發(fā)掘出常見的異常模式。但是工控網(wǎng)絡(luò)的異常模式挖掘還存在忽視專業(yè)詞語的分析、不易發(fā)現(xiàn)隱藏異常模式和挖掘模型過擬合等問題。針對這些問題,本文首先建立了一個工控領(lǐng)域的專業(yè)語料庫,然后提出了一個基于編碼的長短期記憶神經(jīng)網(wǎng)絡(luò)的異常挖掘模型,最后設(shè)計了一種改進的課程學(xué)習(xí)算法。具體工作如下:1.為了增強模型分析專業(yè)詞語的能力,建立了一個工控領(lǐng)域的專業(yè)語料庫。將消極詞語與積極詞語等普通詞匯對應(yīng)轉(zhuǎn)換為專業(yè)詞匯,并新增工控特殊狀態(tài)詞語,不同類別的詞語設(shè)置合理的權(quán)重,建立專業(yè)語料庫。實驗結(jié)果顯示使用專業(yè)語料庫的異常挖掘模型準(zhǔn)確率提升了 4%。2.為了深層次挖掘出隱藏的異常模式,提出了基于編碼的長短期記憶神經(jīng)網(wǎng)絡(luò)異常檢測模型。采用上下文日志相結(jié)合的策略,將多行日志數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列,并將該狀態(tài)序列進行編碼,分離出正常模式與異常模式。實驗結(jié)果顯示編碼的異常挖掘模型能有效區(qū)分正常數(shù)據(jù)和異常數(shù)據(jù),編碼模型的F1值提升了 6%。3.為了減輕異常挖掘模型中的過擬合問題,提出了一種改進的課程學(xué)習(xí)算法。首先設(shè)計了一種平均頻繁次數(shù)和長度最短優(yōu)先的工控數(shù)據(jù)排序算法策略。然后使用正負樣本同時訓(xùn)練,根據(jù)損失值判斷所屬類別,改進后的課程學(xué)習(xí)算法減少模型訓(xùn)練的次數(shù)。通過實驗表明課程學(xué)習(xí)算法的改進使得模型訓(xùn)練次數(shù)減少了一半,從而減輕了模型的過擬合問題,同時在公共數(shù)據(jù)集上模型檢測的準(zhǔn)確率提升了 2%。
【圖文】:
第三章建立工控領(lǐng)域的專業(yè)語料庫逡逑由圖3-1可知,在專業(yè)語料庫對文本數(shù)據(jù)的作用下,進行詞語檢測后,會逡逑出現(xiàn)三種情況的詞語,當(dāng)出現(xiàn)中性詞語時,我們將不改變權(quán)重的大小,權(quán)重逡逑灰;大小為1。我們在詞語進行設(shè)置級別時,詞語是消極詞語到正常詞語的級別逡逑是從1到10。異常的最高級別是1,中性詞的級別是5,正常詞的級別是10。逡逑當(dāng)出現(xiàn)異常的情況,我們將調(diào)小權(quán)重的大小,使得權(quán)重大小為(0.1,1);當(dāng)出逡逑現(xiàn)正常詞語的情況下,我們將調(diào)大權(quán)重的大小,權(quán)重大小為(1,2)。因為在工逡逑控領(lǐng)域中,判斷一條文本行,一般是從1到10這10個等級去標(biāo)注某一行的狀逡逑態(tài)情況。我們將1表示為異常,10表示正常,5則表示為介于正常與異常之間。逡逑從圖3-1可以知道
逡逑如圖3-2所示,隨著積極詞語權(quán)重的加大,準(zhǔn)確率整體上呈現(xiàn)上升的趨勢。逡逑當(dāng)權(quán)重取值為1.6時,模型的準(zhǔn)確率達到了邋92.4%。隨著權(quán)重的繼續(xù)加大,模逡逑型的準(zhǔn)確率逐漸降低。實驗結(jié)果說明在剛開始未使用積極詞語權(quán)重設(shè)置時,模逡逑型的準(zhǔn)確率為87.1%,,當(dāng)加大積極詞語的權(quán)重時,模型的準(zhǔn)確率得到提升,但逡逑是如果過度加大權(quán)重,詞語顯示的狀態(tài)會過于正常,模型的準(zhǔn)確率開始減少,逡逑在權(quán)重設(shè)置為1.6時,效果最好。逡逑消極詞語的權(quán)重實驗逡逑^邐消極詞語逡逑^邐:邐92.8邐93-8逡逑92邐9邋匕一逡逑90邐!邐87.1逡逑86逡逑84逡逑82逡逑0.2邐0.4邐0.6邐0.8邐1邋權(quán)重逡逑圖3-3消極詞語的權(quán)重對實驗結(jié)果的影響逡逑如圖3-3所示為消極詞語權(quán)重值的變化與準(zhǔn)確率的關(guān)系,權(quán)重初始值為1。逡逑消極詞語的嚴重等級范圍為1-5級,當(dāng)權(quán)重為1時,嚴重等級保持不變,準(zhǔn)確逡逑率為87.1%。當(dāng)權(quán)重取值為0.6時
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:D669
本文編號:2604780
【圖文】:
第三章建立工控領(lǐng)域的專業(yè)語料庫逡逑由圖3-1可知,在專業(yè)語料庫對文本數(shù)據(jù)的作用下,進行詞語檢測后,會逡逑出現(xiàn)三種情況的詞語,當(dāng)出現(xiàn)中性詞語時,我們將不改變權(quán)重的大小,權(quán)重逡逑灰;大小為1。我們在詞語進行設(shè)置級別時,詞語是消極詞語到正常詞語的級別逡逑是從1到10。異常的最高級別是1,中性詞的級別是5,正常詞的級別是10。逡逑當(dāng)出現(xiàn)異常的情況,我們將調(diào)小權(quán)重的大小,使得權(quán)重大小為(0.1,1);當(dāng)出逡逑現(xiàn)正常詞語的情況下,我們將調(diào)大權(quán)重的大小,權(quán)重大小為(1,2)。因為在工逡逑控領(lǐng)域中,判斷一條文本行,一般是從1到10這10個等級去標(biāo)注某一行的狀逡逑態(tài)情況。我們將1表示為異常,10表示正常,5則表示為介于正常與異常之間。逡逑從圖3-1可以知道
逡逑如圖3-2所示,隨著積極詞語權(quán)重的加大,準(zhǔn)確率整體上呈現(xiàn)上升的趨勢。逡逑當(dāng)權(quán)重取值為1.6時,模型的準(zhǔn)確率達到了邋92.4%。隨著權(quán)重的繼續(xù)加大,模逡逑型的準(zhǔn)確率逐漸降低。實驗結(jié)果說明在剛開始未使用積極詞語權(quán)重設(shè)置時,模逡逑型的準(zhǔn)確率為87.1%,,當(dāng)加大積極詞語的權(quán)重時,模型的準(zhǔn)確率得到提升,但逡逑是如果過度加大權(quán)重,詞語顯示的狀態(tài)會過于正常,模型的準(zhǔn)確率開始減少,逡逑在權(quán)重設(shè)置為1.6時,效果最好。逡逑消極詞語的權(quán)重實驗逡逑^邐消極詞語逡逑^邐:邐92.8邐93-8逡逑92邐9邋匕一逡逑90邐!邐87.1逡逑86逡逑84逡逑82逡逑0.2邐0.4邐0.6邐0.8邐1邋權(quán)重逡逑圖3-3消極詞語的權(quán)重對實驗結(jié)果的影響逡逑如圖3-3所示為消極詞語權(quán)重值的變化與準(zhǔn)確率的關(guān)系,權(quán)重初始值為1。逡逑消極詞語的嚴重等級范圍為1-5級,當(dāng)權(quán)重為1時,嚴重等級保持不變,準(zhǔn)確逡逑率為87.1%。當(dāng)權(quán)重取值為0.6時
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:D669
【參考文獻】
相關(guān)期刊論文 前2條
1 宋海濤;韋大偉;湯光明;孫怡峰;;基于模式挖掘的用戶行為異常檢測算法[J];小型微型計算機系統(tǒng);2016年02期
2 陸悠;李偉;羅軍舟;蔣健;夏怒;;一種基于選擇性協(xié)同學(xué)習(xí)的網(wǎng)絡(luò)用戶異常行為檢測方法[J];計算機學(xué)報;2014年01期
本文編號:2604780
本文鏈接:http://sikaile.net/shekelunwen/guojiguanxi/2604780.html
最近更新
教材專著