基于并行化混合粒子群算法的網(wǎng)絡(luò)入侵檢測技術(shù)研究
發(fā)布時間:2020-08-13 06:56
【摘要】:網(wǎng)絡(luò)入侵檢測技術(shù)是保障網(wǎng)絡(luò)安全的方法之一,在現(xiàn)有的各類網(wǎng)絡(luò)入侵檢測方法中,以基于機器學(xué)習算法的方法效果最為突出,即使用機器學(xué)習算法作為分類器來對相關(guān)數(shù)據(jù)進行歸類以檢測出入侵行為的方法。最小二乘支持向量機作為分類器具有檢測精度高、泛化能力好等優(yōu)點,而且相對于標準支持向量機,由于簡化了算法中待解決的問題,在計算效率上也有一定程度上的改進,但由于其分類性能很大程度上受到自身參數(shù)選擇的影響,因此如何更好的去選擇合適的參數(shù)成為提高該類方法檢測精度的關(guān)鍵。當前對于模型參數(shù)選擇的方法主要分為兩類,一類是基于人工后驗經(jīng)驗的選擇,該方法具有較強的主觀性,會由于研究人員在對待目標問題上相關(guān)經(jīng)驗的不同而導(dǎo)致選擇的參數(shù)對分類結(jié)果產(chǎn)生潛在的影響;另一類是基于智能優(yōu)化算法對分類器作參數(shù)尋優(yōu)的方法,但由于智能優(yōu)化算法自身存在的一些缺陷會導(dǎo)致參數(shù)尋優(yōu)精度欠佳,應(yīng)用智能算法尋優(yōu)得到的參數(shù)后也會影響分類器的分類準確率,因此該類方法仍存在一定的改進。針對智能算法對分類器作參數(shù)尋優(yōu)的方法,本文在現(xiàn)有理論基礎(chǔ)之上首先結(jié)合反向?qū)W習理論提出了一種改進的綜合學(xué)習粒子群優(yōu)化算法,并通過改進后的算法對最小二乘支持向量機進行參數(shù)尋優(yōu),提出了一種改進的網(wǎng)絡(luò)入侵檢測模型。隨后,針對改進后的綜合學(xué)習粒子群算法中存在大量迭代、解決復(fù)雜問題時收斂時間較長的缺陷,結(jié)合目前已有的并行化模型,提出了一種改進的并行化混合粒子群算法。并行化混合粒子群算法分為整體種群和子群兩部分,整體種群中每個粒子又作為一個子群獨立進化。通過在整體種群中使用標準粒子群算法并且在子群中混入融合反向?qū)W習機制的綜合學(xué)習粒子群算法,可以有效減少算法進行參數(shù)尋優(yōu)的時間。此外,針對最小二乘支持向量機在處理多分類問題上需要構(gòu)造多個相互獨立的二值分類器特性,結(jié)合改進的并行化混合粒子群算法,將網(wǎng)絡(luò)入侵檢測模型整體進行了并行化改進,在檢測效率和準確度方面都有所提高,同時在網(wǎng)絡(luò)入侵檢測的實時性方面也有所改進。本文實驗部分基于KDDCUP99數(shù)據(jù)集進行研究,首先通過人工篩選明顯無意義的特征維度,再通過PCA主元成分分析計算各個剩余特征維度的貢獻率,通過篩選累計貢獻率大于98%的特征進行主成分提取,從而達到特征選擇目的。模型的并行化實驗驗證主要借助于Spark分布式計算框架來實現(xiàn),通過相關(guān)實驗比較證明本文提出的模型具有較好的效果。
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP393.08;TP18
【圖文】:
Anderson 在一份報告中首次提出了網(wǎng)絡(luò)入侵的相關(guān)概念[3],出所謂網(wǎng)絡(luò)入侵就是指連接在網(wǎng)絡(luò)中的某一臺主機遭到同處于該士的越權(quán)訪問,并且對主機上的文件進行篡改以導(dǎo)致主機無法網(wǎng)絡(luò)入侵行為的出現(xiàn)嚴重威脅著計算機網(wǎng)絡(luò)的信息安全,在這的相關(guān)概念誕生了,即通過收集相關(guān)特征信息來識別網(wǎng)絡(luò)入侵全目的的一種技術(shù)。近年來隨著互聯(lián)網(wǎng)的蓬勃發(fā)展、網(wǎng)絡(luò)安全侵檢測技術(shù)也有了巨大的突破。入侵檢測技術(shù)需要借助額外的現(xiàn),通過部署在區(qū)域網(wǎng)絡(luò)中的采集裝置來對原始網(wǎng)絡(luò)信息進行是網(wǎng)絡(luò)中主機的系統(tǒng)日志,也可以是網(wǎng)絡(luò)設(shè)備中進行數(shù)據(jù)包傳。通過對這些原始數(shù)據(jù)的分析、處理可以及時發(fā)現(xiàn)一些潛在的絡(luò)的平穩(wěn)安全運行。測基本步驟,網(wǎng)絡(luò)入侵檢測主要分為四個步驟,即原始網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)策響應(yīng),它們之間的關(guān)系可以參照圖 2-1 所示。
的表現(xiàn)形式: ( ) = ∑ ( , ) + (2-6)根據(jù) Mercer 條件,其中 ( , ) = j( ) × j( )為核函數(shù)。2.3 數(shù)據(jù)處理平臺介紹Hadoop是Apache基金會旗下的一款開源分布式計算框架,主要用于方便用戶進行分布式計算。Hadoop 框架的出現(xiàn)可以讓用戶在并不了解分布式計算技術(shù)中集群計算機之前底層通信交互原理的情況下依然可以開發(fā)出分布式程序,降低了分布式程序開發(fā)的門檻。目前,Hadoop 技術(shù)主要應(yīng)用在數(shù)據(jù)離線分析、海量日志文件的底層分布式存儲以及一些面向業(yè)務(wù)的分布式程序開發(fā)等。對于 Hadoop 自身來講,其核心組件主要由MapReduce 編程模型以及 HDFS 分布式文件系統(tǒng)所組成,但還有其他一些同樣重要的組件如 Hadoop YARN 系統(tǒng)資源協(xié)調(diào)器、分布式鍵值對數(shù)據(jù)庫 HBase 以及可以用作數(shù)據(jù)倉庫的 Hive 等,這些組件一并構(gòu)成了 Hadoop 的生態(tài)體系,體系內(nèi)具體所包含的組件、模塊可以參照圖 2-2 所示。
圖 2-3 YARN各組件之間的關(guān)系ResourceManager 是基于運行在集群中分布式應(yīng)用對資源的需求來進行調(diào)度的,它本身也是一個調(diào)度器,不過不會去監(jiān)視運行中的應(yīng)用程序。不同的應(yīng)用程序所調(diào)用的系統(tǒng)資源不同,因此也就需要不同的容器來承載。ResourceManager 可以進行管理和調(diào)度的系統(tǒng)資源主要包括 CPU、內(nèi)存、硬盤和網(wǎng)絡(luò)等。Hadoop 集群中的每一個節(jié)點上都會運行一個 NodeManager 進程,主要負責保障當前節(jié)點上程序的正常運行,相當于該節(jié)點計算機的一個代理,并會對該計算機系統(tǒng)資源進行管理和監(jiān)控。集群中每個節(jié)點中的 NodeManager 會監(jiān)控當前節(jié)點上資源的使用情況以及容器(Container)的運行狀態(tài),然后會定期向集群中的 ResourceManager進行匯報。容器是 YARN 體系中系統(tǒng)資源的抽象,它在所運行的節(jié)點上封裝了一定量的系統(tǒng)資源(包括CPU、內(nèi)存等)。YARN容器是有AppMaster向ResourceManager申請的,由 ResourceManager 中的資源分配器異步調(diào)度給 AppMaster。YARN 容器就是分布式應(yīng)用程序的基本載體,它的運行是由 AppMaster 向應(yīng)用所在的 NodeManager 發(fā)起的,容器在運行時必須包含內(nèi)部可執(zhí)行的命令(如 jar 包等)。
本文編號:2791679
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP393.08;TP18
【圖文】:
Anderson 在一份報告中首次提出了網(wǎng)絡(luò)入侵的相關(guān)概念[3],出所謂網(wǎng)絡(luò)入侵就是指連接在網(wǎng)絡(luò)中的某一臺主機遭到同處于該士的越權(quán)訪問,并且對主機上的文件進行篡改以導(dǎo)致主機無法網(wǎng)絡(luò)入侵行為的出現(xiàn)嚴重威脅著計算機網(wǎng)絡(luò)的信息安全,在這的相關(guān)概念誕生了,即通過收集相關(guān)特征信息來識別網(wǎng)絡(luò)入侵全目的的一種技術(shù)。近年來隨著互聯(lián)網(wǎng)的蓬勃發(fā)展、網(wǎng)絡(luò)安全侵檢測技術(shù)也有了巨大的突破。入侵檢測技術(shù)需要借助額外的現(xiàn),通過部署在區(qū)域網(wǎng)絡(luò)中的采集裝置來對原始網(wǎng)絡(luò)信息進行是網(wǎng)絡(luò)中主機的系統(tǒng)日志,也可以是網(wǎng)絡(luò)設(shè)備中進行數(shù)據(jù)包傳。通過對這些原始數(shù)據(jù)的分析、處理可以及時發(fā)現(xiàn)一些潛在的絡(luò)的平穩(wěn)安全運行。測基本步驟,網(wǎng)絡(luò)入侵檢測主要分為四個步驟,即原始網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)策響應(yīng),它們之間的關(guān)系可以參照圖 2-1 所示。
的表現(xiàn)形式: ( ) = ∑ ( , ) + (2-6)根據(jù) Mercer 條件,其中 ( , ) = j( ) × j( )為核函數(shù)。2.3 數(shù)據(jù)處理平臺介紹Hadoop是Apache基金會旗下的一款開源分布式計算框架,主要用于方便用戶進行分布式計算。Hadoop 框架的出現(xiàn)可以讓用戶在并不了解分布式計算技術(shù)中集群計算機之前底層通信交互原理的情況下依然可以開發(fā)出分布式程序,降低了分布式程序開發(fā)的門檻。目前,Hadoop 技術(shù)主要應(yīng)用在數(shù)據(jù)離線分析、海量日志文件的底層分布式存儲以及一些面向業(yè)務(wù)的分布式程序開發(fā)等。對于 Hadoop 自身來講,其核心組件主要由MapReduce 編程模型以及 HDFS 分布式文件系統(tǒng)所組成,但還有其他一些同樣重要的組件如 Hadoop YARN 系統(tǒng)資源協(xié)調(diào)器、分布式鍵值對數(shù)據(jù)庫 HBase 以及可以用作數(shù)據(jù)倉庫的 Hive 等,這些組件一并構(gòu)成了 Hadoop 的生態(tài)體系,體系內(nèi)具體所包含的組件、模塊可以參照圖 2-2 所示。
圖 2-3 YARN各組件之間的關(guān)系ResourceManager 是基于運行在集群中分布式應(yīng)用對資源的需求來進行調(diào)度的,它本身也是一個調(diào)度器,不過不會去監(jiān)視運行中的應(yīng)用程序。不同的應(yīng)用程序所調(diào)用的系統(tǒng)資源不同,因此也就需要不同的容器來承載。ResourceManager 可以進行管理和調(diào)度的系統(tǒng)資源主要包括 CPU、內(nèi)存、硬盤和網(wǎng)絡(luò)等。Hadoop 集群中的每一個節(jié)點上都會運行一個 NodeManager 進程,主要負責保障當前節(jié)點上程序的正常運行,相當于該節(jié)點計算機的一個代理,并會對該計算機系統(tǒng)資源進行管理和監(jiān)控。集群中每個節(jié)點中的 NodeManager 會監(jiān)控當前節(jié)點上資源的使用情況以及容器(Container)的運行狀態(tài),然后會定期向集群中的 ResourceManager進行匯報。容器是 YARN 體系中系統(tǒng)資源的抽象,它在所運行的節(jié)點上封裝了一定量的系統(tǒng)資源(包括CPU、內(nèi)存等)。YARN容器是有AppMaster向ResourceManager申請的,由 ResourceManager 中的資源分配器異步調(diào)度給 AppMaster。YARN 容器就是分布式應(yīng)用程序的基本載體,它的運行是由 AppMaster 向應(yīng)用所在的 NodeManager 發(fā)起的,容器在運行時必須包含內(nèi)部可執(zhí)行的命令(如 jar 包等)。
【參考文獻】
相關(guān)期刊論文 前1條
1 黨小超;郝占軍;;基于改進Elman神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測[J];計算機應(yīng)用;2010年10期
本文編號:2791679
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2791679.html
最近更新
教材專著