天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于信息熵和迭代SVM的特征選擇方法研究

發(fā)布時間:2020-06-11 03:49
【摘要】:分類模型作為一種機(jī)器學(xué)習(xí)常用的模型,是入侵檢測系統(tǒng)中最基本的模型。由于近些年以來,互聯(lián)網(wǎng)行業(yè)的快速發(fā)展,安全數(shù)據(jù)的量級產(chǎn)生了指數(shù)級的增長,因此在準(zhǔn)確率以及實(shí)時性方面都對分類模型提出了新的要求。如何使模型變得簡單的同時保證準(zhǔn)確率,是目前安全分析領(lǐng)域研究的重點(diǎn)。特征選擇方法研究的是如何從特征集合中選出對分類問題重要的特征子集。對安全分析數(shù)據(jù)集進(jìn)行特征選擇可以去除冗余的、跟安全分析目的無關(guān)的特征,使后續(xù)的分析模型變得簡單高效的同時避免過擬合的出現(xiàn)。因此基于上述思想,本文研究一種特征子集選擇方法。主要工作如下:首先,提出了一種基于信息熵理論以及模糊集知識的特征熵值計算方法,由于熵能夠很好的表明變量的不確定性,因此每一個特征在訓(xùn)練數(shù)據(jù)集上的熵值表明其對分類問題不確定性的影響�;诖怂枷氡疚奶岢龅姆椒ǹ梢杂嬎闾卣髦匾耘琶仃�。該方法運(yùn)行在預(yù)處理階段,即在搭建分類模型之前就可以給出特征排名。其次,本文提出了一種基于迭代支持向量機(jī)(Support Vector Machines,SVM)的特征子集選擇方法,該方法通過迭代學(xué)習(xí)支持向量機(jī)模型,選取最優(yōu)的特征子集。剛開始的時候特征子集為空集,在迭代的每一步會選擇一個特征加入子集當(dāng)中。特征的選擇主要依據(jù)兩點(diǎn),分別是特征重要性排名以及該特征對SVM目標(biāo)函數(shù)帶來的影響,其中特征重要性排名由第一部分提出的算法給出。迭代過程一直持續(xù)到SVM模型在測試集上的準(zhǔn)確率不再提高,此時選取的特征子集是對分類問題最高效的一組特征組合。最后,在入侵檢測系統(tǒng)(Intrusion Detection System,IDS)數(shù)據(jù)集UNSW-NB15上將本文所提的特征選擇方法與其他經(jīng)典的方法進(jìn)行了比較,實(shí)驗(yàn)結(jié)果表明,本文提出的方法在提高準(zhǔn)確率的同時降低了模型的復(fù)雜度。
【圖文】:

數(shù)據(jù)集,算法,情況,分類模型


圖 4.2 對 UNSW-NB15 數(shù)據(jù)集執(zhí)行 FIBE 算法后特征保留情況圖 4.2 展示了 FIBE 算法對 UNSW-NB15 中的特征給出的重要性排名,執(zhí)行實(shí)驗(yàn)過程(8)中描述的過程搭建分類模型之后,刪除的特征如圖中紅色部分所示,藍(lán)色為保留的特征。

對比圖,算法性能,對比圖,準(zhǔn)確率


圖 4.4 FIBE 算法性能對比圖如圖 4.4 所示,開始時 4 中方法在訓(xùn)練集上的準(zhǔn)確率較為相近,但隨著移除特征數(shù)量的增加,本文提出的 FIBE 算法相比于其它 3 種方法,保持較高的性能。尤其當(dāng)移除25 個特征時,,本文所提的 FIBE 算法的分類準(zhǔn)確率可以保持 0.85 的水平,而其它 3 中方法此時的準(zhǔn)確率分別是 0.5、0.65 以及 0.5。意味著本文所提的算法只采用 UNSW-NB15
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP393.08;TP181

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙瑋;;采用機(jī)器學(xué)習(xí)的聚類模型特征選擇方法比較[J];華僑大學(xué)學(xué)報(自然科學(xué)版);2017年01期

2 嚴(yán)菲;王曉棟;;基于局部判別約束的半監(jiān)督特征選擇方法[J];模式識別與人工智能;2017年01期

3 張玉紅;周全;胡學(xué)鋼;;面向跨領(lǐng)域情感分類的特征選擇方法[J];模式識別與人工智能;2013年11期

4 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期

5 孫霞;鄭慶華;;一種面向非平衡數(shù)據(jù)的鄰居詞特征選擇方法[J];小型微型計算機(jī)系統(tǒng);2008年12期

6 龔靜;曾建一;;文本聚類中的特征選擇方法[J];吉首大學(xué)學(xué)報(自然科學(xué)版);2008年02期

7 王欣欣;;混合自適應(yīng)引力搜索優(yōu)化的特征選擇方法[J];計算機(jī)工程與應(yīng)用;2017年12期

8 戴建國;;一種新的有監(jiān)督特征選擇方法[J];陜西理工大學(xué)學(xué)報(自然科學(xué)版);2017年04期

9 徐璐;李雄偉;張陽;王曉晗;桂偉龍;;基于概率分布的硬件木馬檢測特征選擇方法[J];火力與指揮控制;2017年09期

10 王曉棟;嚴(yán)菲;謝勇;江慧琴;;基于稀疏圖表示的特征選擇方法研究[J];計算機(jī)工程與科學(xué);2015年12期

相關(guān)會議論文 前10條

1 李高明;易東;;基因表達(dá)譜高維大數(shù)據(jù)的特征選擇方法應(yīng)用策略[A];2017年中國衛(wèi)生統(tǒng)計學(xué)學(xué)術(shù)年會論文集[C];2017年

2 顧成杰;張順頤;劉凱;黃河;;基于粗糙集和禁忌搜索的特征選擇方法[A];江蘇省電子學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年

3 唐鳳珍;Lukas Adam;斯白露;;基于多類別支持向量機(jī)的組特征選擇方法[A];第四屆全國神經(jīng)動力學(xué)學(xué)術(shù)會議摘要集[C];2018年

4 徐燕;王斌;李錦濤;孫春明;;知識增益:文本分類中一種新的特征選擇方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

5 王秀娟;郭軍;鄭康鋒;;基于互信息可信度的特征選擇方法[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國青年通信學(xué)術(shù)會議論文集[C];2006年

6 肖婷;唐雁;;文本分類中特征選擇方法及應(yīng)用[A];2008年計算機(jī)應(yīng)用技術(shù)交流會論文集[C];2008年

7 靖紅芳;王斌;楊雅輝;;基于類別分布的特征選擇框架[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

8 陳慶軒;鄭德權(quán);鄭博文;趙鐵軍;李生;;中文文本分類中基于文檔頻度分布的特征選擇方法[A];黑龍江省計算機(jī)學(xué)會2009年學(xué)術(shù)交流年會論文集[C];2010年

9 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

10 陳鑫;梁海潔;廖騰峰;;基于TSVM分類器和混合型特征選擇方法的入侵檢測研究[A];2010年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集[C];2010年

相關(guān)博士學(xué)位論文 前10條

1 潘吳斌;加密流量精細(xì)化分類技術(shù)研究[D];東南大學(xué);2018年

2 杜利敏;面向不平衡數(shù)據(jù)的特征選擇與半監(jiān)督分類算法研究[D];西南交通大學(xué);2017年

3 吳越;面向網(wǎng)站無障礙檢測的組稀疏特征選擇方法的研究及應(yīng)用[D];浙江大學(xué);2018年

4 邊婧;不平衡網(wǎng)絡(luò)異常數(shù)據(jù)代價敏感特征及實(shí)例選擇[D];太原理工大學(xué);2016年

5 毛勇;基于支持向量機(jī)的特征選擇方法的研究與應(yīng)用[D];浙江大學(xué);2006年

6 裴志利;數(shù)據(jù)挖掘技術(shù)在文本分類和生物信息學(xué)中的應(yīng)用[D];吉林大學(xué);2008年

7 尹留志;關(guān)于非平衡數(shù)據(jù)特征問題的研究[D];中國科學(xué)技術(shù)大學(xué);2014年

8 張逸石;基于冗余—互補(bǔ)散度及特征包絡(luò)前沿的數(shù)據(jù)驅(qū)動特征選擇方法研究[D];華中科技大學(xué);2016年

9 于哲夫;一種新的特征選擇方法及其在路面使用性能分析中的應(yīng)用[D];大連海事大學(xué);2011年

10 畢超;人臉識別中若干特征優(yōu)化方法研究[D];東北師范大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 張堯;基于互信息的特征選擇方法研究[D];西安理工大學(xué);2019年

2 張英杰;基于文檔層詞頻重排序的特征選擇方法的研究與應(yīng)用[D];西安理工大學(xué);2019年

3 金姍姍;射頻指紋特征選擇與降維方法研究[D];哈爾濱工程大學(xué);2019年

4 潮洛蒙;基于信息熵和迭代SVM的特征選擇方法研究[D];哈爾濱工程大學(xué);2019年

5 張玉梅;基于流形規(guī)整的擴(kuò)展自適應(yīng)Lasso多類別特征選擇方法研究[D];安徽大學(xué);2019年

6 戴建國;基于類別概率的特征選擇方法[D];廣州大學(xué);2018年

7 黃磊;癌癥分類中基因選擇的收縮特征選擇算法研究[D];湖南大學(xué);2015年

8 李晨陽;腫瘤基因表達(dá)數(shù)據(jù)的特征選擇方法研究[D];蘭州交通大學(xué);2018年

9 余躍;兩階段特征選擇法研究及其在企業(yè)信用風(fēng)險評價中的應(yīng)用[D];北京交通大學(xué);2018年

10 董利梅;基于標(biāo)簽結(jié)構(gòu)的特征選擇方法研究[D];閩南師范大學(xué);2018年



本文編號:2707330

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2707330.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶87f51***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com