天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本分類技術(shù)的漏洞分類

發(fā)布時(shí)間:2017-08-21 23:39

  本文關(guān)鍵詞:基于文本分類技術(shù)的漏洞分類


  更多相關(guān)文章: 漏洞分類 機(jī)器學(xué)習(xí) 模糊熵 類別熵


【摘要】:伴隨著信息技術(shù)的飛躍發(fā)展,計(jì)算機(jī)應(yīng)用的不斷普及,人們的生產(chǎn)生活已經(jīng)無(wú)法離開這個(gè)不可或缺的工具。隨之而來(lái)的則是計(jì)算機(jī)和網(wǎng)絡(luò)所帶來(lái)的安全問(wèn)題。計(jì)算機(jī)和網(wǎng)絡(luò)的安全問(wèn)題成為近幾年來(lái)信息安全領(lǐng)域中的研究熱點(diǎn)。計(jì)算機(jī)上的操作系統(tǒng)和應(yīng)用軟件中存在的安全漏洞則成為計(jì)算機(jī)和網(wǎng)絡(luò)安全的罪魁禍?zhǔn)。同時(shí),由于近幾年來(lái)計(jì)算機(jī)上的安全漏洞呈現(xiàn)爆炸式的增長(zhǎng),如何有效地對(duì)已存在的漏洞進(jìn)行分類,則成為計(jì)算機(jī)漏洞有效管理的瓶頸。本文的主要工作是針對(duì)漏洞分類技術(shù)的研究,將文本分類技術(shù)作為漏洞分類技術(shù)的支撐,故而漏洞分類以漏洞文本為依據(jù);同時(shí)深入學(xué)習(xí)了機(jī)器學(xué)習(xí)中有關(guān)信息熵的相關(guān)理論知識(shí),為下文提出的基于模糊熵的漏洞文本特征提取算法和基于類別熵的二叉樹多類支持向量機(jī)的漏洞分類算法做理論支撐。最后通過(guò)收集國(guó)際通用的公共漏洞和暴露(CVE)列表中的相關(guān)漏洞文本信息和參考國(guó)際上通用的弱點(diǎn)枚舉(CWE)對(duì)漏洞分類類別的定義,結(jié)合二者為本文的漏洞分類實(shí)驗(yàn)做數(shù)據(jù)支撐。具體工作如下:(1)給出了計(jì)算機(jī)漏洞的定義和漏洞分類的原理;深入分析文本分類的特點(diǎn)和文本分類的六個(gè)步驟;深入研究了機(jī)器學(xué)習(xí)中的有關(guān)本文所使用的分類算法。(2)將信息熵理論和模糊集理論結(jié)合起來(lái),闡述了模糊熵的概念,并將模糊熵應(yīng)用于漏洞文本特征的提取中,提出基于模糊熵的漏洞文本特征提取算法。根據(jù)此算法將計(jì)算出的每個(gè)特征的模糊熵值按升序排列,取熵值較小的特征組成特征子集,并對(duì)特征子集中的特征進(jìn)行加權(quán)后構(gòu)成漏洞向量空間。通過(guò)實(shí)驗(yàn)與其他兩種常見的且特征提取效果良好的提取算法進(jìn)行分類對(duì)比實(shí)驗(yàn),進(jìn)而體現(xiàn)本文提出的特征提取算法的優(yōu)越性和先進(jìn)性。(3)將類別熵和二叉樹在分類中的優(yōu)點(diǎn)結(jié)合起來(lái),提出基于類別熵的二叉樹多類SVM的分類算法,并將此算法應(yīng)用于漏洞分類中。同時(shí)為了可以通過(guò)計(jì)算漏洞類別的熵值來(lái)量化樣本分布的混亂程度,還定義漏洞類別的最小超球體和延伸超球體這兩個(gè)概念來(lái)分別描述某一類別的漏洞樣本空間中的聚集程度和與其周邊不同漏洞類別的樣本的混亂程度。(4)最后從CVE列表中收集到3000個(gè)漏洞作為實(shí)驗(yàn)數(shù)據(jù),取出其中的2500個(gè)漏洞作為訓(xùn)練基于類別熵的二叉樹多類SVM的分類算法的訓(xùn)練樣本,剩余的用于測(cè)試分類模型的測(cè)試樣本。通過(guò)與基于KNN和基于二叉樹多類SVM的漏洞分類算法進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證本文提出的漏洞分類算法的準(zhǔn)確性和先進(jìn)性。測(cè)試實(shí)驗(yàn)結(jié)果表明,本文提出的漏洞分類的平均正確率高達(dá)93.3%。本文的研究成果能夠大大提高漏洞的修復(fù)和分析等管理的效率,能夠最大限度的減少計(jì)算機(jī)漏洞管理所需要的人力物力,故而具有一定的應(yīng)用研究?jī)r(jià)值。
【關(guān)鍵詞】:漏洞分類 機(jī)器學(xué)習(xí) 模糊熵 類別熵
【學(xué)位授予單位】:貴州師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1;TP393.08
【目錄】:
  • 摘要5-7
  • Abstract7-11
  • 第一章 緒論11-15
  • 1.1 課題來(lái)源11
  • 1.2 課題的背景11-12
  • 1.3 課題研究的目的和意義12
  • 1.4 國(guó)內(nèi)外研究概況12-13
  • 1.5 本文的研究?jī)?nèi)容13-14
  • 1.6 本章小結(jié)14-15
  • 第二章 漏洞分類15-21
  • 2.1 漏洞分類的理論基礎(chǔ)15-16
  • 2.1.1 計(jì)算機(jī)漏洞的定義15
  • 2.1.2 漏洞分類的原理15-16
  • 2.2 文本分類16-17
  • 2.2.1 文本分類的特點(diǎn)16
  • 2.2.2 文本分類的流程16-17
  • 2.3 機(jī)器學(xué)習(xí)(Machine Learning, ML)17-20
  • 2.3.1 機(jī)器學(xué)習(xí)的定義17
  • 2.3.2 機(jī)器學(xué)習(xí)中的相關(guān)算法簡(jiǎn)介17-20
  • 2.4 本章小結(jié)20-21
  • 第三章 基于模糊熵的漏洞文本特征提取算法21-27
  • 3.1 常見的特征提取算法21-22
  • 3.1.1 文本頻數(shù)(DF)21
  • 3.1.2 2c統(tǒng)計(jì)量21-22
  • 3.2 模糊理論22
  • 3.3 隸屬度函數(shù)的設(shè)計(jì)22-23
  • 3.4 模糊熵的計(jì)算23-24
  • 3.5 基于模糊熵的漏洞特征選擇算法24
  • 3.6 實(shí)驗(yàn)對(duì)比與分析24-26
  • 3.6.1 實(shí)驗(yàn)數(shù)據(jù)的來(lái)源24-25
  • 3.6.2 實(shí)驗(yàn)步驟25
  • 3.6.3 實(shí)驗(yàn)結(jié)果的對(duì)比25-26
  • 3.6.4 實(shí)驗(yàn)結(jié)果分析26
  • 3.7 本章小結(jié)26-27
  • 第四章 基于類別熵的二叉樹多類SVM的漏洞分類算法27-32
  • 4.1 類別熵27
  • 4.2 構(gòu)建基于類別熵的二叉樹27-28
  • 4.2.1 傳統(tǒng)的二叉樹構(gòu)建27-28
  • 4.2.2 基于類別熵的二叉樹的構(gòu)建思路28
  • 4.3 基于類別熵的二叉樹多類SVM的漏洞分類算法28-31
  • 4.3.1 算法的相關(guān)說(shuō)明28-30
  • 4.3.2 構(gòu)建分類算法30-31
  • 4.4 本章小結(jié)31-32
  • 第五章 漏洞自動(dòng)化分類的實(shí)現(xiàn)32-45
  • 5.1 漏洞分類模型設(shè)計(jì)32-33
  • 5.2 漏洞分類的實(shí)驗(yàn)過(guò)程33-41
  • 5.2.1 發(fā)現(xiàn)漏洞33-35
  • 5.2.2 漏洞文本信息的收集35-36
  • 5.2.3 漏洞文本信息預(yù)處理36-38
  • 5.2.4 特征詞集的建立與漏洞的向量38-40
  • 5.2.5 訓(xùn)練漏洞分類模型40
  • 5.2.6 分類性能的評(píng)估40-41
  • 5.3 漏洞分類的實(shí)驗(yàn)與結(jié)果分析41-44
  • 5.3.1 實(shí)驗(yàn)數(shù)據(jù)來(lái)源41
  • 5.3.2 實(shí)驗(yàn)步驟41-42
  • 5.3.3 分類實(shí)驗(yàn)結(jié)果42-43
  • 5.3.4 實(shí)驗(yàn)結(jié)果分析43-44
  • 5.4 本章小結(jié)44-45
  • 第六章 結(jié)束語(yǔ)45-47
  • 6.1 主要工作和創(chuàng)新點(diǎn)45
  • 6.2 后續(xù)研究工作45-47
  • 參考文獻(xiàn)47-51
  • 致謝51-52
  • 攻讀碩士學(xué)位期間取得的成果52-53

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條

1 張濤;吳沖;;信息系統(tǒng)安全漏洞研究[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2008年04期

2 劉健;劉忠;熊鷹;;改進(jìn)的二叉樹支持向量機(jī)多類分類算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年33期

3 李仁兵;李艾華;蔡艷平;李亮;王濤;;基于歐氏距離的支持向量機(jī)拒識(shí)區(qū)域解決方案[J];計(jì)算機(jī)應(yīng)用;2010年02期

4 謝娟英;張兵權(quán);汪萬(wàn)紫;;基于雙支持向量機(jī)的偏二叉樹多類分類算法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期

5 魯松,白碩,黃雄;基于向量空間模型中義項(xiàng)詞語(yǔ)的無(wú)導(dǎo)詞義消歧[J];軟件學(xué)報(bào);2002年06期



本文編號(hào):715855

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/715855.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶61603***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com