面向日志分類的蟻群聚類算法研究
發(fā)布時間:2017-04-12 02:01
本文關(guān)鍵詞:面向日志分類的蟻群聚類算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人們對于網(wǎng)絡(luò)依賴程度的加深,網(wǎng)絡(luò)安全中的問題以及個人信息和隱私的保護(hù)受到了廣泛關(guān)注,成為研究的熱點問題。網(wǎng)絡(luò)中的設(shè)備如服務(wù)器主機、防火墻、交換機、路由器等都會記錄日志,通過對日志數(shù)據(jù)的分析來發(fā)現(xiàn)網(wǎng)絡(luò)中的異常行為是研究網(wǎng)絡(luò)安全的一種重要方法。 數(shù)據(jù)挖掘為從大量數(shù)據(jù)中搜索關(guān)聯(lián)信息提供了方法。在數(shù)據(jù)挖掘中,蟻群聚類算法是一種優(yōu)秀的聚類算法,可以在不具備任何先驗知識的情況下實現(xiàn)自主聚類,并且具有靈活性、健壯性和可視化等優(yōu)點。但是,由于蟻群聚類算法的聚類時間花費較長,在聚類效率和聚類的準(zhǔn)確率上都還有很多改進(jìn)和提高的空間。在日志分析領(lǐng)域,對蟻群聚類算法的研究也很少。日志文本有其自身的特點,如果針對日志文本的特點有效地將日志文本轉(zhuǎn)化為向量,將更有利于聚類的劃分。 針對以上這些問題,本文對蟻群聚類算法進(jìn)行了深入的研究,并對算法提出改進(jìn)。本文首先結(jié)合日志文本的特點,提出一種新的將日志轉(zhuǎn)換為向量的方法,該方法使轉(zhuǎn)換后的向量盡量保留了原始日志文本中詞的信息。本文從兩個方面改進(jìn)蟻群聚類算法。第,為蟻群設(shè)置記憶,記錄最近被成功放下的對象及其位置信息,減少了離群點和錯分點的數(shù)量,提高了聚類的準(zhǔn)確率和效率。第二,增加對象適應(yīng)度列表,改進(jìn)螞蟻拾取對象策略,提高了聚類質(zhì)量。 最后,在實驗中通過對比不同算法對日志數(shù)據(jù)集進(jìn)行聚類的結(jié)果,驗證了改進(jìn)的有效性。本文中改進(jìn)后的算法在時間花費可以接受的情況下,聚類準(zhǔn)確率和聚類質(zhì)量都大幅提高。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 蟻群聚類 日志分類 集群智能
【學(xué)位授予單位】:華東理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.13;TP393.08
【目錄】:
- 摘要5-6
- Abstract6-9
- 第1章 緒論9-16
- 1.1 研究背景9-10
- 1.2 研究現(xiàn)狀10-13
- 1.2.1 使用頻繁項集建立日志分類器10-11
- 1.2.2 日志時間序列算法的研究11-12
- 1.2.3 蟻群聚類算法的研究12-13
- 1.3 研究內(nèi)容和目標(biāo)13-14
- 1.3.1 日志文本到向量模型轉(zhuǎn)換的研究13
- 1.3.2 蟻群聚類算法的研究13-14
- 1.4 本文的組織結(jié)構(gòu)14-16
- 第2章 日志數(shù)據(jù)挖掘概述16-28
- 2.1 網(wǎng)絡(luò)環(huán)境及日志的采集16-18
- 2.2 日志數(shù)據(jù)挖掘算法介紹18-22
- 2.2.1 Apriori算法18-19
- 2.2.2 FP-tree算法19-20
- 2.2.3 基于距離的異常檢測方法20-22
- 2.3 蟻群聚類相關(guān)算法22-27
- 2.3.1 蟻群聚類算法22-24
- 2.3.2 蟻群聚類算法與其他算法相結(jié)合24-27
- 2.4 本章小結(jié)27-28
- 第3章 日志文本向量化研究28-37
- 3.1 文本檢索簡介28-34
- 3.1.1 索引28-30
- 3.1.2 創(chuàng)建索引30-34
- 3.2 根據(jù)日志文本索引建立向量34-36
- 3.2.1 日志向量的建立過程34-35
- 3.2.2 加權(quán)方式的比較35-36
- 3.2.3 距離公式的選取36
- 3.3 本章小結(jié)36-37
- 第4章 蟻群聚類算法的改進(jìn)37-46
- 4.1 螞蟻記憶改進(jìn)為蟻群記憶37-41
- 4.1.1 存在的問題37-40
- 4.1.2 為算法設(shè)置蟻群記憶40-41
- 4.2 設(shè)置對象適應(yīng)度列表41-45
- 4.2.1 原算法中存在的問題41-42
- 4.2.2 設(shè)置對象適應(yīng)度列表的改進(jìn)方法42
- 4.2.3 算法的改進(jìn)在系統(tǒng)中的實現(xiàn)42-45
- 4.3 本章小結(jié)45-46
- 第5章 實驗及分析46-58
- 5.1 日志采集及預(yù)處理46-49
- 5.1.1 日志采集系統(tǒng)46-48
- 5.1.2 日志轉(zhuǎn)換為向量48-49
- 5.2 聚類結(jié)果處理及評價49-51
- 5.2.1 實驗結(jié)果的處理49-50
- 5.2.2 實驗評價指標(biāo)50-51
- 5.3 實驗結(jié)果及分析51-57
- 5.4 本章小結(jié)57-58
- 第6章 總結(jié)與展望58-60
- 6.1 本文總結(jié)58-59
- 6.2 展望59-60
- 參考文獻(xiàn)60-63
- 致謝63
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 段丹青;陳松喬;楊衛(wèi)平;;基于SVM主動學(xué)習(xí)的入侵檢測系統(tǒng)[J];計算機工程;2007年01期
本文關(guān)鍵詞:面向日志分類的蟻群聚類算法研究,,由筆耕文化傳播整理發(fā)布。
本文編號:300434
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/300434.html
最近更新
教材專著