天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向日志分類的蟻群聚類算法研究

發(fā)布時間:2017-04-12 02:01

  本文關(guān)鍵詞:面向日志分類的蟻群聚類算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著人們對于網(wǎng)絡(luò)依賴程度的加深,網(wǎng)絡(luò)安全中的問題以及個人信息和隱私的保護(hù)受到了廣泛關(guān)注,成為研究的熱點問題。網(wǎng)絡(luò)中的設(shè)備如服務(wù)器主機、防火墻、交換機、路由器等都會記錄日志,通過對日志數(shù)據(jù)的分析來發(fā)現(xiàn)網(wǎng)絡(luò)中的異常行為是研究網(wǎng)絡(luò)安全的一種重要方法。 數(shù)據(jù)挖掘為從大量數(shù)據(jù)中搜索關(guān)聯(lián)信息提供了方法。在數(shù)據(jù)挖掘中,蟻群聚類算法是一種優(yōu)秀的聚類算法,可以在不具備任何先驗知識的情況下實現(xiàn)自主聚類,并且具有靈活性、健壯性和可視化等優(yōu)點。但是,由于蟻群聚類算法的聚類時間花費較長,在聚類效率和聚類的準(zhǔn)確率上都還有很多改進(jìn)和提高的空間。在日志分析領(lǐng)域,對蟻群聚類算法的研究也很少。日志文本有其自身的特點,如果針對日志文本的特點有效地將日志文本轉(zhuǎn)化為向量,將更有利于聚類的劃分。 針對以上這些問題,本文對蟻群聚類算法進(jìn)行了深入的研究,并對算法提出改進(jìn)。本文首先結(jié)合日志文本的特點,提出一種新的將日志轉(zhuǎn)換為向量的方法,該方法使轉(zhuǎn)換后的向量盡量保留了原始日志文本中詞的信息。本文從兩個方面改進(jìn)蟻群聚類算法。第,為蟻群設(shè)置記憶,記錄最近被成功放下的對象及其位置信息,減少了離群點和錯分點的數(shù)量,提高了聚類的準(zhǔn)確率和效率。第二,增加對象適應(yīng)度列表,改進(jìn)螞蟻拾取對象策略,提高了聚類質(zhì)量。 最后,在實驗中通過對比不同算法對日志數(shù)據(jù)集進(jìn)行聚類的結(jié)果,驗證了改進(jìn)的有效性。本文中改進(jìn)后的算法在時間花費可以接受的情況下,聚類準(zhǔn)確率和聚類質(zhì)量都大幅提高。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 蟻群聚類 日志分類 集群智能
【學(xué)位授予單位】:華東理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.13;TP393.08
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第1章 緒論9-16
  • 1.1 研究背景9-10
  • 1.2 研究現(xiàn)狀10-13
  • 1.2.1 使用頻繁項集建立日志分類器10-11
  • 1.2.2 日志時間序列算法的研究11-12
  • 1.2.3 蟻群聚類算法的研究12-13
  • 1.3 研究內(nèi)容和目標(biāo)13-14
  • 1.3.1 日志文本到向量模型轉(zhuǎn)換的研究13
  • 1.3.2 蟻群聚類算法的研究13-14
  • 1.4 本文的組織結(jié)構(gòu)14-16
  • 第2章 日志數(shù)據(jù)挖掘概述16-28
  • 2.1 網(wǎng)絡(luò)環(huán)境及日志的采集16-18
  • 2.2 日志數(shù)據(jù)挖掘算法介紹18-22
  • 2.2.1 Apriori算法18-19
  • 2.2.2 FP-tree算法19-20
  • 2.2.3 基于距離的異常檢測方法20-22
  • 2.3 蟻群聚類相關(guān)算法22-27
  • 2.3.1 蟻群聚類算法22-24
  • 2.3.2 蟻群聚類算法與其他算法相結(jié)合24-27
  • 2.4 本章小結(jié)27-28
  • 第3章 日志文本向量化研究28-37
  • 3.1 文本檢索簡介28-34
  • 3.1.1 索引28-30
  • 3.1.2 創(chuàng)建索引30-34
  • 3.2 根據(jù)日志文本索引建立向量34-36
  • 3.2.1 日志向量的建立過程34-35
  • 3.2.2 加權(quán)方式的比較35-36
  • 3.2.3 距離公式的選取36
  • 3.3 本章小結(jié)36-37
  • 第4章 蟻群聚類算法的改進(jìn)37-46
  • 4.1 螞蟻記憶改進(jìn)為蟻群記憶37-41
  • 4.1.1 存在的問題37-40
  • 4.1.2 為算法設(shè)置蟻群記憶40-41
  • 4.2 設(shè)置對象適應(yīng)度列表41-45
  • 4.2.1 原算法中存在的問題41-42
  • 4.2.2 設(shè)置對象適應(yīng)度列表的改進(jìn)方法42
  • 4.2.3 算法的改進(jìn)在系統(tǒng)中的實現(xiàn)42-45
  • 4.3 本章小結(jié)45-46
  • 第5章 實驗及分析46-58
  • 5.1 日志采集及預(yù)處理46-49
  • 5.1.1 日志采集系統(tǒng)46-48
  • 5.1.2 日志轉(zhuǎn)換為向量48-49
  • 5.2 聚類結(jié)果處理及評價49-51
  • 5.2.1 實驗結(jié)果的處理49-50
  • 5.2.2 實驗評價指標(biāo)50-51
  • 5.3 實驗結(jié)果及分析51-57
  • 5.4 本章小結(jié)57-58
  • 第6章 總結(jié)與展望58-60
  • 6.1 本文總結(jié)58-59
  • 6.2 展望59-60
  • 參考文獻(xiàn)60-63
  • 致謝63

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 段丹青;陳松喬;楊衛(wèi)平;;基于SVM主動學(xué)習(xí)的入侵檢測系統(tǒng)[J];計算機工程;2007年01期


  本文關(guān)鍵詞:面向日志分類的蟻群聚類算法研究,,由筆耕文化傳播整理發(fā)布。



本文編號:300434

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/300434.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a10a7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com