面向主機屬性的網(wǎng)絡測量
發(fā)布時間:2017-08-22 21:47
本文關鍵詞:面向主機屬性的網(wǎng)絡測量
更多相關文章: 網(wǎng)絡測量 主機屬性 機器學習 流量分析
【摘要】:網(wǎng)絡測量是獲取網(wǎng)絡運行參數(shù)的技術手段,為網(wǎng)絡管理和安全防護提供了重要的數(shù)據(jù)支持。傳統(tǒng)的網(wǎng)絡測量方法以網(wǎng)絡數(shù)據(jù)包或網(wǎng)絡流為測量對象,通過對它們的識別和分類達到測量的目的。但是,隨著加密協(xié)議的普及,私有協(xié)議的增多,越來越多的網(wǎng)絡流量無法通過面向數(shù)據(jù)包或面向網(wǎng)絡流的測量方法進行識別。面向主機的網(wǎng)絡測量方法可以利用同一主機活動的規(guī)律性和同類主機活動的相似性輔助識別網(wǎng)絡流量,從而有效解決網(wǎng)絡測量效果下降的問題。 面向主機的網(wǎng)絡測量研究涉及以下三方面的工作。一是主機屬性的提取和表示方法研究,二是基于主機屬性的主機行為分類研究,三是主機測量結果的分析方法研究。其中,主機屬性的提取和表示方法研究是其余兩方面研究工作的基礎和前提,是面向主機網(wǎng)絡測量的主要研究內(nèi)容。本文從分析主機產(chǎn)生流量的內(nèi)容、主機位置等多個角度的對主機屬性的提取和表示方法開展了詳細研究。 本文首先對使用明文協(xié)議網(wǎng)絡服務主機的屬性進行了提取。本文結合已有的研究成果和技術,從主機的流量統(tǒng)計信息、地理位置、連接模式和使用的網(wǎng)絡應用類型等方面對主機進行了屬性提取。然后,對使用加密服務和未知網(wǎng)絡服務主機的屬性進行了提取。通過使用機器學習算法對加密流量和未知流量中的長流進行了分類,根據(jù)分類結果提取了相關的主機屬性。此外,本文以三種典型的數(shù)據(jù)類型表示所有提取的主機屬性,并制定了主機屬性轉化規(guī)則,將主機屬性轉化為可用于機器學習或其他分析方法的特征向量。 基于上述研究,本文設計并實現(xiàn)了一個主機屬性提取和聚類分析原型系統(tǒng)。該系統(tǒng)能夠將網(wǎng)絡流量按主機層次匯聚,提取主機屬性,并利用基于密度的聚類算法對主機進行聚類分析。為了解決處理大規(guī)模網(wǎng)絡流量的性能瓶頸問題,優(yōu)化了該系統(tǒng)的核心數(shù)據(jù)結構,提高了系統(tǒng)的并行能力,并采用高性能的內(nèi)存數(shù)據(jù)庫存儲主機屬性。性能優(yōu)化后,該系統(tǒng)的吞吐能力提高了3倍,達到每秒7萬數(shù)據(jù)包的處理能力。
【關鍵詞】:網(wǎng)絡測量 主機屬性 機器學習 流量分析
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.06
【目錄】:
- 摘要4-5
- ABSTRACT5-7
- 目錄7-9
- 第一章 緒論9-14
- 1.1 研究背景與意義9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-11
- 1.3 主要研究內(nèi)容和貢獻11-12
- 1.4 本文的組織結構12-14
- 第二章 面向主機的網(wǎng)絡測量綜述14-20
- 2.1 網(wǎng)絡測量相關概念14-15
- 2.2 網(wǎng)絡流量識別技術15-16
- 2.3 面向主機的網(wǎng)絡測量16-19
- 2.3.1 基于流量內(nèi)容的主機行為分析17-18
- 2.3.2 基于連接關系的主機行為分析18-19
- 2.4 本章小結19-20
- 第三章 面向明文協(xié)議網(wǎng)絡服務主機的屬性提取20-29
- 3.1 實驗數(shù)據(jù)獲取及預處理20-21
- 3.2 面向IP的主機屬性提取21-24
- 3.2.1 主機流量統(tǒng)計信息屬性的提取21-22
- 3.2.2 主機地理屬性提取22
- 3.2.3 主機連接模式屬性提取22-24
- 3.3 面向應用的主機屬性提取24-28
- 3.3.1 主機使用的網(wǎng)絡應用相關屬性提取24-25
- 3.3.2 基于HTTP流量的主機屬性提取25-28
- 3.4 本章小結28-29
- 第四章 面向加密和未知網(wǎng)絡服務主機的屬性提取29-42
- 4.1 面向加密網(wǎng)絡服務主機的屬性提取29-39
- 4.1.1 常見加密協(xié)議介紹29-32
- 4.1.2 已標注流量數(shù)據(jù)獲取32-33
- 4.1.3 加密服務分類特征提取33-35
- 4.1.4 分類算法選擇35-37
- 4.1.5 分類結果評估及加密網(wǎng)絡服務主機屬性提取37-39
- 4.2 面向未知網(wǎng)絡服務主機的屬性提取39-41
- 4.2.1 未知流量中的“長尾”現(xiàn)象39-40
- 4.2.2 未知網(wǎng)絡服務主機屬性的提取40-41
- 4.3 本章小結41-42
- 第五章 主機屬性提取和聚類分析原型系統(tǒng)設計與實現(xiàn)42-53
- 5.1 系統(tǒng)架構設計42-43
- 5.2 功能模塊設計和實現(xiàn)43-49
- 5.2.1 流量數(shù)據(jù)采集模塊43-44
- 5.2.2 主機屬性提取模塊44-45
- 5.2.3 屬性存儲模塊45-46
- 5.2.4 特征預處理模塊46-47
- 5.2.5 主機聚類分析模塊47-49
- 5.3 系統(tǒng)優(yōu)化49-50
- 5.3.1 核心數(shù)據(jù)結構優(yōu)化49-50
- 5.3.2 系統(tǒng)并行性優(yōu)化50
- 5.4 主機屬性提取和聚類分析原型系統(tǒng)實驗結果評估50-51
- 5.5 本章小結51-53
- 第六章 總結和展望53-55
- 6.1 本文工作總結53
- 6.2 下一步工作53-55
- 參考文獻55-58
- 致謝58-59
- 攻讀碩士期間發(fā)表的學術論文59
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 熊剛;孟姣;曹自剛;王勇;郭莉;方濱興;;網(wǎng)絡流量分類研究進展與展望[J];集成技術;2012年01期
,本文編號:721161
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/721161.html
最近更新
教材專著