基于Web日志的異常檢測分析研究
發(fā)布時(shí)間:2017-10-15 19:41
本文關(guān)鍵詞:基于Web日志的異常檢測分析研究
更多相關(guān)文章: Web日志 Web拓?fù)浣Y(jié)構(gòu) 訪問量 異常檢測
【摘要】:隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和普及,網(wǎng)上沖浪逐漸改變著人們?nèi)粘=涣骱拖M(fèi)的格局。搜索引擎、社交網(wǎng)絡(luò)以及網(wǎng)上購物等Web應(yīng)用的涌現(xiàn)在給我們的生活帶來方便的同時(shí),個(gè)人隱私的保護(hù)和互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)的安全也面臨前所未有的挑戰(zhàn),各種新奇的攻擊技術(shù)層出不窮。通常來講,當(dāng)網(wǎng)站遭受攻擊之后,攻擊者可能會(huì)在Web日志中留下一定的痕跡,通過分析Web日志來了解黑客的攻擊行為是Web安全分析的一種重要手段。本文在分析已有的關(guān)于Web日志異常分析技術(shù)的基礎(chǔ)上,重點(diǎn)研究了Web日志屬性的定義和選取。在定義的Web日志屬性基礎(chǔ)上,提出了兩種對Web日志進(jìn)行異常檢測分析的方法,從而發(fā)現(xiàn)異常訪問行為。論文所做的主要研究工作如下:一、從表層屬性和隱含屬性兩個(gè)方面對Web日志屬性進(jìn)行定義和分析,為后文兩種異常檢測方法奠定基礎(chǔ)。二、基于已定義的Web日志屬性,提出兩種對Web日志進(jìn)行異常檢測的分析方法:(1)基于Web應(yīng)用拓?fù)浣Y(jié)構(gòu)的異常檢測方法。其中包括屬性的選擇,日志的預(yù)處理,Web拓?fù)錁?gòu)造,根據(jù)選擇的屬性及構(gòu)造的Web拓?fù)鋵?shí)驗(yàn)數(shù)據(jù)進(jìn)行檢測。(2)基于每小時(shí)訪問量的異常檢測方法。其中包括日志的預(yù)處理,訪問量的統(tǒng)計(jì)分析,基于一元線性回歸模型的檢測算法。通過統(tǒng)計(jì)分析得知:Web日志中每小時(shí)總請求數(shù)與總成功數(shù)是線性相關(guān)的;采用一元線性回歸模型進(jìn)行建模,用最小二乘法求出每小時(shí)總請求數(shù)與每小時(shí)訪問總成功數(shù)的比值與時(shí)間之間的回歸方程,建立異常檢測模型,然后使用該模型對待測Web日志進(jìn)行分析檢測。
【關(guān)鍵詞】:Web日志 Web拓?fù)浣Y(jié)構(gòu) 訪問量 異常檢測
【學(xué)位授予單位】:陜西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.08
【目錄】:
- 摘要3-4
- Abstract4-8
- 第1章 緒論8-14
- 1.1 研究背景與意義8-9
- 1.2 國內(nèi)外研究現(xiàn)狀9-10
- 1.3 研究動(dòng)機(jī)與研究內(nèi)容10-12
- 1.4 論文組織結(jié)構(gòu)12
- 1.5 本章總結(jié)12-14
- 第2章 Web日志屬性定義14-24
- 2.1 Web日志介紹14-18
- 2.1.1 Web日志形成的原理14-15
- 2.1.2 Web日志格式15-18
- 2.2 日志異常檢測步驟18-19
- 2.3 Web日志實(shí)驗(yàn)數(shù)據(jù)集19-20
- 2.4 Web日志屬性定義20-22
- 2.5 本章總結(jié)22-24
- 第3章 Web應(yīng)用拓?fù)浞治?/span>24-36
- 3.1 預(yù)處理24-28
- 3.1.1 概念定義24-26
- 3.1.2 屬性選擇26-27
- 3.1.3 預(yù)處理步驟27-28
- 3.2 拓?fù)錁?gòu)建與異常檢測分析方法28-31
- 3.2.1 帶請求參數(shù)屬性的Web拓?fù)浣Y(jié)構(gòu)分析28-29
- 3.2.2 拓?fù)錁?gòu)建29-30
- 3.2.3 異常檢測算法30-31
- 3.3 實(shí)驗(yàn)和分析31-35
- 3.3.1 實(shí)驗(yàn)設(shè)計(jì)31-32
- 3.3.2 實(shí)驗(yàn)結(jié)果與分析32-35
- 3.4 本章總結(jié)35-36
- 第4章 Web應(yīng)用訪問量分析36-58
- 4.1 概述36-37
- 4.2 數(shù)據(jù)源37
- 4.3 Web日志訪問量分布特征37-48
- 4.3.1 統(tǒng)計(jì)分析37-38
- 4.3.2 訪問量隨時(shí)間的分布38-43
- 4.3.3 每小時(shí)訪問量比值隨時(shí)間分布43-48
- 4.4 訪問量分析算法與步驟48-51
- 4.4.1 一元線性回歸模型和最小二乘法48-50
- 4.4.2 分析算法和步驟50-51
- 4.5 實(shí)驗(yàn)和測試51-56
- 4.5.1 實(shí)驗(yàn)設(shè)計(jì)51
- 4.5.2 實(shí)驗(yàn)結(jié)果和分析51-56
- 4.6 本章總結(jié)56-58
- 第5章 總結(jié)與展望58-60
- 5.1 總結(jié)58-59
- 5.2 展望59-60
- 參考文獻(xiàn)60-66
- 致謝66-68
- 攻讀學(xué)位期間研究成果68
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 歐陽一鳴,汪曦東,郭駿,劉紅櫻;Web使用挖掘數(shù)據(jù)預(yù)處理中的會(huì)話構(gòu)造[J];計(jì)算機(jī)工程與應(yīng)用;2005年25期
2 陳子軍;王鑫昱;李偉;;一種Web日志會(huì)話識(shí)別的優(yōu)化方法[J];計(jì)算機(jī)工程;2007年01期
3 李烈彪;張海鵬;周亞峰;;Web日志挖掘中數(shù)據(jù)預(yù)處理方法的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年07期
4 張海強(qiáng);胡學(xué)龍;;一種基于引用日志文件的啟發(fā)式會(huì)話識(shí)別算法[J];揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 范春榮;基于Web日志的入侵檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];河北科技大學(xué);2012年
,本文編號(hào):1038277
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1038277.html
最近更新
教材專著