分布式惡意網(wǎng)站檢測模型研究
發(fā)布時間:2017-05-15 16:24
本文關(guān)鍵詞:分布式惡意網(wǎng)站檢測模型研究,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)的出現(xiàn)給經(jīng)濟發(fā)展帶來了新的機遇,但也帶來了新的挑戰(zhàn)。就在人們對互聯(lián)網(wǎng)的依賴越來越深的同時,數(shù)以百萬計的不法分子正在互聯(lián)網(wǎng)上通過惡意網(wǎng)站進行詐騙和傳播惡意軟件,這些非法行為無時無刻不威脅著人們的隱私和財產(chǎn)安全。為了保護普通用戶的合法權(quán)益,惡意網(wǎng)站的檢測方法應(yīng)運而生。然而在黑客技術(shù)飛速更新和大數(shù)據(jù)大行其道的當(dāng)下,傳統(tǒng)的檢測方法存在著很多局限性。由此,該文提出了一種基于在線學(xué)習(xí)的分布式惡意網(wǎng)站檢測模型,其主要的工作內(nèi)容如下:(1)對惡意網(wǎng)站檢測方法進行了深入研究分析,分析了現(xiàn)有檢測方法的局限性和不足,并重點分析了基于機器學(xué)習(xí)的惡意網(wǎng)站檢測方法;(2)對惡意網(wǎng)站特征進行了詳細分析,提出了一種基于WOE算法的域名注冊機構(gòu)特征提取方法。該方法僅使用一個特征來表示不同域名注冊機構(gòu)對惡意網(wǎng)站的相關(guān)度,不僅降低了特征向量維度,還可以有效適應(yīng)新注冊機構(gòu)出現(xiàn)的情況;(3)對在線學(xué)習(xí)算法進行了深入分析和研究,提出了一種改進的學(xué)習(xí)率選取方法。該方法采用多維學(xué)習(xí)率,為每一個特征設(shè)置不同的學(xué)習(xí)率,并根據(jù)惡意特征的檢出情況來單獨進行動態(tài)調(diào)整,避免了使用統(tǒng)一學(xué)習(xí)率而導(dǎo)致對低檢出率特征學(xué)習(xí)不足的問題,從而提高了檢測效果;(4)對分布式并行策略進行了分析,提出了一種基于特征切分的分布式在線學(xué)習(xí)模型。該模型將特征的提取以及在線學(xué)習(xí)的訓(xùn)練過程分布到多臺機器之上,具有較好的橫向擴展能力,達到了處理大數(shù)據(jù)的目的;谝陨涎芯,該文采用Java作為開發(fā)語言,設(shè)計和實現(xiàn)了基于在線學(xué)習(xí)算法的分布式惡意網(wǎng)站檢測系統(tǒng),該系統(tǒng)包括特征提取模塊,在線學(xué)習(xí)和預(yù)測模塊以及WEB交互模塊。且通過實驗對系統(tǒng)進行了性能分析,實驗結(jié)果論證了該系統(tǒng)的有效性、正確性和實用性。
【關(guān)鍵詞】:惡意網(wǎng)站 在線學(xué)習(xí) 機器學(xué)習(xí) 分布式
【學(xué)位授予單位】:重慶理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 1 緒論9-18
- 1.1 課題背景與研究意義9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-16
- 1.2.1 特征匹配10-12
- 1.2.2 蜜罐技術(shù)12-14
- 1.2.3 機器學(xué)習(xí)14-16
- 1.2.4 其他方法16
- 1.3 本文的研究內(nèi)容16
- 1.4 本文的組織結(jié)構(gòu)16-18
- 2 機器學(xué)習(xí)基礎(chǔ)18-25
- 2.1 機器學(xué)習(xí)的基本概述18-19
- 2.2 常用的分類算法19-23
- 2.2.1 樸素貝葉斯(Naive-Bayesian)19-20
- 2.2.2 K最近鄰算法(K-Nearest-Neighbor,KNN)20-21
- 2.2.3 Logistic回歸(Logistic-Regression)21-23
- 2.3 本章小結(jié)23-25
- 3 基于在線學(xué)習(xí)的惡意網(wǎng)站檢測方法25-42
- 3.1 特征提取25-30
- 3.1.1 HTML特征25-26
- 3.1.2 JavaScript特征26-27
- 3.1.3 URL和主機特征27-29
- 3.1.4 基于WOE算法的域名注冊機構(gòu)特征提取方法29-30
- 3.2 在線學(xué)習(xí)算法30-36
- 3.2.1 Perceptron算法31-32
- 3.2.2 CW(Confidence-Weighted)算法32-33
- 3.2.3 OGD(Online-Gradient-Descent)算法33-34
- 3.2.4 對OGD算法學(xué)習(xí)率的改進34-36
- 3.3 對比實驗36-40
- 3.3.1 實驗數(shù)據(jù)36-37
- 3.3.2 實驗環(huán)境37
- 3.3.3 在線學(xué)習(xí)算法對比實驗37-39
- 3.3.4 改進OGD學(xué)習(xí)率后的效果39-40
- 3.4 本章小結(jié)40-42
- 4 分布式系統(tǒng)設(shè)計與實現(xiàn)42-54
- 4.1 并行策略42-43
- 4.2 分布式在線學(xué)習(xí)算法43-44
- 4.3 系統(tǒng)設(shè)計與實現(xiàn)44-50
- 4.3.1 特征提取模塊45-47
- 4.3.2 在線學(xué)習(xí)和預(yù)測模塊47-49
- 4.3.3 WEB交互模塊49-50
- 4.4 對比實驗50-52
- 4.4.1 實驗數(shù)據(jù)50
- 4.4.2 實驗環(huán)境50
- 4.4.3 采用分布式架構(gòu)后的效果50-52
- 4.5 本章小結(jié)52-54
- 5 總結(jié)與展望54-56
- 5.1 全文總結(jié)54-55
- 5.2 展望55-56
- 致謝56-58
- 參考文獻58-62
- 個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文及取得的研究成果62
【參考文獻】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 魏為;基于內(nèi)容的網(wǎng)頁惡意代碼檢測的研究與實現(xiàn)[D];華中科技大學(xué);2011年
2 張小康;基于數(shù)據(jù)挖掘和機器學(xué)習(xí)的惡意代碼檢測技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2009年
本文關(guān)鍵詞:分布式惡意網(wǎng)站檢測模型研究,,由筆耕文化傳播整理發(fā)布。
本文編號:368299
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/368299.html
最近更新
教材專著