基于數(shù)據(jù)挖掘分類算法的釣魚網(wǎng)站檢測研究
發(fā)布時間:2021-08-16 15:51
近年來,隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)逐漸成為人們工作、學(xué)習(xí)、購物以及金融交易等活動的平臺,他給人們的工作和生活帶來了很大的便利,在電子商務(wù)及電子金融產(chǎn)業(yè)日漸繁榮的同時,網(wǎng)絡(luò)安全問題日益凸顯,其中,釣魚網(wǎng)站的危害尤其嚴(yán)重。釣魚網(wǎng)站是一種基于社會工程學(xué)的攻擊手段,是不法分子針對用戶身份數(shù)據(jù)和金融賬號進(jìn)行欺騙的犯罪機(jī)制。釣魚網(wǎng)站的網(wǎng)址、網(wǎng)頁內(nèi)容、布局等與真實(shí)網(wǎng)站極其相似,這使得沒有安全意識的網(wǎng)民及其容易因此上當(dāng)受騙,網(wǎng)絡(luò)釣魚在給人們帶來巨大經(jīng)濟(jì)損失的同時也嚴(yán)重阻礙了電子商務(wù)的發(fā)展。有效遏制釣魚網(wǎng)站是網(wǎng)絡(luò)安全的保障,對網(wǎng)絡(luò)釣魚攻擊的檢測防御研究迫在眉睫。目前,國內(nèi)外在防御釣魚網(wǎng)站的研究上各有建樹,然而都存在缺陷。近年來,在釣魚網(wǎng)站檢測方法的研究中,機(jī)器學(xué)習(xí)的應(yīng)用取得巨大成效,將機(jī)器學(xué)習(xí)中各種分類算法應(yīng)用于釣魚網(wǎng)站檢測識別可以有效得提高檢測效率。因此,本文研究基于數(shù)據(jù)挖掘分類算法的釣魚網(wǎng)站識別方法,本文研究重點(diǎn)在于分析比較機(jī)器學(xué)習(xí)中不同分類器算法在釣魚網(wǎng)站檢測上的分類性能。本文的主要工作分為三個部分,首先,本文采用PCA主成分分析法,對選取的釣魚網(wǎng)站URL異常特征和多源融合特征的重要程度進(jìn)行分析,獲取...
【文章來源】:內(nèi)蒙古財經(jīng)大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.2.3 文獻(xiàn)綜述
1.3 論文主要研究內(nèi)容及結(jié)構(gòu)安排
1.3.1 論文主要研究內(nèi)容
1.3.2 論文結(jié)構(gòu)安排
第2章 相關(guān)理論研究
2.1 網(wǎng)絡(luò)釣魚
2.1.1 網(wǎng)絡(luò)釣魚攻擊原理
2.1.2 釣魚網(wǎng)站傳播方式
2.1.3 常見幾類釣魚網(wǎng)站
2.1.4 攻擊類別
2.2 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)
2.2.1 數(shù)據(jù)挖掘
2.2.2 機(jī)器學(xué)習(xí)
2.3 分類問題概述
2.4 不平衡分類問題概述
2.4.1 不平衡數(shù)據(jù)分類的基本概念
2.4.2 不平衡數(shù)據(jù)分類評價指標(biāo)
第3章 釣魚網(wǎng)站特征提取與特征選擇
3.1 釣魚網(wǎng)站特征提取
3.2 釣魚網(wǎng)站特征選擇
3.2.1 PCA主成分分析法
3.2.2 特征選擇與分析
第4章 分類器模型的比較
4.1 基于三種分類算法的釣魚網(wǎng)站檢測模型
4.1.1 SVM分類模型
4.1.2 隨機(jī)森林算法模型
4.1.3 RBF神經(jīng)網(wǎng)絡(luò)算法模型
4.2 分類模型檢測性能比較
4.2.1 實(shí)驗(yàn)樣本集
4.2.2 實(shí)驗(yàn)環(huán)境
4.2.3 檢測指標(biāo)
4.2.5 實(shí)驗(yàn)結(jié)果
第5章 基于KELM算法的釣魚網(wǎng)站檢測優(yōu)化模型
5.1 KELM—核極限學(xué)習(xí)機(jī)算法
5.1.1 極限學(xué)習(xí)機(jī)算法
5.1.2 核極限學(xué)習(xí)機(jī)
5.2 模型構(gòu)建與檢驗(yàn)
5.2.1 實(shí)驗(yàn)數(shù)據(jù)集
5.2.2 實(shí)驗(yàn)結(jié)果分析
第6章 結(jié)論與展望
6.1 論文工作總結(jié)
6.2 研究展望
參考文獻(xiàn)
個人簡介及攻讀學(xué)位期間獲得成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)的雙層啟發(fā)式強(qiáng)化學(xué)習(xí)方法[J]. 劉智斌,曾曉勤,劉惠義,儲榮. 計算機(jī)研究與發(fā)展. 2015(03)
[2]一種基于支持向量機(jī)的特征選擇算法[J]. 代琨,于宏毅,李青. 模式識別與人工智能. 2014(05)
[3]基于PCA和多變量極限學(xué)習(xí)機(jī)的軸承剩余壽命預(yù)測[J]. 何群,李磊,江國乾,謝平. 中國機(jī)械工程. 2014(07)
[4]基于URL特征的釣魚網(wǎng)站檢測方式[J]. 藺亞東. 電子測試. 2014(03)
[5]特征選擇方法與算法的研究[J]. 李敏,卡米力·木依丁. 計算機(jī)技術(shù)與發(fā)展. 2013(12)
[6]基于貝葉斯和支持向量機(jī)的釣魚網(wǎng)站檢測方法[J]. 顧曉清,王洪元,倪彤光,丁輝. 計算機(jī)工程與應(yīng)用. 2015(04)
[7]基于URL特征的Phishing檢測方法(英文)[J]. 曹玖新,董丹,毛波,王田峰. Journal of Southeast University(English Edition). 2013(02)
[8]一種輕量級入侵檢測技術(shù)[J]. 張立偉,戴磊,侯一凡. 計算機(jī)科學(xué). 2012(S3)
[9]基于粗糙集及信息增益的數(shù)據(jù)挖掘預(yù)測算法[J]. 徐立萍,姜志旺. 中國科技論文. 2012(07)
[10]基于修正核函數(shù)SVM的網(wǎng)絡(luò)入侵檢測[J]. 井小沛,汪厚祥,聶凱. 系統(tǒng)工程與電子技術(shù). 2012(05)
博士論文
[1]基于數(shù)據(jù)挖掘技術(shù)的模糊推理系統(tǒng)設(shè)計[D]. 白一鳴.大連海事大學(xué) 2013
[2]基于關(guān)聯(lián)規(guī)則的基因芯片數(shù)據(jù)挖掘與應(yīng)用[D]. 彭斌.第三軍醫(yī)大學(xué) 2008
碩士論文
[1]一種基于網(wǎng)頁關(guān)聯(lián)性特征的釣魚檢測方法[D]. 田先桃.南京郵電大學(xué) 2012
[2]基于空間數(shù)據(jù)庫和視覺特征的釣魚網(wǎng)頁檢測[D]. 曾兵.南京郵電大學(xué) 2012
[3]基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)入侵檢測技術(shù)的研究[D]. 程曦.重慶大學(xué) 2005
本文編號:3345961
【文章來源】:內(nèi)蒙古財經(jīng)大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.2.3 文獻(xiàn)綜述
1.3 論文主要研究內(nèi)容及結(jié)構(gòu)安排
1.3.1 論文主要研究內(nèi)容
1.3.2 論文結(jié)構(gòu)安排
第2章 相關(guān)理論研究
2.1 網(wǎng)絡(luò)釣魚
2.1.1 網(wǎng)絡(luò)釣魚攻擊原理
2.1.2 釣魚網(wǎng)站傳播方式
2.1.3 常見幾類釣魚網(wǎng)站
2.1.4 攻擊類別
2.2 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)
2.2.1 數(shù)據(jù)挖掘
2.2.2 機(jī)器學(xué)習(xí)
2.3 分類問題概述
2.4 不平衡分類問題概述
2.4.1 不平衡數(shù)據(jù)分類的基本概念
2.4.2 不平衡數(shù)據(jù)分類評價指標(biāo)
第3章 釣魚網(wǎng)站特征提取與特征選擇
3.1 釣魚網(wǎng)站特征提取
3.2 釣魚網(wǎng)站特征選擇
3.2.1 PCA主成分分析法
3.2.2 特征選擇與分析
第4章 分類器模型的比較
4.1 基于三種分類算法的釣魚網(wǎng)站檢測模型
4.1.1 SVM分類模型
4.1.2 隨機(jī)森林算法模型
4.1.3 RBF神經(jīng)網(wǎng)絡(luò)算法模型
4.2 分類模型檢測性能比較
4.2.1 實(shí)驗(yàn)樣本集
4.2.2 實(shí)驗(yàn)環(huán)境
4.2.3 檢測指標(biāo)
4.2.5 實(shí)驗(yàn)結(jié)果
第5章 基于KELM算法的釣魚網(wǎng)站檢測優(yōu)化模型
5.1 KELM—核極限學(xué)習(xí)機(jī)算法
5.1.1 極限學(xué)習(xí)機(jī)算法
5.1.2 核極限學(xué)習(xí)機(jī)
5.2 模型構(gòu)建與檢驗(yàn)
5.2.1 實(shí)驗(yàn)數(shù)據(jù)集
5.2.2 實(shí)驗(yàn)結(jié)果分析
第6章 結(jié)論與展望
6.1 論文工作總結(jié)
6.2 研究展望
參考文獻(xiàn)
個人簡介及攻讀學(xué)位期間獲得成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)的雙層啟發(fā)式強(qiáng)化學(xué)習(xí)方法[J]. 劉智斌,曾曉勤,劉惠義,儲榮. 計算機(jī)研究與發(fā)展. 2015(03)
[2]一種基于支持向量機(jī)的特征選擇算法[J]. 代琨,于宏毅,李青. 模式識別與人工智能. 2014(05)
[3]基于PCA和多變量極限學(xué)習(xí)機(jī)的軸承剩余壽命預(yù)測[J]. 何群,李磊,江國乾,謝平. 中國機(jī)械工程. 2014(07)
[4]基于URL特征的釣魚網(wǎng)站檢測方式[J]. 藺亞東. 電子測試. 2014(03)
[5]特征選擇方法與算法的研究[J]. 李敏,卡米力·木依丁. 計算機(jī)技術(shù)與發(fā)展. 2013(12)
[6]基于貝葉斯和支持向量機(jī)的釣魚網(wǎng)站檢測方法[J]. 顧曉清,王洪元,倪彤光,丁輝. 計算機(jī)工程與應(yīng)用. 2015(04)
[7]基于URL特征的Phishing檢測方法(英文)[J]. 曹玖新,董丹,毛波,王田峰. Journal of Southeast University(English Edition). 2013(02)
[8]一種輕量級入侵檢測技術(shù)[J]. 張立偉,戴磊,侯一凡. 計算機(jī)科學(xué). 2012(S3)
[9]基于粗糙集及信息增益的數(shù)據(jù)挖掘預(yù)測算法[J]. 徐立萍,姜志旺. 中國科技論文. 2012(07)
[10]基于修正核函數(shù)SVM的網(wǎng)絡(luò)入侵檢測[J]. 井小沛,汪厚祥,聶凱. 系統(tǒng)工程與電子技術(shù). 2012(05)
博士論文
[1]基于數(shù)據(jù)挖掘技術(shù)的模糊推理系統(tǒng)設(shè)計[D]. 白一鳴.大連海事大學(xué) 2013
[2]基于關(guān)聯(lián)規(guī)則的基因芯片數(shù)據(jù)挖掘與應(yīng)用[D]. 彭斌.第三軍醫(yī)大學(xué) 2008
碩士論文
[1]一種基于網(wǎng)頁關(guān)聯(lián)性特征的釣魚檢測方法[D]. 田先桃.南京郵電大學(xué) 2012
[2]基于空間數(shù)據(jù)庫和視覺特征的釣魚網(wǎng)頁檢測[D]. 曾兵.南京郵電大學(xué) 2012
[3]基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)入侵檢測技術(shù)的研究[D]. 程曦.重慶大學(xué) 2005
本文編號:3345961
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3345961.html
最近更新
教材專著