面向金融數(shù)據(jù)的異常檢測方法研究
發(fā)布時間:2021-05-08 15:23
針對當(dāng)前異常檢測算法在處理時序性、不均衡的海量金融數(shù)據(jù)集時存在準(zhǔn)確率低、誤警率高等問題,本文從特征選擇、不均衡分類等方面進(jìn)行研究,提出一種基于條件動態(tài)互信息的金融數(shù)據(jù)特征選擇算法、一種基于隔離森林的金融數(shù)據(jù)異常檢測算法、一種基于SVM和KNN的金融數(shù)據(jù)異常檢測算法。本文主要的研究工作和成果如下:1.針對特征選擇算法在處理海量時序性數(shù)據(jù)集時,評價標(biāo)準(zhǔn)衡量因素片面化得不到最優(yōu)特征子集問題,研究提出一種基于條件動態(tài)互信息的金融數(shù)據(jù)特征選擇算法CDMIFS,該算法結(jié)合數(shù)據(jù)的時序性特點,從多方面衡量候選特征,在未識別樣本上以條件動態(tài)互信息度量特征與異常類的相關(guān)性來獲取特征子集。實驗結(jié)果表明該方法可有效去除金融數(shù)據(jù)集中不相關(guān)數(shù)據(jù),提高分類性能。2.針對隔離森林節(jié)點劃分的隨機性造成異常檢測準(zhǔn)確率低、誤警率高的問題,研究提出一種基于異常代價信息增益率的節(jié)點劃分標(biāo)準(zhǔn),并根據(jù)該標(biāo)準(zhǔn)提出一種基于隔離森林的金融數(shù)據(jù)異常檢測算法FA-iForest。該劃分標(biāo)準(zhǔn)考慮屬性在歷史數(shù)據(jù)中與異常類別的加權(quán)信息熵,同時設(shè)置代價函數(shù)加大異常類誤判的懲罰。實驗結(jié)果表明,該算法可有效提高隔離森林對金融數(shù)據(jù)的異常檢測能力。3.針對...
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:101 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題研究背景和意義
1.2 課題研究現(xiàn)狀
1.2.1 金融數(shù)據(jù)異常檢測
1.2.2 基于隔離森林的異常檢測算法
1.2.3 基于支持向量機的異常檢測算法
1.2.4 基于K近鄰的異常檢測算法
1.2.5 特征選擇算法在異常檢測領(lǐng)域的運用
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論基礎(chǔ)
2.1 金融數(shù)據(jù)預(yù)處理
2.1.1 數(shù)據(jù)準(zhǔn)備
2.1.2 數(shù)據(jù)清洗
2.1.3 特征選擇
2.1.4 數(shù)據(jù)轉(zhuǎn)換
2.2 特征選擇算法
2.3 隔離森林算法
2.4 支持向量機
2.5 K近鄰算法
2.6 本章小結(jié)
第3章 基于條件動態(tài)互信息的金融數(shù)據(jù)特征選擇算法及在異常檢測的運用
3.1 引言
3.2 基于互信息的特征選擇算法研究現(xiàn)狀
3.3 基于條件動態(tài)互信息的特征選擇算法及其在異常檢測的運用
3.3.1 相關(guān)定義
3.3.2 基于條件動態(tài)互信息的金融數(shù)據(jù)特征選擇算法
3.3.3 基于CDMIFS的異常檢測算法
3.4 實驗結(jié)果與分析
3.4.1 實驗數(shù)據(jù)集
3.4.2 數(shù)據(jù)集預(yù)處理
3.4.3 評價指標(biāo)
3.4.4 實驗設(shè)計與結(jié)果分析
3.5 本章小結(jié)
第4章 基于隔離森林的金融數(shù)據(jù)異常檢測算法
4.1 引言
4.2 隔離森林節(jié)點劃分規(guī)則研究
4.3 基于隔離森林的金融數(shù)據(jù)異常檢測算法
4.3.1 相關(guān)定義
4.3.2 基于隔離森林的金融數(shù)據(jù)異常檢測算法
4.4 實驗結(jié)果與分析
4.4.1 實驗數(shù)據(jù)集
4.4.2 數(shù)據(jù)集預(yù)處理
4.4.3 實驗設(shè)計與結(jié)果分析
4.5 本章小結(jié)
第5章 基于SVM和 KNN的金融數(shù)據(jù)異常檢測算法
5.1 引言
5.2 SVM算法
5.3 KNN算法
5.4 基于SVM和 KNN的金融數(shù)據(jù)異常檢測算法
5.4.1 相關(guān)定義
5.4.2 基于SVM和 KNN的金融數(shù)據(jù)異常檢測算法
5.5 實驗結(jié)果分析
5.5.1 實驗數(shù)據(jù)集
5.5.2 數(shù)據(jù)集預(yù)處理
5.5.3 實驗設(shè)計與結(jié)果分析
5.6 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來研究展望
致謝
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于新改進(jìn)的SVM不平衡數(shù)據(jù)集分類算法[J]. 劉悅婷,李曉霞,李思璇,朱旭博. 石河子大學(xué)學(xué)報(自然科學(xué)版). 2018(05)
[2]基于Isolation Forest改進(jìn)的數(shù)據(jù)異常檢測方法[J]. 徐東,王巖俊,孟宇龍,張子迎. 計算機科學(xué). 2018(10)
[3]適用于不平衡數(shù)據(jù)集分類的改進(jìn)SVM算法[J]. 劉東啟,陳志堅,徐銀,李飛騰. 傳感器與微系統(tǒng). 2018(03)
[4]基于互信息的特征選擇在入侵檢測中的優(yōu)化[J]. 劉云,向嬋,王海花. 西北大學(xué)學(xué)報(自然科學(xué)版). 2017(05)
[5]基于瀑布型混合技術(shù)的異常檢測算法[J]. 王茹雪,張麗翠,劉姝岐. 吉林大學(xué)學(xué)報(信息科學(xué)版). 2017(05)
[6]一種融合Kmeans和KNN的網(wǎng)絡(luò)入侵檢測算法[J]. 華輝有,陳啟買,劉海,張陽,袁沛權(quán). 計算機科學(xué). 2016(03)
[7]An Isolation Principle Based Distributed Anomaly Detection Method in Wireless Sensor Networks[J]. Zhi-Guo Ding,Da-Jun Du,Min-Rui Fei. International Journal of Automation and Computing. 2015(04)
[8]基于SVM的網(wǎng)絡(luò)入侵檢測集成學(xué)習(xí)算法[J]. 譚愛平,陳浩,吳伯橋. 計算機科學(xué). 2014(02)
[9]基于修正核函數(shù)SVM的網(wǎng)絡(luò)入侵檢測[J]. 井小沛,汪厚祥,聶凱. 系統(tǒng)工程與電子技術(shù). 2012(05)
[10]特征選擇方法綜述[J]. 姚旭,王曉丹,張玉璽,權(quán)文. 控制與決策. 2012(02)
博士論文
[1]基于信息熵的特征選擇算法研究[D]. 劉華文.吉林大學(xué) 2010
碩士論文
[1]無監(jiān)督異常檢測方法研究及其應(yīng)用[D]. 劉鑫.電子科技大學(xué) 2018
[2]基于集成學(xué)習(xí)算法的異常檢測研究[D]. 陳飛宇.南京大學(xué) 2015
[3]特征選擇算法研究及其在異常檢測中的應(yīng)用[D]. 王丹.電子科技大學(xué) 2014
[4]基于計算智能的金融數(shù)據(jù)異常發(fā)現(xiàn)[D]. 王靜.西南交通大學(xué) 2011
[5]SVDD算法研究及在信用卡欺詐檢測中的應(yīng)用[D]. 劉艷紅.江蘇大學(xué) 2010
[6]基于SVM-KNN的商業(yè)銀行信用風(fēng)險模型研究[D]. 馮曉陽.天津大學(xué) 2008
[7]基于支持向量機的信用卡欺詐檢測研究[D]. 楊璽.四川師范大學(xué) 2008
本文編號:3175571
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:101 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題研究背景和意義
1.2 課題研究現(xiàn)狀
1.2.1 金融數(shù)據(jù)異常檢測
1.2.2 基于隔離森林的異常檢測算法
1.2.3 基于支持向量機的異常檢測算法
1.2.4 基于K近鄰的異常檢測算法
1.2.5 特征選擇算法在異常檢測領(lǐng)域的運用
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論基礎(chǔ)
2.1 金融數(shù)據(jù)預(yù)處理
2.1.1 數(shù)據(jù)準(zhǔn)備
2.1.2 數(shù)據(jù)清洗
2.1.3 特征選擇
2.1.4 數(shù)據(jù)轉(zhuǎn)換
2.2 特征選擇算法
2.3 隔離森林算法
2.4 支持向量機
2.5 K近鄰算法
2.6 本章小結(jié)
第3章 基于條件動態(tài)互信息的金融數(shù)據(jù)特征選擇算法及在異常檢測的運用
3.1 引言
3.2 基于互信息的特征選擇算法研究現(xiàn)狀
3.3 基于條件動態(tài)互信息的特征選擇算法及其在異常檢測的運用
3.3.1 相關(guān)定義
3.3.2 基于條件動態(tài)互信息的金融數(shù)據(jù)特征選擇算法
3.3.3 基于CDMIFS的異常檢測算法
3.4 實驗結(jié)果與分析
3.4.1 實驗數(shù)據(jù)集
3.4.2 數(shù)據(jù)集預(yù)處理
3.4.3 評價指標(biāo)
3.4.4 實驗設(shè)計與結(jié)果分析
3.5 本章小結(jié)
第4章 基于隔離森林的金融數(shù)據(jù)異常檢測算法
4.1 引言
4.2 隔離森林節(jié)點劃分規(guī)則研究
4.3 基于隔離森林的金融數(shù)據(jù)異常檢測算法
4.3.1 相關(guān)定義
4.3.2 基于隔離森林的金融數(shù)據(jù)異常檢測算法
4.4 實驗結(jié)果與分析
4.4.1 實驗數(shù)據(jù)集
4.4.2 數(shù)據(jù)集預(yù)處理
4.4.3 實驗設(shè)計與結(jié)果分析
4.5 本章小結(jié)
第5章 基于SVM和 KNN的金融數(shù)據(jù)異常檢測算法
5.1 引言
5.2 SVM算法
5.3 KNN算法
5.4 基于SVM和 KNN的金融數(shù)據(jù)異常檢測算法
5.4.1 相關(guān)定義
5.4.2 基于SVM和 KNN的金融數(shù)據(jù)異常檢測算法
5.5 實驗結(jié)果分析
5.5.1 實驗數(shù)據(jù)集
5.5.2 數(shù)據(jù)集預(yù)處理
5.5.3 實驗設(shè)計與結(jié)果分析
5.6 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來研究展望
致謝
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于新改進(jìn)的SVM不平衡數(shù)據(jù)集分類算法[J]. 劉悅婷,李曉霞,李思璇,朱旭博. 石河子大學(xué)學(xué)報(自然科學(xué)版). 2018(05)
[2]基于Isolation Forest改進(jìn)的數(shù)據(jù)異常檢測方法[J]. 徐東,王巖俊,孟宇龍,張子迎. 計算機科學(xué). 2018(10)
[3]適用于不平衡數(shù)據(jù)集分類的改進(jìn)SVM算法[J]. 劉東啟,陳志堅,徐銀,李飛騰. 傳感器與微系統(tǒng). 2018(03)
[4]基于互信息的特征選擇在入侵檢測中的優(yōu)化[J]. 劉云,向嬋,王海花. 西北大學(xué)學(xué)報(自然科學(xué)版). 2017(05)
[5]基于瀑布型混合技術(shù)的異常檢測算法[J]. 王茹雪,張麗翠,劉姝岐. 吉林大學(xué)學(xué)報(信息科學(xué)版). 2017(05)
[6]一種融合Kmeans和KNN的網(wǎng)絡(luò)入侵檢測算法[J]. 華輝有,陳啟買,劉海,張陽,袁沛權(quán). 計算機科學(xué). 2016(03)
[7]An Isolation Principle Based Distributed Anomaly Detection Method in Wireless Sensor Networks[J]. Zhi-Guo Ding,Da-Jun Du,Min-Rui Fei. International Journal of Automation and Computing. 2015(04)
[8]基于SVM的網(wǎng)絡(luò)入侵檢測集成學(xué)習(xí)算法[J]. 譚愛平,陳浩,吳伯橋. 計算機科學(xué). 2014(02)
[9]基于修正核函數(shù)SVM的網(wǎng)絡(luò)入侵檢測[J]. 井小沛,汪厚祥,聶凱. 系統(tǒng)工程與電子技術(shù). 2012(05)
[10]特征選擇方法綜述[J]. 姚旭,王曉丹,張玉璽,權(quán)文. 控制與決策. 2012(02)
博士論文
[1]基于信息熵的特征選擇算法研究[D]. 劉華文.吉林大學(xué) 2010
碩士論文
[1]無監(jiān)督異常檢測方法研究及其應(yīng)用[D]. 劉鑫.電子科技大學(xué) 2018
[2]基于集成學(xué)習(xí)算法的異常檢測研究[D]. 陳飛宇.南京大學(xué) 2015
[3]特征選擇算法研究及其在異常檢測中的應(yīng)用[D]. 王丹.電子科技大學(xué) 2014
[4]基于計算智能的金融數(shù)據(jù)異常發(fā)現(xiàn)[D]. 王靜.西南交通大學(xué) 2011
[5]SVDD算法研究及在信用卡欺詐檢測中的應(yīng)用[D]. 劉艷紅.江蘇大學(xué) 2010
[6]基于SVM-KNN的商業(yè)銀行信用風(fēng)險模型研究[D]. 馮曉陽.天津大學(xué) 2008
[7]基于支持向量機的信用卡欺詐檢測研究[D]. 楊璽.四川師范大學(xué) 2008
本文編號:3175571
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/3175571.html
最近更新
教材專著