基于可解釋機(jī)器學(xué)習(xí)模型的銀行客戶數(shù)據(jù)分析和預(yù)測
發(fā)布時間:2023-01-08 12:39
在傳統(tǒng)工業(yè)界中,機(jī)器學(xué)習(xí)模型的主要任務(wù)是解決現(xiàn)實生活中的問題,更偏向應(yīng)用模型于數(shù)據(jù),而不會解釋模型為什么會取得如此好的效果。而在另外一些特定領(lǐng)域,如金融領(lǐng)域,在這一領(lǐng)域,我們不能像傳統(tǒng)機(jī)器學(xué)習(xí)模型那樣,將訓(xùn)練數(shù)據(jù)流入黑盒模型,訓(xùn)練出一個函數(shù)(這個函數(shù)也可以稱之為模型),輸入新的數(shù)據(jù)到該函數(shù)得出預(yù)測結(jié)果,這些是不夠的,我們還要對模型進(jìn)行可解釋性分析,可解釋性對于模型的驗證和改進(jìn)有著十分積極的意義,如何解釋該模型,它是如何預(yù)測的,模型的可信度體現(xiàn)在哪里,這些對于銀行業(yè)務(wù)的開展至關(guān)重要。只有做到這些,我們才能真正將機(jī)器學(xué)習(xí)模型應(yīng)用于銀行金融創(chuàng)新領(lǐng)域,讓機(jī)器來學(xué)習(xí)人的經(jīng)驗,給予管理者們更好的決策,實現(xiàn)金融行業(yè)的目標(biāo)營銷,真正做到運用數(shù)據(jù)的能力和機(jī)器學(xué)習(xí)模型來解決金融實際問題。銀行作為金融領(lǐng)域的主要代表,其主營業(yè)務(wù)之一是定期存款,但是互聯(lián)網(wǎng)的飛速發(fā)展對銀行的金融理財產(chǎn)品造成了很大的沖擊,越來越多的人選擇將銀行的定期存款業(yè)務(wù)轉(zhuǎn)向互聯(lián)網(wǎng)金融理財產(chǎn)品,這對銀行來說意味著客戶資源的大量流失。銀行的目標(biāo)是精準(zhǔn)營銷,就是找到具有終身價值的客戶,或者說是選擇在銀行進(jìn)行終身定期存款的客戶,然后維護(hù)客戶和銀行的長...
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究的背景
1.1.2 研究的意義
1.2 當(dāng)前的研究現(xiàn)狀
1.2.1 機(jī)器學(xué)習(xí)模型可解釋性的研究現(xiàn)狀
1.2.2 金融領(lǐng)域模型可解釋性的研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的章節(jié)安排
第二章 理論基礎(chǔ)
2.1 可解釋的模型
2.1.1 邏輯回歸LR
2.1.2 集成學(xué)習(xí)模型
2.1.2.1 GBDT
2.1.2.2 Xgboost
2.1.2.3 LightGBM
2.1.2.4 Gc Forest
2.2 不可解釋的模型
2.2.1 RNN
2.2.2 LSTM
2.3 可解釋的方法
2.3.1 模型無關(guān)的解釋(Model-Agnostic)
2.3.2 代理模型(Surrogate Model)
2.3.3 Shapley值(Shapley Values)
2.3.4 反事實解釋(Counterfactual)
2.4 本章小結(jié)
第三章 建模之前的可解釋性
3.1 數(shù)據(jù)分析
3.1.1 數(shù)據(jù)來源和描述
3.1.2 數(shù)值特征分析
3.1.3 類別特征分析
3.2 特征工程
3.2.1 數(shù)據(jù)預(yù)處理
3.2.1.1 數(shù)據(jù)清洗
3.2.1.2 不平衡數(shù)據(jù)處理
3.2.2 特征構(gòu)造
3.2.3 特征選擇
3.3 本章小結(jié)
第四章 建模中的可解釋性
4.1 數(shù)據(jù)集劃分
4.2 建立模型
4.3 模型評價指標(biāo)
4.4 實驗對比結(jié)果及分析
4.4.1 單一模型與Ensemble-LSTM的對比
4.4.2 融合模型與Ensemble-LSTM的對比
4.4.3 不平衡數(shù)據(jù)處理對實驗結(jié)果的影響
4.5 代理模型
4.6 本章小結(jié)
第五章 建模之后的可解釋性
5.1 特征重要性
5.2 部分相關(guān)圖
5.2.1 單個特征對預(yù)測的影響
5.2.2 兩個特征的共同作用對預(yù)測的影響
5.2.3 部分相關(guān)圖的優(yōu)缺點
5.3 Shapley值
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)與改進(jìn)
6.2 當(dāng)前挑戰(zhàn)和未來研究方向
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)模型可解釋性方法、應(yīng)用與安全研究綜述[J]. 紀(jì)守領(lǐng),李進(jìn)鋒,杜天宇,李博. 計算機(jī)研究與發(fā)展. 2019(10)
[2]金融科技(FinTech)三年發(fā)展規(guī)劃發(fā)布[J]. 卓不群. 金融經(jīng)濟(jì). 2019(19)
[3]基于時間序列模型的商行信貸規(guī)模與風(fēng)險管理分析[J]. 徐溪蔓. 現(xiàn)代商業(yè). 2019(24)
[4]AI和大數(shù)據(jù)賦能金融[J]. 譚營. 軟件和集成電路. 2019(08)
[5]我國商業(yè)銀行消費信貸風(fēng)險及其管理方法探討[J]. 鞠瑤. 現(xiàn)代商業(yè). 2019(17)
[6]一種基于隨機(jī)森林的改進(jìn)特征篩選算法[J]. 劉云翔,陳斌,周子宜. 現(xiàn)代電子技術(shù). 2019(12)
[7]大數(shù)據(jù)和人工智能技術(shù)在銀行網(wǎng)絡(luò)安全風(fēng)險管理中的實踐——日志安全審計分析業(yè)務(wù)[J]. 丁晨. 中國信息化. 2019(05)
[8]深度學(xué)習(xí)的可解釋性[J]. 吳飛,廖彬兵,韓亞洪. 航空兵器. 2019(01)
[9]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學(xué)學(xué)報. 2018(01)
[10]大數(shù)據(jù)和企業(yè)精準(zhǔn)營銷相關(guān)性分析[J]. 楊東紅,時迎健,雷鳴,赫叢喜. 沈陽工業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2018(02)
博士論文
[1]數(shù)據(jù)挖掘過程中的可解釋性問題研究[D]. 全文君.重慶大學(xué) 2018
本文編號:3728495
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究的背景
1.1.2 研究的意義
1.2 當(dāng)前的研究現(xiàn)狀
1.2.1 機(jī)器學(xué)習(xí)模型可解釋性的研究現(xiàn)狀
1.2.2 金融領(lǐng)域模型可解釋性的研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的章節(jié)安排
第二章 理論基礎(chǔ)
2.1 可解釋的模型
2.1.1 邏輯回歸LR
2.1.2 集成學(xué)習(xí)模型
2.1.2.1 GBDT
2.1.2.2 Xgboost
2.1.2.3 LightGBM
2.1.2.4 Gc Forest
2.2 不可解釋的模型
2.2.1 RNN
2.2.2 LSTM
2.3 可解釋的方法
2.3.1 模型無關(guān)的解釋(Model-Agnostic)
2.3.2 代理模型(Surrogate Model)
2.3.3 Shapley值(Shapley Values)
2.3.4 反事實解釋(Counterfactual)
2.4 本章小結(jié)
第三章 建模之前的可解釋性
3.1 數(shù)據(jù)分析
3.1.1 數(shù)據(jù)來源和描述
3.1.2 數(shù)值特征分析
3.1.3 類別特征分析
3.2 特征工程
3.2.1 數(shù)據(jù)預(yù)處理
3.2.1.1 數(shù)據(jù)清洗
3.2.1.2 不平衡數(shù)據(jù)處理
3.2.2 特征構(gòu)造
3.2.3 特征選擇
3.3 本章小結(jié)
第四章 建模中的可解釋性
4.1 數(shù)據(jù)集劃分
4.2 建立模型
4.3 模型評價指標(biāo)
4.4 實驗對比結(jié)果及分析
4.4.1 單一模型與Ensemble-LSTM的對比
4.4.2 融合模型與Ensemble-LSTM的對比
4.4.3 不平衡數(shù)據(jù)處理對實驗結(jié)果的影響
4.5 代理模型
4.6 本章小結(jié)
第五章 建模之后的可解釋性
5.1 特征重要性
5.2 部分相關(guān)圖
5.2.1 單個特征對預(yù)測的影響
5.2.2 兩個特征的共同作用對預(yù)測的影響
5.2.3 部分相關(guān)圖的優(yōu)缺點
5.3 Shapley值
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)與改進(jìn)
6.2 當(dāng)前挑戰(zhàn)和未來研究方向
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)模型可解釋性方法、應(yīng)用與安全研究綜述[J]. 紀(jì)守領(lǐng),李進(jìn)鋒,杜天宇,李博. 計算機(jī)研究與發(fā)展. 2019(10)
[2]金融科技(FinTech)三年發(fā)展規(guī)劃發(fā)布[J]. 卓不群. 金融經(jīng)濟(jì). 2019(19)
[3]基于時間序列模型的商行信貸規(guī)模與風(fēng)險管理分析[J]. 徐溪蔓. 現(xiàn)代商業(yè). 2019(24)
[4]AI和大數(shù)據(jù)賦能金融[J]. 譚營. 軟件和集成電路. 2019(08)
[5]我國商業(yè)銀行消費信貸風(fēng)險及其管理方法探討[J]. 鞠瑤. 現(xiàn)代商業(yè). 2019(17)
[6]一種基于隨機(jī)森林的改進(jìn)特征篩選算法[J]. 劉云翔,陳斌,周子宜. 現(xiàn)代電子技術(shù). 2019(12)
[7]大數(shù)據(jù)和人工智能技術(shù)在銀行網(wǎng)絡(luò)安全風(fēng)險管理中的實踐——日志安全審計分析業(yè)務(wù)[J]. 丁晨. 中國信息化. 2019(05)
[8]深度學(xué)習(xí)的可解釋性[J]. 吳飛,廖彬兵,韓亞洪. 航空兵器. 2019(01)
[9]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學(xué)學(xué)報. 2018(01)
[10]大數(shù)據(jù)和企業(yè)精準(zhǔn)營銷相關(guān)性分析[J]. 楊東紅,時迎健,雷鳴,赫叢喜. 沈陽工業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2018(02)
博士論文
[1]數(shù)據(jù)挖掘過程中的可解釋性問題研究[D]. 全文君.重慶大學(xué) 2018
本文編號:3728495
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/3728495.html
最近更新
教材專著