基于可解釋機(jī)器學(xué)習(xí)模型的銀行客戶數(shù)據(jù)分析和預(yù)測(cè)
發(fā)布時(shí)間:2023-01-08 12:39
在傳統(tǒng)工業(yè)界中,機(jī)器學(xué)習(xí)模型的主要任務(wù)是解決現(xiàn)實(shí)生活中的問(wèn)題,更偏向應(yīng)用模型于數(shù)據(jù),而不會(huì)解釋模型為什么會(huì)取得如此好的效果。而在另外一些特定領(lǐng)域,如金融領(lǐng)域,在這一領(lǐng)域,我們不能像傳統(tǒng)機(jī)器學(xué)習(xí)模型那樣,將訓(xùn)練數(shù)據(jù)流入黑盒模型,訓(xùn)練出一個(gè)函數(shù)(這個(gè)函數(shù)也可以稱之為模型),輸入新的數(shù)據(jù)到該函數(shù)得出預(yù)測(cè)結(jié)果,這些是不夠的,我們還要對(duì)模型進(jìn)行可解釋性分析,可解釋性對(duì)于模型的驗(yàn)證和改進(jìn)有著十分積極的意義,如何解釋該模型,它是如何預(yù)測(cè)的,模型的可信度體現(xiàn)在哪里,這些對(duì)于銀行業(yè)務(wù)的開(kāi)展至關(guān)重要。只有做到這些,我們才能真正將機(jī)器學(xué)習(xí)模型應(yīng)用于銀行金融創(chuàng)新領(lǐng)域,讓機(jī)器來(lái)學(xué)習(xí)人的經(jīng)驗(yàn),給予管理者們更好的決策,實(shí)現(xiàn)金融行業(yè)的目標(biāo)營(yíng)銷(xiāo),真正做到運(yùn)用數(shù)據(jù)的能力和機(jī)器學(xué)習(xí)模型來(lái)解決金融實(shí)際問(wèn)題。銀行作為金融領(lǐng)域的主要代表,其主營(yíng)業(yè)務(wù)之一是定期存款,但是互聯(lián)網(wǎng)的飛速發(fā)展對(duì)銀行的金融理財(cái)產(chǎn)品造成了很大的沖擊,越來(lái)越多的人選擇將銀行的定期存款業(yè)務(wù)轉(zhuǎn)向互聯(lián)網(wǎng)金融理財(cái)產(chǎn)品,這對(duì)銀行來(lái)說(shuō)意味著客戶資源的大量流失。銀行的目標(biāo)是精準(zhǔn)營(yíng)銷(xiāo),就是找到具有終身價(jià)值的客戶,或者說(shuō)是選擇在銀行進(jìn)行終身定期存款的客戶,然后維護(hù)客戶和銀行的長(zhǎng)...
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究的背景
1.1.2 研究的意義
1.2 當(dāng)前的研究現(xiàn)狀
1.2.1 機(jī)器學(xué)習(xí)模型可解釋性的研究現(xiàn)狀
1.2.2 金融領(lǐng)域模型可解釋性的研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的章節(jié)安排
第二章 理論基礎(chǔ)
2.1 可解釋的模型
2.1.1 邏輯回歸LR
2.1.2 集成學(xué)習(xí)模型
2.1.2.1 GBDT
2.1.2.2 Xgboost
2.1.2.3 LightGBM
2.1.2.4 Gc Forest
2.2 不可解釋的模型
2.2.1 RNN
2.2.2 LSTM
2.3 可解釋的方法
2.3.1 模型無(wú)關(guān)的解釋(Model-Agnostic)
2.3.2 代理模型(Surrogate Model)
2.3.3 Shapley值(Shapley Values)
2.3.4 反事實(shí)解釋(Counterfactual)
2.4 本章小結(jié)
第三章 建模之前的可解釋性
3.1 數(shù)據(jù)分析
3.1.1 數(shù)據(jù)來(lái)源和描述
3.1.2 數(shù)值特征分析
3.1.3 類別特征分析
3.2 特征工程
3.2.1 數(shù)據(jù)預(yù)處理
3.2.1.1 數(shù)據(jù)清洗
3.2.1.2 不平衡數(shù)據(jù)處理
3.2.2 特征構(gòu)造
3.2.3 特征選擇
3.3 本章小結(jié)
第四章 建模中的可解釋性
4.1 數(shù)據(jù)集劃分
4.2 建立模型
4.3 模型評(píng)價(jià)指標(biāo)
4.4 實(shí)驗(yàn)對(duì)比結(jié)果及分析
4.4.1 單一模型與Ensemble-LSTM的對(duì)比
4.4.2 融合模型與Ensemble-LSTM的對(duì)比
4.4.3 不平衡數(shù)據(jù)處理對(duì)實(shí)驗(yàn)結(jié)果的影響
4.5 代理模型
4.6 本章小結(jié)
第五章 建模之后的可解釋性
5.1 特征重要性
5.2 部分相關(guān)圖
5.2.1 單個(gè)特征對(duì)預(yù)測(cè)的影響
5.2.2 兩個(gè)特征的共同作用對(duì)預(yù)測(cè)的影響
5.2.3 部分相關(guān)圖的優(yōu)缺點(diǎn)
5.3 Shapley值
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)與改進(jìn)
6.2 當(dāng)前挑戰(zhàn)和未來(lái)研究方向
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)模型可解釋性方法、應(yīng)用與安全研究綜述[J]. 紀(jì)守領(lǐng),李進(jìn)鋒,杜天宇,李博. 計(jì)算機(jī)研究與發(fā)展. 2019(10)
[2]金融科技(FinTech)三年發(fā)展規(guī)劃發(fā)布[J]. 卓不群. 金融經(jīng)濟(jì). 2019(19)
[3]基于時(shí)間序列模型的商行信貸規(guī)模與風(fēng)險(xiǎn)管理分析[J]. 徐溪蔓. 現(xiàn)代商業(yè). 2019(24)
[4]AI和大數(shù)據(jù)賦能金融[J]. 譚營(yíng). 軟件和集成電路. 2019(08)
[5]我國(guó)商業(yè)銀行消費(fèi)信貸風(fēng)險(xiǎn)及其管理方法探討[J]. 鞠瑤. 現(xiàn)代商業(yè). 2019(17)
[6]一種基于隨機(jī)森林的改進(jìn)特征篩選算法[J]. 劉云翔,陳斌,周子宜. 現(xiàn)代電子技術(shù). 2019(12)
[7]大數(shù)據(jù)和人工智能技術(shù)在銀行網(wǎng)絡(luò)安全風(fēng)險(xiǎn)管理中的實(shí)踐——日志安全審計(jì)分析業(yè)務(wù)[J]. 丁晨. 中國(guó)信息化. 2019(05)
[8]深度學(xué)習(xí)的可解釋性[J]. 吳飛,廖彬兵,韓亞洪. 航空兵器. 2019(01)
[9]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學(xué)學(xué)報(bào). 2018(01)
[10]大數(shù)據(jù)和企業(yè)精準(zhǔn)營(yíng)銷(xiāo)相關(guān)性分析[J]. 楊東紅,時(shí)迎健,雷鳴,赫叢喜. 沈陽(yáng)工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2018(02)
博士論文
[1]數(shù)據(jù)挖掘過(guò)程中的可解釋性問(wèn)題研究[D]. 全文君.重慶大學(xué) 2018
本文編號(hào):3728495
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究的背景
1.1.2 研究的意義
1.2 當(dāng)前的研究現(xiàn)狀
1.2.1 機(jī)器學(xué)習(xí)模型可解釋性的研究現(xiàn)狀
1.2.2 金融領(lǐng)域模型可解釋性的研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的章節(jié)安排
第二章 理論基礎(chǔ)
2.1 可解釋的模型
2.1.1 邏輯回歸LR
2.1.2 集成學(xué)習(xí)模型
2.1.2.1 GBDT
2.1.2.2 Xgboost
2.1.2.3 LightGBM
2.1.2.4 Gc Forest
2.2 不可解釋的模型
2.2.1 RNN
2.2.2 LSTM
2.3 可解釋的方法
2.3.1 模型無(wú)關(guān)的解釋(Model-Agnostic)
2.3.2 代理模型(Surrogate Model)
2.3.3 Shapley值(Shapley Values)
2.3.4 反事實(shí)解釋(Counterfactual)
2.4 本章小結(jié)
第三章 建模之前的可解釋性
3.1 數(shù)據(jù)分析
3.1.1 數(shù)據(jù)來(lái)源和描述
3.1.2 數(shù)值特征分析
3.1.3 類別特征分析
3.2 特征工程
3.2.1 數(shù)據(jù)預(yù)處理
3.2.1.1 數(shù)據(jù)清洗
3.2.1.2 不平衡數(shù)據(jù)處理
3.2.2 特征構(gòu)造
3.2.3 特征選擇
3.3 本章小結(jié)
第四章 建模中的可解釋性
4.1 數(shù)據(jù)集劃分
4.2 建立模型
4.3 模型評(píng)價(jià)指標(biāo)
4.4 實(shí)驗(yàn)對(duì)比結(jié)果及分析
4.4.1 單一模型與Ensemble-LSTM的對(duì)比
4.4.2 融合模型與Ensemble-LSTM的對(duì)比
4.4.3 不平衡數(shù)據(jù)處理對(duì)實(shí)驗(yàn)結(jié)果的影響
4.5 代理模型
4.6 本章小結(jié)
第五章 建模之后的可解釋性
5.1 特征重要性
5.2 部分相關(guān)圖
5.2.1 單個(gè)特征對(duì)預(yù)測(cè)的影響
5.2.2 兩個(gè)特征的共同作用對(duì)預(yù)測(cè)的影響
5.2.3 部分相關(guān)圖的優(yōu)缺點(diǎn)
5.3 Shapley值
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)與改進(jìn)
6.2 當(dāng)前挑戰(zhàn)和未來(lái)研究方向
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)模型可解釋性方法、應(yīng)用與安全研究綜述[J]. 紀(jì)守領(lǐng),李進(jìn)鋒,杜天宇,李博. 計(jì)算機(jī)研究與發(fā)展. 2019(10)
[2]金融科技(FinTech)三年發(fā)展規(guī)劃發(fā)布[J]. 卓不群. 金融經(jīng)濟(jì). 2019(19)
[3]基于時(shí)間序列模型的商行信貸規(guī)模與風(fēng)險(xiǎn)管理分析[J]. 徐溪蔓. 現(xiàn)代商業(yè). 2019(24)
[4]AI和大數(shù)據(jù)賦能金融[J]. 譚營(yíng). 軟件和集成電路. 2019(08)
[5]我國(guó)商業(yè)銀行消費(fèi)信貸風(fēng)險(xiǎn)及其管理方法探討[J]. 鞠瑤. 現(xiàn)代商業(yè). 2019(17)
[6]一種基于隨機(jī)森林的改進(jìn)特征篩選算法[J]. 劉云翔,陳斌,周子宜. 現(xiàn)代電子技術(shù). 2019(12)
[7]大數(shù)據(jù)和人工智能技術(shù)在銀行網(wǎng)絡(luò)安全風(fēng)險(xiǎn)管理中的實(shí)踐——日志安全審計(jì)分析業(yè)務(wù)[J]. 丁晨. 中國(guó)信息化. 2019(05)
[8]深度學(xué)習(xí)的可解釋性[J]. 吳飛,廖彬兵,韓亞洪. 航空兵器. 2019(01)
[9]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學(xué)學(xué)報(bào). 2018(01)
[10]大數(shù)據(jù)和企業(yè)精準(zhǔn)營(yíng)銷(xiāo)相關(guān)性分析[J]. 楊東紅,時(shí)迎健,雷鳴,赫叢喜. 沈陽(yáng)工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2018(02)
博士論文
[1]數(shù)據(jù)挖掘過(guò)程中的可解釋性問(wèn)題研究[D]. 全文君.重慶大學(xué) 2018
本文編號(hào):3728495
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/3728495.html
最近更新
教材專著