銀行客戶流失預警及模型可解釋性分析
發(fā)布時間:2024-03-19 05:26
目前,機器學習模型在多方面取得了很好的成果,為各行各業(yè)提供了解決問題的有效辦法。在金融領域,機器學習因其優(yōu)異表現(xiàn)已經(jīng)得到眾多學者的關注,但是對于結(jié)構(gòu)過于復雜的模型,卻很難解釋模型決策背后的邏輯,僅能得到模型預測結(jié)果,使得模型成為黑盒模型,嚴重阻礙了機器學習在金融領域的應用;诖吮尘跋,本文以金融領域中的銀行業(yè)務為例,建立銀行客戶流失預警模型,旨在有效識別銀行潛在流失客戶,并通過模型可解釋性分析,挖掘出模型決策背后的有效信息,為防止客戶流失提供數(shù)據(jù)參考與建議。首先根據(jù)原始數(shù)據(jù)特點進行數(shù)據(jù)清洗,主要包括缺失值處理以及重復樣本處理。之后先通過特征粗篩去除只起到標記作用以及無統(tǒng)計意義的特征,再利用Lasso CV與皮爾遜相關系數(shù)法進行特征選擇,進一步提升數(shù)據(jù)質(zhì)量。同時銀行數(shù)據(jù)還存在嚴重的不平衡性,使用BORDERLINE-SMOTE算法使得訓練集平衡。接下來進行建模前的數(shù)據(jù)挖掘工作,包括可視化數(shù)據(jù)的分布情況、特征自身的規(guī)律、特征與研究目標的規(guī)律。在建模與模型解釋方面分為兩部分,第一部分首先建立了LR、隨機森林、XGboost、light GBM,四種自身可解釋的模型,對四種模型的結(jié)果利用AC...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3932394
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖1-1技術(shù)路線圖
華中農(nóng)業(yè)大學2022屆碩士研究生學位(畢業(yè))論文81.5技術(shù)路線圖1-1技術(shù)路線圖Fig.1-1TechnologyRoadmap
圖2-1決策樹生成圖
華中農(nóng)業(yè)大學2022屆碩士研究生學位(畢業(yè))論文102.1.2決策樹決策樹是經(jīng)典的分類算法,許多算法是基于決策樹建立的,它表示特征與值的一種映射關系。如圖2.1決策樹生成圖。圖2-1決策樹生成圖Fig2-1ThedecisiontreegenerationgraphinFig樹中....
圖2-2隨機森林模型
華中農(nóng)業(yè)大學2022屆碩士研究生學位(畢業(yè))論文12多數(shù)。為什么希望基學習器之間要有差別呢,我們考慮一種極端的情況,如果現(xiàn)在多個基學習器是同一個,那么無論單個基學習器效果多么好,得到的結(jié)果也是與一個基學習器相同的,失去了集成的意義,因此我們要保證基學習器的多樣性。集成學習可分為兩....
圖2-3按葉子生長的決策樹
華中農(nóng)業(yè)大學2022屆碩士研究生學位(畢業(yè))論文16圖2-3按葉子生長的決策樹Fig.2-3Decisiontreebyleaf(4)單邊梯度采樣算法lightGBM引入單邊梯度采樣算法,計算所有樣本的梯度,利用梯度大的樣本進行訓練,從而使得在數(shù)據(jù)量減少的同時也盡可能地保證算法精....
本文編號:3932394
本文鏈接:http://sikaile.net/jingjifazhanlunwen/3932394.html
最近更新
教材專著