基于XGBoost的網(wǎng)絡貸款風險預測
發(fā)布時間:2023-05-17 20:22
隨著銀行和金融機構(gòu)的貸款業(yè)務越來越多,壞賬對互聯(lián)網(wǎng)金融市場的發(fā)展帶來極大的負面影響。如何制定一個策略對客戶是否會違約做預測,并使利潤達到最大化,是所有信貸機構(gòu)最關(guān)心的問題。因此,就如何減少不良貸款問題建立一個準確的信用評分卡模型對市場經(jīng)濟的穩(wěn)定發(fā)展有重要意義。在背景介紹和數(shù)據(jù)準備部分,首先,介紹了信貸風險的概念和P2P信貸的發(fā)展背景,并對幾種機器學習模型理論和信用評分卡理論做了闡述。其次,針對某互聯(lián)網(wǎng)金融平臺的個人信貸數(shù)據(jù)集,通過數(shù)據(jù)探索、數(shù)據(jù)預處理、特征工程等操作,生成了可用于建模的數(shù)據(jù)。在模型實證分析部分,首先,建立了基線模型和XGBoost模型,采用評價指標AUC值和KS值研究了模型對逾期客戶的判別能力,發(fā)現(xiàn)XGBoost模型優(yōu)于邏輯回歸、決策樹和隨機森林三種基線模型。其次,針對數(shù)據(jù)的不平衡性質(zhì),通過引入代價敏感學習策略,提出了改進版XGBoost模型。相比原XGBoost模型,改進后的XGBoost模型對逾期風險的預測精度得到了一定的提升。最后,針對XGBoost模型,采用Stacking融合技巧,提出了新的XGBoost模型。相比原XGBoost模型,新模型的AUC值和KS值...
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 研究內(nèi)容
第二章 機器學習模型理論
2.1 邏輯回歸模型
2.1.1 邏輯回歸算法原理
2.1.2 邏輯回歸參數(shù)求解
2.2 決策樹與隨機森林
2.2.1 決策樹
2.2.2 分類與回歸樹
2.2.3 隨機森林
2.3 XGBoost
2.3.1 Boosting算法思想
2.3.2 XGBoost的算法原理
第三章 信用評分卡理論
3.1 信用評分卡基本概念
3.2 評分卡建模流程
3.2.1 問題定義
3.2.2 樣本選取
3.2.3 特征工程
3.2.4 評分卡建模
3.2.5 模型評估
第四章 用戶貸款數(shù)據(jù)處理
4.1 數(shù)據(jù)簡介
4.2 描述性統(tǒng)計分析
4.2.1 性別與違約的關(guān)系
4.2.2 學歷與違約的關(guān)系
4.2.3 會員級別與違約的關(guān)系
4.2.4 收入與違約的關(guān)系
4.2.5 信用評分與違約的關(guān)系
4.3 數(shù)據(jù)預處理
4.3.1 數(shù)據(jù)集成
4.3.2 數(shù)據(jù)清洗
4.4 特征工程
4.5 數(shù)據(jù)集的劃分
第五章 貸款風險預測實證分析
5.1 模型評價指標
5.1.1 KS統(tǒng)計量
5.1.2 ROC曲線和AUC
5.2 基線模型對貸款逾期預測的結(jié)果和效果
5.2.1 邏輯回歸模型
5.2.2 決策樹與隨機森林
5.3 XGBoost模型對貸款逾期預測的結(jié)果和效果
5.3.1 XGBoost及其調(diào)優(yōu)
5.3.2 基于代價敏感學習的XGBoost
5.3.3 基于XGBoost的Stacking融合
總結(jié)與展望
參考文獻
致謝
本文編號:3817939
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 研究內(nèi)容
第二章 機器學習模型理論
2.1 邏輯回歸模型
2.1.1 邏輯回歸算法原理
2.1.2 邏輯回歸參數(shù)求解
2.2 決策樹與隨機森林
2.2.1 決策樹
2.2.2 分類與回歸樹
2.2.3 隨機森林
2.3 XGBoost
2.3.1 Boosting算法思想
2.3.2 XGBoost的算法原理
第三章 信用評分卡理論
3.1 信用評分卡基本概念
3.2 評分卡建模流程
3.2.1 問題定義
3.2.2 樣本選取
3.2.3 特征工程
3.2.4 評分卡建模
3.2.5 模型評估
第四章 用戶貸款數(shù)據(jù)處理
4.1 數(shù)據(jù)簡介
4.2 描述性統(tǒng)計分析
4.2.1 性別與違約的關(guān)系
4.2.2 學歷與違約的關(guān)系
4.2.3 會員級別與違約的關(guān)系
4.2.4 收入與違約的關(guān)系
4.2.5 信用評分與違約的關(guān)系
4.3 數(shù)據(jù)預處理
4.3.1 數(shù)據(jù)集成
4.3.2 數(shù)據(jù)清洗
4.4 特征工程
4.5 數(shù)據(jù)集的劃分
第五章 貸款風險預測實證分析
5.1 模型評價指標
5.1.1 KS統(tǒng)計量
5.1.2 ROC曲線和AUC
5.2 基線模型對貸款逾期預測的結(jié)果和效果
5.2.1 邏輯回歸模型
5.2.2 決策樹與隨機森林
5.3 XGBoost模型對貸款逾期預測的結(jié)果和效果
5.3.1 XGBoost及其調(diào)優(yōu)
5.3.2 基于代價敏感學習的XGBoost
5.3.3 基于XGBoost的Stacking融合
總結(jié)與展望
參考文獻
致謝
本文編號:3817939
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3817939.html
最近更新
教材專著