基于數(shù)據(jù)挖掘技術(shù)的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化
發(fā)布時(shí)間:2023-03-11 05:58
隨著P2P借貸業(yè)務(wù)在我國飛速發(fā)展,眾多P2P平臺(tái)出現(xiàn)了壞賬率過高甚至平臺(tái)跑路的現(xiàn)象,這些現(xiàn)象的出現(xiàn)是由于P2P平臺(tái)沒有對(duì)投資者個(gè)人信用風(fēng)險(xiǎn)有效評(píng)估造成的。當(dāng)前P2P平臺(tái)使用的個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型主要是基于單一模型所構(gòu)建的,分為以邏輯回歸模型為代表的傳統(tǒng)模型信用風(fēng)險(xiǎn)模型和以決策樹等機(jī)器學(xué)習(xí)為代表的新興傳統(tǒng)模型,但前者有著模型精度不足等問題,后者有著模型穩(wěn)定性不高等問題。鑒于此問題,本文通過數(shù)據(jù)挖掘技術(shù),探究P2P個(gè)人信用風(fēng)險(xiǎn)模型的優(yōu)化。本文通過“宜人貸”平臺(tái)的11017條借貸數(shù)據(jù),在進(jìn)行數(shù)據(jù)預(yù)處理和變量分析之后得到9206條借貸數(shù)據(jù)和110個(gè)借貸變量,對(duì)邏輯回歸模型、SVM類模型和決策樹類模型分別進(jìn)行模型訓(xùn)練。通過模型預(yù)測(cè)后,將模型訓(xùn)練效率和模型預(yù)測(cè)效果的指標(biāo)進(jìn)行綜合評(píng)估,選出模型評(píng)估較好的單一數(shù)據(jù)挖掘模型(XGBoost模型和邏輯回歸模型)。在第二階段,將XGBoost模型和邏輯回歸模型進(jìn)行Stacking模型融合,得到最終的模型優(yōu)化形式,載進(jìn)行模型訓(xùn)練和模型預(yù)測(cè)。完成了數(shù)據(jù)挖掘技術(shù)對(duì)P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的優(yōu)化。通過本文研究,我們還得到了研究結(jié)論和對(duì)P2P平臺(tái)、投資人和監(jiān)管者的研...
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究目的和意義
1.2.1 研究目的
1.2.2 研究理論意義
1.2.3 研究現(xiàn)實(shí)意義
1.3 研究?jī)?nèi)容、方法和技術(shù)路線
1.3.1 研究?jī)?nèi)容
1.3.2 研究方法
1.3.3 研究技術(shù)路線
1.4 本文的主要貢獻(xiàn)
第2章 文獻(xiàn)綜述與相關(guān)理論
2.1 文獻(xiàn)綜述
2.1.1 數(shù)據(jù)挖掘行業(yè)應(yīng)用的文獻(xiàn)綜述
2.1.2 數(shù)據(jù)挖掘在信用風(fēng)險(xiǎn)領(lǐng)域應(yīng)用的文獻(xiàn)綜述
2.1.3 對(duì)已有研究的評(píng)價(jià)
2.2 相關(guān)理論簡(jiǎn)介
2.2.1 數(shù)據(jù)挖掘理論
2.2.2 邏輯回歸模型
2.2.3 支持向量機(jī)模型
2.2.4 決策樹類模型
第3章 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的理論框架
3.1 P2P個(gè)人信用風(fēng)險(xiǎn)的定義
3.2 P2P個(gè)人信用風(fēng)險(xiǎn)的影響因素
3.3 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的效果評(píng)估指標(biāo)
3.3.1 模型混淆矩陣
3.3.2 模型評(píng)估指標(biāo)體系
3.4 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的方法選擇
3.4.1 子模型選取方法
3.4.2 Stacking模型融合
第4章 P2P個(gè)人信用風(fēng)險(xiǎn)問題的描述與分析
4.1 P2P個(gè)人信用風(fēng)險(xiǎn)現(xiàn)狀的描述與分析
4.1.1 P2P個(gè)人信用風(fēng)險(xiǎn)發(fā)展與現(xiàn)狀
4.1.2 P2P個(gè)人信用風(fēng)險(xiǎn)現(xiàn)狀的成因
4.2 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型現(xiàn)狀的描述與分析
第5章 方案策劃設(shè)計(jì)
5.1 數(shù)據(jù)集準(zhǔn)備
5.1.1 數(shù)據(jù)集來源
5.1.2 數(shù)據(jù)集基本信息
5.1.3 數(shù)據(jù)集的分割
5.2 數(shù)據(jù)集清洗
5.2.1 對(duì)缺失值的清理
5.2.2 對(duì)于信息量較低變量的剔除
5.2.3 對(duì)近零方差變量的剔除
5.2.4 對(duì)相關(guān)系數(shù)較低變量的剔除
5.3 變量的描述與分析
5.3.1 目標(biāo)變量描述與分析
5.3.2 身份信息變量和財(cái)產(chǎn)狀況變量的描述與分析
5.3.3 持卡信息變量和交易信息變量的描述與分析
5.3.4 信用歷史類變量的描述與分析
5.4 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的構(gòu)建與優(yōu)化
5.4.1 基于單一模型的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的構(gòu)建與對(duì)比
5.4.2 基于Stacking集成學(xué)習(xí)的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的優(yōu)化
第6章 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的論證及實(shí)施
6.1 數(shù)據(jù)集的過采樣
6.2 基于單一模型的P2P個(gè)人信用風(fēng)險(xiǎn)的評(píng)估模型
6.2.1 構(gòu)建邏輯回歸模型并評(píng)估
6.2.2 構(gòu)建SVM模型并評(píng)估
6.2.3 構(gòu)建決策樹類模型并評(píng)估
6.2.4 單一模型評(píng)估效果的對(duì)比
6.3 基于Stacking集成學(xué)習(xí)的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型
6.4 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的效果分析
6.5 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的實(shí)施
6.5.1 模型算法優(yōu)化的實(shí)施
6.5.2 模型變量?jī)?yōu)化的實(shí)施
第7章 研究結(jié)論與研究啟示
7.1 研究結(jié)論
7.1.1 多維度數(shù)據(jù)有助于評(píng)估P2P個(gè)人信用風(fēng)險(xiǎn)
7.1.2 XGBoost等數(shù)據(jù)挖掘模型在預(yù)測(cè)中具有較好的性能
7.1.3 Stacking模型融合方法進(jìn)一步提高預(yù)測(cè)效果
7.2 研究啟示
7.2.1 提高P2P平臺(tái)的風(fēng)控水平
7.2.2 增強(qiáng)P2P投資者的風(fēng)險(xiǎn)意識(shí)
7.2.3 加強(qiáng)P2P監(jiān)管者的監(jiān)管效率
參考文獻(xiàn)
附錄
致謝
本文編號(hào):3759329
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究目的和意義
1.2.1 研究目的
1.2.2 研究理論意義
1.2.3 研究現(xiàn)實(shí)意義
1.3 研究?jī)?nèi)容、方法和技術(shù)路線
1.3.1 研究?jī)?nèi)容
1.3.2 研究方法
1.3.3 研究技術(shù)路線
1.4 本文的主要貢獻(xiàn)
第2章 文獻(xiàn)綜述與相關(guān)理論
2.1 文獻(xiàn)綜述
2.1.1 數(shù)據(jù)挖掘行業(yè)應(yīng)用的文獻(xiàn)綜述
2.1.2 數(shù)據(jù)挖掘在信用風(fēng)險(xiǎn)領(lǐng)域應(yīng)用的文獻(xiàn)綜述
2.1.3 對(duì)已有研究的評(píng)價(jià)
2.2 相關(guān)理論簡(jiǎn)介
2.2.1 數(shù)據(jù)挖掘理論
2.2.2 邏輯回歸模型
2.2.3 支持向量機(jī)模型
2.2.4 決策樹類模型
第3章 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的理論框架
3.1 P2P個(gè)人信用風(fēng)險(xiǎn)的定義
3.2 P2P個(gè)人信用風(fēng)險(xiǎn)的影響因素
3.3 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的效果評(píng)估指標(biāo)
3.3.1 模型混淆矩陣
3.3.2 模型評(píng)估指標(biāo)體系
3.4 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的方法選擇
3.4.1 子模型選取方法
3.4.2 Stacking模型融合
第4章 P2P個(gè)人信用風(fēng)險(xiǎn)問題的描述與分析
4.1 P2P個(gè)人信用風(fēng)險(xiǎn)現(xiàn)狀的描述與分析
4.1.1 P2P個(gè)人信用風(fēng)險(xiǎn)發(fā)展與現(xiàn)狀
4.1.2 P2P個(gè)人信用風(fēng)險(xiǎn)現(xiàn)狀的成因
4.2 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型現(xiàn)狀的描述與分析
第5章 方案策劃設(shè)計(jì)
5.1 數(shù)據(jù)集準(zhǔn)備
5.1.1 數(shù)據(jù)集來源
5.1.2 數(shù)據(jù)集基本信息
5.1.3 數(shù)據(jù)集的分割
5.2 數(shù)據(jù)集清洗
5.2.1 對(duì)缺失值的清理
5.2.2 對(duì)于信息量較低變量的剔除
5.2.3 對(duì)近零方差變量的剔除
5.2.4 對(duì)相關(guān)系數(shù)較低變量的剔除
5.3 變量的描述與分析
5.3.1 目標(biāo)變量描述與分析
5.3.2 身份信息變量和財(cái)產(chǎn)狀況變量的描述與分析
5.3.3 持卡信息變量和交易信息變量的描述與分析
5.3.4 信用歷史類變量的描述與分析
5.4 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的構(gòu)建與優(yōu)化
5.4.1 基于單一模型的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的構(gòu)建與對(duì)比
5.4.2 基于Stacking集成學(xué)習(xí)的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型的優(yōu)化
第6章 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的論證及實(shí)施
6.1 數(shù)據(jù)集的過采樣
6.2 基于單一模型的P2P個(gè)人信用風(fēng)險(xiǎn)的評(píng)估模型
6.2.1 構(gòu)建邏輯回歸模型并評(píng)估
6.2.2 構(gòu)建SVM模型并評(píng)估
6.2.3 構(gòu)建決策樹類模型并評(píng)估
6.2.4 單一模型評(píng)估效果的對(duì)比
6.3 基于Stacking集成學(xué)習(xí)的P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型
6.4 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的效果分析
6.5 P2P個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型優(yōu)化的實(shí)施
6.5.1 模型算法優(yōu)化的實(shí)施
6.5.2 模型變量?jī)?yōu)化的實(shí)施
第7章 研究結(jié)論與研究啟示
7.1 研究結(jié)論
7.1.1 多維度數(shù)據(jù)有助于評(píng)估P2P個(gè)人信用風(fēng)險(xiǎn)
7.1.2 XGBoost等數(shù)據(jù)挖掘模型在預(yù)測(cè)中具有較好的性能
7.1.3 Stacking模型融合方法進(jìn)一步提高預(yù)測(cè)效果
7.2 研究啟示
7.2.1 提高P2P平臺(tái)的風(fēng)控水平
7.2.2 增強(qiáng)P2P投資者的風(fēng)險(xiǎn)意識(shí)
7.2.3 加強(qiáng)P2P監(jiān)管者的監(jiān)管效率
參考文獻(xiàn)
附錄
致謝
本文編號(hào):3759329
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3759329.html
最近更新
教材專著