基于分類集成的Lendingclub數(shù)據(jù)中客戶違約預(yù)測
發(fā)布時間:2021-05-16 13:53
近年來隨著網(wǎng)絡(luò)時代的迅速發(fā)展,互聯(lián)網(wǎng)金融產(chǎn)品迅猛發(fā)展起來,大型的借貸平臺也逐步興起,Lending Club是其中一家發(fā)展迅速、運作較好的大型P2P(Peer to Peer)交易平臺,由于P2P平臺交易門檻低、流程簡單、投資回報率高等優(yōu)勢,迅速吸引了大批量客戶進入市場,從中也衍生出了一些違規(guī)貸款和欺詐事件,所以本文以LendingClub公司2018年10月1日到2018年12月31日的批貸數(shù)據(jù)進行建模分析,通過集成分類預(yù)測的方法進行風(fēng)險評估,提高P2P平臺關(guān)于違約率較高客戶的識別能力,從而為該平臺及公司提供科學(xué)決策依據(jù)。本文主要運用機器學(xué)習(xí)算法進行評估預(yù)測,通過Synthetic Minority Oversam-pling Technique(SMOTE)方法對不平衡數(shù)據(jù)進行過采樣,對特征進行衍生及篩選,并在此基礎(chǔ)上使用網(wǎng)格搜索算法對Logistic Regression(LR),Random Forest(RF),eXtreme Gradient Boosting(XGBoost),Light Gradient Boosting Machine(LightGBM)等模型進行參數(shù)...
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1 研究背景及意義
2 研究現(xiàn)狀
3 論文研究內(nèi)容及結(jié)構(gòu)安排
第二章 基本算法與評價指標
1 Logistic Regression
2 基本樹類算法
2.1 ID3算法
2.2 C4.5算法
2.3 CART算法
2.4 決策樹剪枝
3 集成樹類算法
3.1 隨機森林
3.2 XGBoost算法
3.3 LightGBM算法
4 不平衡數(shù)據(jù)處理
4.1 基于數(shù)據(jù)的方法
4.2 基于算法的方法
5 分類預(yù)測評價指標
6 可解釋模型
第三章 Lending Club數(shù)據(jù)描述及建模分析
1 數(shù)據(jù)描述
2 數(shù)據(jù)特征及預(yù)處理
3 建模分析
4 模型融合
5 模型可解釋
第四章 總結(jié)與展望
1 研究結(jié)論
2 研究局限性
參考文獻
致謝
本文編號:3189808
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1 研究背景及意義
2 研究現(xiàn)狀
3 論文研究內(nèi)容及結(jié)構(gòu)安排
第二章 基本算法與評價指標
1 Logistic Regression
2 基本樹類算法
2.1 ID3算法
2.2 C4.5算法
2.3 CART算法
2.4 決策樹剪枝
3 集成樹類算法
3.1 隨機森林
3.2 XGBoost算法
3.3 LightGBM算法
4 不平衡數(shù)據(jù)處理
4.1 基于數(shù)據(jù)的方法
4.2 基于算法的方法
5 分類預(yù)測評價指標
6 可解釋模型
第三章 Lending Club數(shù)據(jù)描述及建模分析
1 數(shù)據(jù)描述
2 數(shù)據(jù)特征及預(yù)處理
3 建模分析
4 模型融合
5 模型可解釋
第四章 總結(jié)與展望
1 研究結(jié)論
2 研究局限性
參考文獻
致謝
本文編號:3189808
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/3189808.html
最近更新
教材專著