基于不平衡集成分類的個人信用評分研究
發(fā)布時間:2021-03-12 00:05
個人信用評分領(lǐng)域通常存在不平衡樣本分類問題,“好”客戶的數(shù)量遠多于“壞”客戶的數(shù)量。在這種情況下,如果直接將傳統(tǒng)機器學習中的分類算法應(yīng)用于個人信用評分,分類結(jié)果往往更加偏向于多數(shù)類樣本,對少數(shù)類樣本的分類效果差,從而無法正確高效地識別“壞”客戶。針對個人信用評分中存在的不平衡樣本分類問題,本文從數(shù)據(jù)分布調(diào)整和分類器構(gòu)造兩個層面進行了積極探索。(1)提出了一種基于噪聲樣本過濾的聚類過采樣算法(Classification Filter-K-Means-SMOTE,CF-KM-SMOTE),該算法首先去除原始不平衡樣本集中的噪聲樣本,并在樣本聚類后的各簇中對少數(shù)類樣本完成SMOTE過采樣。CF-KM-SMOTE可將新生成的少數(shù)類樣本控制在少數(shù)類區(qū)間內(nèi),有效解決了SMOTE過采樣可能存在的模糊邊界問題。(2)提出了一種基于CF-KM-SMOTE的個人信用評分的集成學習方法。該方法在集成學習的迭代過程中使用CF-KM-SMOTE生成新的“壞”客戶樣本,從而解決不平衡樣本對個人信用評分的分類影響,并在Boosting集成的迭代過程中動態(tài)改變樣本權(quán)重,增加了因樣本量少而易被錯分的“壞”客戶樣本的權(quán)...
【文章來源】:西北師范大學甘肅省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
ROC曲線
SMOTE原理圖
Ionosphere經(jīng)各過采樣后使用邏輯回歸分類的ROC曲線
本文編號:3077332
【文章來源】:西北師范大學甘肅省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
ROC曲線
SMOTE原理圖
Ionosphere經(jīng)各過采樣后使用邏輯回歸分類的ROC曲線
本文編號:3077332
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/3077332.html
最近更新
教材專著