天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于過采樣方法的信用卡用戶違約預測分析

發(fā)布時間:2021-08-13 16:37
  隨著信用卡業(yè)務在全球范圍內的迅速普及,信用風險也急劇擴張。大量信用卡用戶違約行為的出現(xiàn),給銀行等金融機構帶來了較大的損失。因此,對信用卡用戶的信用風險進行預警,提前識別違約用戶就變得尤為重要。它能夠為銀行等金融機構提供決策依據(jù),幫助其制定合理的放貸策略,降低自身風險,促進自身健康發(fā)展。一般來說,信用卡數(shù)據(jù)集中各類別的分布是極度不平衡的,未違約人數(shù)占比較大,違約人數(shù)占比較小,傳統(tǒng)的人工信用風險評估模型已不適用。本文將利用數(shù)據(jù)挖掘技術和機器學習方法,從數(shù)據(jù)和模型兩個方面對信用卡數(shù)據(jù)集進行探索分析。本文使用的數(shù)據(jù)集來自Kaggle官網(wǎng),為國外某銀行2015年到2017年兩年間信用卡用戶的歷史消費及違約記錄,該樣本集中的類別分布極度不均衡。首先,本文將分別采用SMOTE算法和ADASYN算法對數(shù)據(jù)集進行過采樣處理,使得處理后數(shù)據(jù)集中的類別相對平衡,這樣做的優(yōu)點是不會損失樣本中多數(shù)類的信息。然后基于過采樣后的數(shù)據(jù),分別建立邏輯回歸、隨機森林、神經(jīng)網(wǎng)絡、XGBoost預測模型,通過對各個模型的評價指標的對比,找到最優(yōu)的預測模型,使得其能夠最大限度的識別違約用戶。最后通過對各個模型結果的分析,找到影... 

【文章來源】:東北師范大學吉林省 211工程院校 教育部直屬院校

【文章頁數(shù)】:40 頁

【學位級別】:碩士

【部分圖文】:

基于過采樣方法的信用卡用戶違約預測分析


Logistic函數(shù)圖像

直方圖,箱線圖,異常值


(2)異常值處理:對數(shù)據(jù)集進行異常值檢測,這些異常值可能是在實際調查過程中錄入的,表這些異常值的存在會對模型結果造成一定的影響于這些異常值個數(shù)相對較少,故直接刪除。(3)數(shù)據(jù)標準化:由表 3 可知,各個特征的綱也不相同,為了使得模型參數(shù)更具有可比性,行標準化處理從而消除量綱對模型結果的影響。3.2 描述性分析在正式建模前,需要對數(shù)據(jù)集有較深的了解對各個特征進行簡單的分析。圖 2 至圖 13 為各個n2yrs”的箱線圖和直方圖。

箱線圖,中位數(shù),違約率


箱線圖

【參考文獻】:
期刊論文
[1]基于網(wǎng)絡用戶評論的評分預測模型研究[J]. 張紅麗,劉濟郢,楊斯楠,徐健.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(08)
[2]基于ADASYN與AdaBoostSVM相結合的不平衡分類算法[J]. 柳培忠,洪銘,黃德天,駱炎民,王守覺.  北京工業(yè)大學學報. 2017(03)
[3]面向不均衡數(shù)據(jù)集中少數(shù)類細分的過采樣算法[J]. 古平,楊煬.  計算機工程. 2017(02)
[4]一種代價敏感隨機森林算法[J]. 尹華,胡玉平.  武漢大學學報(工學版). 2014(05)
[5]不平衡數(shù)據(jù)分類的混合算法[J]. 韓敏,朱新榮.  控制理論與應用. 2011(10)
[6]基于數(shù)據(jù)挖掘方法對商業(yè)銀行信用卡違約預測模型的研究[J]. 涂偉華,王索漫.  中國證券期貨. 2011(09)
[7]信貸信息不對稱下的信用卡信用風險研究[J]. 方匡南,吳見彬,朱建平,謝邦昌.  經(jīng)濟研究. 2010(S1)
[8]不平衡分類問題研究綜述[J]. 葉志飛,文益民,呂寶糧.  智能系統(tǒng)學報. 2009(02)
[9]不平衡數(shù)據(jù)分類方法綜述[J]. 楊明,尹軍梅,吉根林.  南京師范大學學報(工程技術版). 2008(04)
[10]一個基于神經(jīng)網(wǎng)絡——Logistic回歸的混合兩階段個人信用評分模型研究[J]. 石慶焱.  統(tǒng)計研究. 2005(05)

博士論文
[1]不均衡數(shù)據(jù)分類方法的研究[D]. 曹鵬.東北大學 2014

碩士論文
[1]信用卡違約影響因素研究[D]. 馬志昂.山東財經(jīng)大學 2017
[2]隨機森林在P2P網(wǎng)貸借款信用風險評估中的應用[D]. 徐婷婷.山東大學 2017
[3]銀行信用評級中的不平衡分類問題研究[D]. 陳力.廣東工業(yè)大學 2017
[4]基于少數(shù)類樣本重組的不平衡數(shù)據(jù)分類研究[D]. 李軒.湖南大學 2016
[5]基于優(yōu)化的xgboost-LMT模型的供應商信用評價研究[D]. 樊鵬.廣東工業(yè)大學 2016
[6]基于深度學習技術的信用卡交易欺詐偵測研究[D]. 丁衛(wèi)星.上海交通大學 2015
[7]基于Logistic回歸模型的P2P網(wǎng)貸平臺借款人信用風險評估[D]. 王夢佳.北京外國語大學 2015
[8]不平衡數(shù)據(jù)集分類算法的研究[D]. 孟軍.南京理工大學 2014
[9]基于集成學習的不平衡數(shù)據(jù)分類[D]. 宋海燕.西安電子科技大學 2014
[10]不平衡數(shù)據(jù)集分類問題研究[D]. 孫曉燕.山東師范大學 2012



本文編號:3340775

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3340775.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶0f266***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com