天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于非平衡數(shù)據(jù)集的貸款違規(guī)預(yù)測(cè)研究

發(fā)布時(shí)間:2021-05-11 09:43
  互聯(lián)網(wǎng)金融個(gè)人信用貸款方面,評(píng)估用戶的信用良好度,并且分配合適的產(chǎn)品給用戶,進(jìn)行反欺詐,以及減少呆賬的產(chǎn)生等問(wèn)題都可以通過(guò)數(shù)據(jù)跟蹤來(lái)進(jìn)行處理。在商業(yè)分析中,收益和風(fēng)險(xiǎn)是成正比的,綜合考慮盈利最大化來(lái)進(jìn)行風(fēng)險(xiǎn)定價(jià)。通過(guò)規(guī)則和建?梢粤炕粋(gè)客戶的信用好壞,然而在實(shí)際應(yīng)用中,不僅面臨著數(shù)據(jù)量大且維度高的現(xiàn)狀,同樣也面臨著數(shù)據(jù)不平衡的現(xiàn)狀,因?yàn)橛馄诳蛻魯?shù)量相較非逾期客戶數(shù)量總是少數(shù)的,那么在建模的過(guò)程中需要考慮到這些問(wèn)題對(duì)模型可信度的影響。很多傳統(tǒng)算法會(huì)偏向于多數(shù)類,例如最近鄰算法KNN,在最后決策的時(shí)候是以少數(shù)服從多數(shù)的策略,存在誤判,致使樣本量本來(lái)就少的類別被正確識(shí)別出來(lái)的概率變得更低。這類非平衡數(shù)據(jù)預(yù)測(cè)使用模型精確度Accuracy來(lái)衡量模型好壞也就不適用了。其次,從互聯(lián)網(wǎng)上獲得的用戶消費(fèi)信息、運(yùn)營(yíng)商信息、多平臺(tái)上的借貸信息等數(shù)據(jù)的維度眾多,高維度的數(shù)據(jù)預(yù)測(cè)中做好特征選擇也很重要。本文針對(duì)互聯(lián)網(wǎng)金融數(shù)據(jù)的非平衡和維度高這兩個(gè)方面進(jìn)行處理,重點(diǎn)研究了從數(shù)據(jù)層面和算法層面對(duì)非平衡數(shù)據(jù)集的處理方式,使用Python基于Kaggle競(jìng)賽平臺(tái)GiveMeSomeCredit競(jìng)賽的數(shù)據(jù)集(非平衡的... 

【文章來(lái)源】:長(zhǎng)江大學(xué)湖北省

【文章頁(yè)數(shù)】:68 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 引言
    1.2 研究目的與意義
    1.3 研究技術(shù)路線
第2章 課題研究關(guān)鍵技術(shù)
    2.1 互聯(lián)網(wǎng)金融及信用風(fēng)險(xiǎn)預(yù)測(cè)
    2.2 非平衡數(shù)據(jù)集
    2.3 機(jī)器學(xué)習(xí)算法的應(yīng)用
    2.4 信用評(píng)級(jí)模型的指標(biāo)選擇
    2.5 本章小結(jié)
第3章 非平衡數(shù)據(jù)集處理
    3.1 非平衡數(shù)據(jù)集分類的難點(diǎn)
    3.2 非平衡數(shù)據(jù)集分類研究
    3.3 本章小結(jié)
第4章 數(shù)據(jù)預(yù)處理和模型構(gòu)建及優(yōu)化
    4.1 逾期預(yù)測(cè)模型框架
    4.2 數(shù)據(jù)預(yù)處理
    4.3 特征選擇
    4.4 特征衍生
    4.5 實(shí)驗(yàn)過(guò)程
    4.6 實(shí)驗(yàn)結(jié)果分析
    4.7 本章小結(jié)
第5章 總結(jié)與展望
致謝
參考文獻(xiàn)
個(gè)人簡(jiǎn)介


【參考文獻(xiàn)】:
期刊論文
[1]面向高維數(shù)據(jù)的個(gè)人信貸風(fēng)險(xiǎn)評(píng)估方法[J]. 廖文雄,曾碧,梁天愷,徐雅蕓,趙俊峰.  計(jì)算機(jī)工程與應(yīng)用. 2020(04)
[2]基于LightGBM算法的P2P項(xiàng)目信用評(píng)級(jí)模型的設(shè)計(jì)及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪.  數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
[3]互聯(lián)網(wǎng)金融的競(jìng)爭(zhēng)優(yōu)勢(shì)分析[J]. 賈吉明.  現(xiàn)代經(jīng)濟(jì)信息. 2018(04)
[4]基于差異度的不均衡電信客戶數(shù)據(jù)分類方法[J]. 王林,郭娜娜.  計(jì)算機(jī)應(yīng)用. 2017(04)
[5]基于GBDT與Logistic回歸融合的個(gè)人信貸風(fēng)險(xiǎn)評(píng)估模型及實(shí)證分析[J]. 蔡文學(xué),羅永豪,張冠湘,鐘慧玲.  管理現(xiàn)代化. 2017(02)
[6]大數(shù)據(jù)時(shí)代的互聯(lián)網(wǎng)金融創(chuàng)新及傳統(tǒng)銀行轉(zhuǎn)型[J]. 薛煒星.  現(xiàn)代營(yíng)銷(下旬刊). 2016(07)
[7]改進(jìn)隨機(jī)森林算法在電信業(yè)客戶流失預(yù)測(cè)中的應(yīng)用[J]. 丁君美,劉貴全,李慧.  模式識(shí)別與人工智能. 2015(11)
[8]基于FICO信用評(píng)分模型的電商小貸信用評(píng)價(jià)分析研究[J]. 陳彩霞,石春,程明雄.  現(xiàn)代商業(yè). 2015(26)
[9]FICO:一位躊躇滿志的“廚子”[J]. 黃鑫宇.  首席財(cái)務(wù)官. 2015(16)
[10]互聯(lián)網(wǎng)金融的法律規(guī)制——基于信息工具的視角[J]. 楊東.  中國(guó)社會(huì)科學(xué). 2015(04)

博士論文
[1]我國(guó)小微企業(yè)貸款信用風(fēng)險(xiǎn)評(píng)估模型研究[D]. 張潤(rùn)馳.南京大學(xué) 2018
[2]不均衡數(shù)據(jù)分類方法的研究[D]. 曹鵬.東北大學(xué) 2014
[3]面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中的應(yīng)用[D]. 谷瓊.中國(guó)地質(zhì)大學(xué) 2009

碩士論文
[1]Spark平臺(tái)下的基于隨機(jī)森林算法的用戶貸款風(fēng)險(xiǎn)預(yù)測(cè)研究[D]. 周杰.東北師范大學(xué) 2018
[2]面向高維不平衡數(shù)據(jù)的特征選擇算法研究[D]. 王國(guó)權(quán).哈爾濱工業(yè)大學(xué) 2017
[3]基于機(jī)器學(xué)習(xí)算法的信用風(fēng)險(xiǎn)預(yù)測(cè)模型研究[D]. 甘鷺.北京交通大學(xué) 2017
[4]基于混合采樣的非平衡數(shù)據(jù)集分類研究[D]. 歐陽(yáng)源遊.重慶大學(xué) 2014



本文編號(hào):3181189

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/3181189.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0e552***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com