天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 投融資論文 >

基于非均衡數(shù)據(jù)處理和特征選擇的信貸風(fēng)險(xiǎn)評估算法研究

發(fā)布時(shí)間:2020-05-26 08:05
【摘要】:隨著互聯(lián)網(wǎng)金融的快速發(fā)展,許多銀行機(jī)構(gòu)和借貸平臺暴露出越來越多的信用風(fēng)險(xiǎn)問題。信貸風(fēng)險(xiǎn)評估模型作為一種有效的工具,可以利用客戶信息和客戶活動數(shù)據(jù)識別潛在的風(fēng)險(xiǎn),在金融機(jī)構(gòu)中發(fā)揮著至關(guān)重要的作用。本文針對信貸客戶數(shù)據(jù)海量、高維且類別分布不均衡的特點(diǎn),對原始的信貸客戶數(shù)據(jù)進(jìn)行了均衡化處理和特征選擇,并在此基礎(chǔ)上建立了基于集成學(xué)習(xí)的信貸風(fēng)險(xiǎn)評估模型,實(shí)現(xiàn)了信貸客戶的風(fēng)險(xiǎn)評估。具體研究內(nèi)容及創(chuàng)新點(diǎn)如下:(1)提出了一種基于選擇性混合采樣的非均衡信貸數(shù)據(jù)處理方法。通過對信貸客戶數(shù)據(jù)中不同類別的樣本分布情況進(jìn)行分析,分別對少數(shù)類和多數(shù)類的信貸客戶樣本進(jìn)行選擇性采樣處理,解決了因信貸數(shù)據(jù)類別分布不均衡所導(dǎo)致的風(fēng)險(xiǎn)評估不合理的問題。實(shí)驗(yàn)結(jié)果表明,相較于SD_ISMOTE方法,該方法處理后的信貸客戶數(shù)據(jù)將C4.5風(fēng)險(xiǎn)評估模型的F-measure值和G-mean值分別提高了6%和7%。(2)提出了一種基于多過濾器結(jié)合NSD(New Separable Degree)指標(biāo)的信貸特征選擇方法。通過從多個(gè)角度對信貸客戶特征的重要程度進(jìn)行度量和評估,避免了單一過濾器選擇特征時(shí),信貸客戶特征的多方面信息容易被忽略的問題。實(shí)驗(yàn)結(jié)果表明,相較于單一過濾器的方法(SFS-LW),該方法選出的最優(yōu)特征子集將信貸客戶風(fēng)險(xiǎn)評估的分類精確率提高了11.8%;相較于多過濾器結(jié)合包裝器的方法,該方法選擇特征的時(shí)間效率提升了30%~80%。(3)結(jié)合靜態(tài)集成和動態(tài)選擇集成,提出了兩種基于集成學(xué)習(xí)的風(fēng)險(xiǎn)評估模型:基于靜態(tài)集成學(xué)習(xí)的FS-Bagging模型和基于動態(tài)選擇集成的FBK模型,實(shí)現(xiàn)了信貸客戶的風(fēng)險(xiǎn)評估。實(shí)驗(yàn)結(jié)果表明,基于動態(tài)選擇集成的FBK模型在信貸客戶的風(fēng)險(xiǎn)評估中表現(xiàn)最優(yōu)。相較于Un-Ext-GDBT模型,該模型的AUC值提高了2%,ACC+值提高了2.5%。綜上所述,本文提出的集成非均衡數(shù)據(jù)處理和特征選擇的信貸風(fēng)險(xiǎn)評估模型,能夠更加精準(zhǔn)地實(shí)現(xiàn)信貸客戶的風(fēng)險(xiǎn)評估。這不僅能幫助金融機(jī)構(gòu)合理地規(guī)避風(fēng)險(xiǎn),減少損失的發(fā)生,還能為實(shí)際的信貸風(fēng)險(xiǎn)管理提供有價(jià)值的指導(dǎo)。
【圖文】:

特征選擇,非均衡,算法研究,整體框架


客戶的風(fēng)險(xiǎn)評估。然而,由于深度學(xué)習(xí)模型在信貸風(fēng)險(xiǎn)評估的過的解釋性不強(qiáng),較高的模型復(fù)雜度使其在風(fēng)險(xiǎn)評估的過程中需要實(shí)際的信貸業(yè)務(wù)中并不適用。因此,如何基于傳統(tǒng)的人工智能方貸風(fēng)險(xiǎn)評估模型,并有效提升信貸風(fēng)險(xiǎn)評估的預(yù)測精度,是目前。研究內(nèi)容和創(chuàng)新點(diǎn)在對信貸風(fēng)險(xiǎn)評估方法進(jìn)行深入研究和分析后,針對現(xiàn)有信貸風(fēng)不足,首先,從信貸數(shù)據(jù)海量、高維且類別分布不均衡的特點(diǎn)出衡信貸客戶數(shù)據(jù)的處理方法,,以及面向信貸客戶數(shù)據(jù)的特征選擇方上,建立了兩種基于集成學(xué)習(xí)的信貸風(fēng)險(xiǎn)評估模型,實(shí)現(xiàn)了信貸1 展示了基于非均衡數(shù)據(jù)處理和特征選擇的信貸風(fēng)險(xiǎn)評估算法研

框架圖,非均衡,數(shù)據(jù)處理方法,信貸客戶


數(shù)類的信貸客戶空間分布的樣本,最終信貸風(fēng)險(xiǎn)評估的性能依然會受2)在對多數(shù)類的信貸客戶樣本進(jìn)行欠采樣處理時(shí),雖然研究者們也提基于聚類的欠采樣方法。但是,在欠采樣的過程中,因?yàn)檎`刪數(shù)據(jù)造成本信息過度丟失,或是由于原始信貸客戶數(shù)據(jù)集自身分布的特點(diǎn)所造成穩(wěn)定的情況仍然存在。種基于選擇性混合采樣的非均衡信貸數(shù)據(jù)處理方法對現(xiàn)有非均衡信貸數(shù)據(jù)處理方法中的諸多不足,本文提出了一種基于選的非均衡信貸數(shù)據(jù)處理方法(a processing method based on selectivng for imbalanced credit data, 簡稱Se_MS方法),旨在對原始信貸客戶數(shù)類信貸客戶樣本和多數(shù)類信貸客戶樣本同時(shí)都進(jìn)行采樣處理,從而最大只對少數(shù)類的信貸客戶樣本進(jìn)行過采樣而造成的過擬合現(xiàn)象,以及只對客戶樣本進(jìn)行欠采樣而造成的信息丟失等問題。
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP311.13;F830.5

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 林蔭;;基于大數(shù)據(jù)分析的銀行不良信貸風(fēng)險(xiǎn)模型[J];工程經(jīng)濟(jì);2015年06期

2 陶新民;郝思媛;張冬雪;徐鵬;;不均衡數(shù)據(jù)分類算法的綜述[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期

3 趙自翔;王廣亮;李曉東;;基于支持向量機(jī)的不平衡數(shù)據(jù)分類的改進(jìn)欠采樣方法[J];中山大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年06期

4 曾志強(qiáng);吳群;廖備水;高濟(jì);;一種基于核SMOTE的非平衡數(shù)據(jù)集分類方法[J];電子學(xué)報(bào);2009年11期

相關(guān)博士學(xué)位論文 前2條

1 陳昊潔;基于選擇性集成算法的個(gè)人信用評分方法研究[D];哈爾濱工業(yè)大學(xué);2016年

2 洪波;商業(yè)銀行公司授信違約概率預(yù)測方法研究[D];合肥工業(yè)大學(xué);2014年

相關(guān)碩士學(xué)位論文 前6條

1 郭秋俊;基于選擇性集成算法的網(wǎng)貸個(gè)人信用評分模型研究[D];浙江工商大學(xué);2018年

2 張弛;K銀行信貸業(yè)務(wù)風(fēng)險(xiǎn)管理研究[D];安徽大學(xué);2017年

3 楊煬;面向不均衡數(shù)據(jù)集中少數(shù)類樣本細(xì)分的過采樣算法的研究[D];重慶大學(xué);2016年

4 劉靜;基于代價(jià)敏感貝葉斯分類的個(gè)人信用風(fēng)險(xiǎn)評級[D];華南理工大學(xué);2015年

5 任運(yùn)生;BP神經(jīng)網(wǎng)絡(luò)技術(shù)在信用社客戶分類中的應(yīng)用研究[D];湖南大學(xué);2014年

6 沈術(shù);決策樹算法在農(nóng)村信用社農(nóng)戶信用評級中的應(yīng)用[D];湖南大學(xué);2013年



本文編號:2681535

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/2681535.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3921***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com