商業(yè)銀行信貸逾期的預(yù)測
發(fā)布時間:2020-04-08 19:10
【摘要】:隨著社會的發(fā)展,我們國家信貸市場規(guī)模急劇擴(kuò)大,商業(yè)銀行的發(fā)展前景呈現(xiàn)出新的氣象。與此同時,防范個人信貸欺詐,降低信貸不良率也成為了商業(yè)銀行需要研究的一個重要課題。我們國家信貸市場規(guī)模急劇擴(kuò)大,但是與之相匹配的業(yè)務(wù)質(zhì)量卻沒有得到很大的提升,特別是最近這幾年,商業(yè)銀行出現(xiàn)了一系列的問題,如貸款逾期、不良貸款等性質(zhì)較為惡劣的問題,這些問題給商業(yè)銀行帶來了巨大的利潤損失。而且,隨著商業(yè)銀行中金融風(fēng)險的擴(kuò)大,促使了潛在金融危機(jī)隱患的加大,對我國金融業(yè)的持續(xù)穩(wěn)定造成了極大的影響,所以對商業(yè)銀行客戶是否會出現(xiàn)信貸逾期等情況的預(yù)測是一個必要的問題。針對商業(yè)銀行信貸現(xiàn)狀,本文利用某銀行提供的客戶信貸資料數(shù)據(jù),在對原始數(shù)據(jù)進(jìn)行一定的分析后,發(fā)現(xiàn)數(shù)據(jù)存在類別不平衡問題、部分變量存在大量缺失值和異常值,并且提供的原始變量較多,針對這些問題,本文將缺失數(shù)據(jù)很多的變量進(jìn)行刪除,然后根據(jù)數(shù)據(jù)的不同形式,利用決策樹和線性回歸將其余變量的缺失值(異常值視為缺失值)補(bǔ)全。對于數(shù)據(jù)類別不平衡問題,本文借助SMOTE算法將原始數(shù)據(jù)進(jìn)行了重構(gòu),保證重構(gòu)后的數(shù)據(jù)基本達(dá)到不同類別的樣本數(shù)量相當(dāng)。對數(shù)據(jù)進(jìn)行處理后,本文以IV算法對原始變量進(jìn)行篩選,然后結(jié)合ROC分析對篩選后的變量分別單獨(dú)建立Logistic回歸模型檢驗(yàn)單個變量建立預(yù)測模型的可行性,再將ROC分析與隨機(jī)森林相結(jié)合,由于不同的變量在模型中所起的重要性是不同的,因此選擇累積重要性達(dá)到50%的變量進(jìn)行組合,建立了邏輯回歸模型,最終取AUC值最大者作為建立信貸逾期預(yù)測模型的變量。最后,利用建立的Logistic模型對商業(yè)銀行信貸數(shù)據(jù)作出預(yù)測,預(yù)測準(zhǔn)確率達(dá)到70%以上,同時將該模型與SVM模型和RF(隨機(jī)森林)模型比較,根據(jù)比較結(jié)果,說明本文建立的信貸逾期預(yù)測模型具有一定的可信度,其預(yù)測結(jié)果能夠作為商業(yè)銀行進(jìn)行決策時較為可靠的依據(jù),提高其對信貸風(fēng)險的預(yù)防,為金融機(jī)構(gòu)制定正確的信用貸款政策提供理論依據(jù)。
【圖文】:
科技大學(xué)碩士學(xué)位論文 第四章 信貸逾期預(yù)測模型的建立及結(jié)果第四章 信貸逾期預(yù)測模型的建立及結(jié)果分析4.1 建模前的準(zhǔn)備4.1.1 數(shù)據(jù)來源及描述性統(tǒng)計分析本文利用的數(shù)據(jù)為某銀行提供,包括 n(n>10000)人的信貸數(shù)據(jù),包份信息及財產(chǎn)狀況、持卡信息、交易信息、放款信息、還款信息、申請貸等 199 個解釋變量,也包含了這 n 個人的是否信貸逾期的數(shù)據(jù)。經(jīng)過對原始數(shù)據(jù)觀察,發(fā)現(xiàn)原數(shù)據(jù)中有一部分變量數(shù)據(jù)缺失嚴(yán)重,現(xiàn)用式展現(xiàn),如圖 4-1 所示,,具體代碼見附錄 1。
科技大學(xué)碩士學(xué)位論文 第四章 信貸逾期預(yù)測模型的建立及結(jié)果函數(shù)返回值包括非缺失值的數(shù)量、平均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、最小值、最大四分位數(shù)和下四分位數(shù);根據(jù) describe 函數(shù)得到的結(jié)果計算均值、極差、方準(zhǔn)差和變異系數(shù),然后將這些指標(biāo)匯總為一張表,并繪制折線圖,利用折離散程度和量綱問題做出判斷,如圖 4-2 所示。在描述性統(tǒng)計分析時,將始數(shù)據(jù)繪制箱線圖,根據(jù)箱線圖判斷原始數(shù)據(jù)中是否存在異常值,如圖 4。具體代碼見附錄 3。
【學(xué)位授予單位】:廣西科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F832.4
【圖文】:
科技大學(xué)碩士學(xué)位論文 第四章 信貸逾期預(yù)測模型的建立及結(jié)果第四章 信貸逾期預(yù)測模型的建立及結(jié)果分析4.1 建模前的準(zhǔn)備4.1.1 數(shù)據(jù)來源及描述性統(tǒng)計分析本文利用的數(shù)據(jù)為某銀行提供,包括 n(n>10000)人的信貸數(shù)據(jù),包份信息及財產(chǎn)狀況、持卡信息、交易信息、放款信息、還款信息、申請貸等 199 個解釋變量,也包含了這 n 個人的是否信貸逾期的數(shù)據(jù)。經(jīng)過對原始數(shù)據(jù)觀察,發(fā)現(xiàn)原數(shù)據(jù)中有一部分變量數(shù)據(jù)缺失嚴(yán)重,現(xiàn)用式展現(xiàn),如圖 4-1 所示,,具體代碼見附錄 1。
科技大學(xué)碩士學(xué)位論文 第四章 信貸逾期預(yù)測模型的建立及結(jié)果函數(shù)返回值包括非缺失值的數(shù)量、平均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、最小值、最大四分位數(shù)和下四分位數(shù);根據(jù) describe 函數(shù)得到的結(jié)果計算均值、極差、方準(zhǔn)差和變異系數(shù),然后將這些指標(biāo)匯總為一張表,并繪制折線圖,利用折離散程度和量綱問題做出判斷,如圖 4-2 所示。在描述性統(tǒng)計分析時,將始數(shù)據(jù)繪制箱線圖,根據(jù)箱線圖判斷原始數(shù)據(jù)中是否存在異常值,如圖 4。具體代碼見附錄 3。
【學(xué)位授予單位】:廣西科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F832.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 梁慧玲;孫鋒鋒;丁桂芹;;基于隨機(jī)森林算法的福建林火發(fā)生驅(qū)動因子分析[J];信息系統(tǒng)工程;2019年09期
2 范格華;;基于隨機(jī)森林回歸的魚雷管峰壓預(yù)測[J];信息系統(tǒng)工程;2019年08期
3 沈智勇;蘇
本文編號:2619724
本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/2619724.html
最近更新
教材專著