天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 投融資論文 >

多分類器融合算法的研究及其在信貸風(fēng)控中的應(yīng)用

發(fā)布時間:2020-09-24 14:51
   近年來,機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展,以及其良好的魯棒性和泛化性在模式識別、推薦系統(tǒng)等領(lǐng)域都取得了優(yōu)異的應(yīng)用效果。在分類問題中,不同的分類算法有著本身特定的適用條件,算法在學(xué)習(xí)的過程中存在著自身的性能極限,這種問題常使得單一算法在解決實際問題中往往存在著一些局限性。所以,利用不同分類算法的優(yōu)勢,對不同算法進(jìn)行有效融合,“博采眾長”,不僅可以更好的利用原始數(shù)據(jù)信息,也獲得比單一算法更優(yōu)越的準(zhǔn)確性和泛化性能。隨著我國經(jīng)濟(jì)的快速發(fā)展,消費信貸業(yè)務(wù)也增長迅速,住房按揭、助學(xué)貸款、信用卡等各種個人信貸業(yè)務(wù)的規(guī)模不斷增長。但是相對于西方發(fā)達(dá)國家,我國個人征信系統(tǒng)的建設(shè)并不完善,大量人群的信用數(shù)據(jù)嚴(yán)重缺失,很多金融機(jī)構(gòu)開始廣泛采集用戶的基本資料、信貸記錄、信用卡使用情況等各種信息來構(gòu)建自身的數(shù)據(jù)倉庫。但是這些數(shù)據(jù)往往存在著樣本量大、維度高、多元化、冗余化等特點,這也對傳統(tǒng)機(jī)器學(xué)習(xí)模型的處理能力提出了挑戰(zhàn)。針對傳統(tǒng)風(fēng)控算法存在的準(zhǔn)確率低、容易過擬合的問題,本文首先提出一種基于投票機(jī)制的單層融合算法,并取得了較好的檢測效果。首先,對實驗數(shù)據(jù)進(jìn)行特征工程和數(shù)據(jù)預(yù)處理操作,在保留數(shù)據(jù)信息不減少的前提下,降低數(shù)據(jù)維度,提高數(shù)據(jù)的質(zhì)量,為算法訓(xùn)練打下好的前提條件。在算法訓(xùn)練階段,相比傳統(tǒng)的單一基學(xué)習(xí)器,創(chuàng)新性地采用強(qiáng)學(xué)習(xí)器作為基學(xué)習(xí)器,將每個基學(xué)習(xí)器訓(xùn)練最優(yōu)。最后將融合后的單層算法與基學(xué)習(xí)器和目前已經(jīng)研究出的算法進(jìn)行比較,實驗證明,算法具有較高的準(zhǔn)確性與防止過擬合能力。為了進(jìn)一步提升算法的準(zhǔn)確性與泛化能力,本文利用Stacking集成框架,構(gòu)建了兩層分類器的混合多層算法,第一層模型采用分類精度較高的強(qiáng)學(xué)習(xí)器,第二層采用經(jīng)過單層融合后產(chǎn)生的優(yōu)秀算法。最后通過對比單一算法與其他融合算法的算法準(zhǔn)確性,得出該算法的效果也要優(yōu)于以上算法,這為金融機(jī)構(gòu)建立個人信用評估系統(tǒng)提供了一種新的思路和方法,也為構(gòu)建多層Stacking集成的個人信用評估模型提供了參考和借鑒。
【學(xué)位單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP181;F832.4
【部分圖文】:

示意圖,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),示意圖,分類算法


圖 2.3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖方法列的分類算法,每個算法有不同的適用范圍。不可分問題。集成學(xué)習(xí)(ensemble learning),當(dāng)組合形成高性能的強(qiáng)學(xué)習(xí)器的方法,使集成現(xiàn)實生活中,這種“集體智慧”使得很多問題將多個分類器集成起來而形成的新的分類算法最常見的集成思想有兩種:Bagging 和 Boost

樣本,數(shù)據(jù),還款,日期


第 3 章 基于單層融合的風(fēng)控算法3.3.1 特征縮放樣本往往存在較多的數(shù)據(jù)記錄,在進(jìn)行數(shù)據(jù)探索過程中,我們通常先觀察樣本的前幾條記錄,來簡單的探索下樣本分布情況與各個特征單位是否統(tǒng)一。這里,為方便算法訓(xùn)練,統(tǒng)一為數(shù)值類型,我們對日期類型數(shù)據(jù)進(jìn)行了離散化處理。根據(jù)出生日期距今時間,將出生日期轉(zhuǎn)變?yōu)槟挲g這一數(shù)值類型數(shù)據(jù);在實際還款日期上,賬戶多存在延期行為,所以根據(jù)實際還款日期與規(guī)定還款日期時間差將還款日期轉(zhuǎn)變?yōu)檠舆t天數(shù)。所以,對于 2016 年 10 月到 2017 年 2 月的還款情況表示為-2:提前還清所有欠款;-1:還清當(dāng)月欠款;1:逾期一個月;2:逾期兩個月;一直到 8:逾期八個月。經(jīng)過離散化處理后,我們首先觀察數(shù)據(jù)前五條樣本,如圖 3.2 所示。

標(biāo)準(zhǔn)化處理,樣本


第 3 章 基于單層融合的風(fēng)控算法特征標(biāo)準(zhǔn)化使每個特征的值有零均值(zero-mean)和單位方差(unit-variance)。這個方法在機(jī)器學(xué)習(xí)的算法中被廣泛使用。例如:SVM、邏輯回歸和神經(jīng)網(wǎng)絡(luò)。這個方法如公式 3.2 所示。 ……………………………………… (3.2)本文采用標(biāo)準(zhǔn)化的方式進(jìn)行數(shù)據(jù)縮放,處理后的數(shù)據(jù)信息如圖 3.3 所示,在此,列出前五條信息,用于實驗結(jié)果展現(xiàn)。

【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 陳念;唐振民;;加權(quán)投票采樣學(xué)習(xí)在用戶信用評級中的應(yīng)用[J];計算機(jī)工程與應(yīng)用;2014年21期

2 郭小燕;張明;;帶權(quán)重的RBF神經(jīng)網(wǎng)絡(luò)銀行個人信用評價方法[J];計算機(jī)工程與應(yīng)用;2013年05期

3 師飛龍;李嵐;徐楠楠;;基于多數(shù)投票的DBC人臉識別[J];計算機(jī)工程與應(yīng)用;2014年11期

4 錢葉魁;陳鳴;葉立新;劉鳳榮;朱少衛(wèi);張晗;;基于多尺度主成分分析的全網(wǎng)絡(luò)異常檢測方法[J];軟件學(xué)報;2012年02期

5 姜明輝;謝行恒;王樹林;溫瀟;;個人信用評估的Logistic-RBF組合模型[J];哈爾濱工業(yè)大學(xué)學(xué)報;2007年07期

6 何建國;蔣國銀;田波;;基于改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)的信用評估系統(tǒng)研究[J];計算機(jī)工程與設(shè)計;2006年04期

7 楊杰,吳中如;觀測數(shù)據(jù)擬合分析中的多重共線性問題[J];四川大學(xué)學(xué)報(工程科學(xué)版);2005年05期

8 石慶焱;一個基于神經(jīng)網(wǎng)絡(luò)——Logistic回歸的混合兩階段個人信用評分模型研究[J];統(tǒng)計研究;2005年05期



本文編號:2825870

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/2825870.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶115f2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com