集成學習算法在個人信用評估中的應(yīng)用
發(fā)布時間:2020-05-17 01:01
【摘要】:隨著經(jīng)濟的發(fā)展,人們通過使用信用卡、螞蟻借唄等新型產(chǎn)品進行提前消費以改變量入為出的傳統(tǒng)消費觀念。與此同時,形形色色的借貸方法開始流行,各類線上線下的資金借貸方式也變得越來越普遍。但從另一種角度來看,一種形勢的盛行往往會引起一系列新問題的產(chǎn)生,當今時代信貸消費方式的流行也不例外。因而,由此所引發(fā)的客戶違約問題嚴重影響了信貸行業(yè)的發(fā)展,進而阻礙了國家的經(jīng)濟發(fā)展。這一現(xiàn)象使得現(xiàn)有的信用評估體系面臨著巨大的挑戰(zhàn),個人信用評估逐步成為信貸這一行業(yè)的研究熱點,引入更有效的評估方法將更有助于經(jīng)濟的發(fā)展。申請貸款的客戶的等級主要分為違約和不違約兩種類別,可以將其看作一個分類問題進行研究。對該類問題的研究,主要是對申請貸款客戶的個人經(jīng)濟條件、財產(chǎn)情況等個人屬性以及歷史信用記錄建立分類模型,從而達到評估客戶信用的目的。本文對國外某銀行及國內(nèi)某貸款機構(gòu)所提供的金融信用數(shù)據(jù)集進行了系統(tǒng)的預(yù)處理,采用貝葉斯優(yōu)化算法對模型進行參數(shù)優(yōu)化,基于三種不同的模型對特征進行重要性分析。然后基于Bagging和Boosting兩種集成學習的代表算法以及Stacking集成學習算法訓(xùn)練模型。其中Stacking集成分別以隨機森林、支持向量機及LightGBM為初級學習器、對數(shù)幾率回歸為次級學習器構(gòu)建評估模型。此外,本文還加入了對數(shù)幾率回歸、支持向量機、k近鄰、決策樹、神經(jīng)網(wǎng)絡(luò)等簡單分類算法來進行比較。最后,使用Friedman及Nemenyi兩種檢驗方法來比較這些模型,并繪制Friedman檢驗圖進一步驗證;谏鲜瞿P褪褂10折交叉驗證,驗證結(jié)果表明Bagging和Boosting這兩種集成學習算法訓(xùn)練的模型都起到了一定的性能提升作用,并且后者得到的效果更好,但使用Stacking集成模型的效果并不理想,未能有效地提升分類性能。整體來說,集成算法分類效果還是優(yōu)于傳統(tǒng)單一算法。最后,比較兩種檢驗方法的結(jié)果可知,在置信度為95%的條件下認為部分算法的性能不同。
【圖文】:
技術(shù)路線圖
集成學習示意圖
【學位授予單位】:湖南師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP181;F832.4
本文編號:2667653
【圖文】:
技術(shù)路線圖
集成學習示意圖
【學位授予單位】:湖南師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP181;F832.4
【參考文獻】
相關(guān)期刊論文 前1條
1 徐少鋒;;FISHER判別分析在個人信用評估中的應(yīng)用[J];統(tǒng)計與決策;2006年02期
,本文編號:2667653
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2667653.html
最近更新
教材專著