融合數(shù)據(jù)增廣技術(shù)與機(jī)器學(xué)習(xí)算法的個(gè)人信用評(píng)分研究
發(fā)布時(shí)間:2020-12-22 09:11
為了提高個(gè)人信用評(píng)分模型算法預(yù)測(cè)精準(zhǔn)率,受視覺領(lǐng)域數(shù)據(jù)增廣思路啟發(fā),提出融合數(shù)據(jù)增廣技術(shù)與機(jī)器學(xué)習(xí)算法的個(gè)人信用評(píng)分模型。該模型首先對(duì)原始個(gè)人信用數(shù)據(jù)進(jìn)行數(shù)據(jù)增廣處理,然后基于機(jī)器學(xué)習(xí)分類算法訓(xùn)練一個(gè)二分類個(gè)人信用評(píng)分模型,最后基于公開個(gè)人信用數(shù)據(jù)集,分別建立未經(jīng)過數(shù)據(jù)增廣和經(jīng)過數(shù)據(jù)增廣處理后的個(gè)人信用評(píng)分模型。對(duì)比準(zhǔn)確率、精確率、召回率、F1得分、AUC值和ROC曲線等6個(gè)性能評(píng)價(jià)指標(biāo),結(jié)果顯示,相較于僅基于機(jī)器學(xué)習(xí)算法的個(gè)人信用評(píng)分模型,融合了數(shù)據(jù)增廣技術(shù)與機(jī)器學(xué)習(xí)算法的個(gè)人信用評(píng)分模型使得分類性能得到了一定提升,分類準(zhǔn)確率平均高出5%。
【文章來源】:軟件導(dǎo)刊. 2020年08期
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
數(shù)據(jù)增廣實(shí)例
由表3可以看出,在德國(guó)信用數(shù)據(jù)集上,除回歸(lr)、樸素貝葉斯(mnb)與數(shù)據(jù)增廣技術(shù)融合后的模型較原模型性能低外,其它6個(gè)融合模型都比原模型性能好,特別是k近鄰(knn)、決策樹(dtc)、隨機(jī)森林(rfc)、極限梯度提升(XGBoost)、梯度提升樹(GBDT)等融合后的模型在所有性能指標(biāo)上都比原模型要高出不少,準(zhǔn)確率平均高出6%左右。由圖2可以看出,兩個(gè)ROC曲線凸出,也即在德國(guó)數(shù)據(jù)集上,經(jīng)過與數(shù)據(jù)增廣技術(shù)融合的算法性能都得到了顯著提升。
【參考文獻(xiàn)】:
期刊論文
[1]基于數(shù)據(jù)增廣和CNN的地震隨機(jī)噪聲壓制[J]. 王鈺清,陸文凱,劉金林,張猛,苗永康. 地球物理學(xué)報(bào). 2019(01)
[2]基于優(yōu)化分類的數(shù)據(jù)增廣方法[J]. 蔣夢(mèng)瑩,林小竹,柯巖. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(11)
[3]基于Faster R-CNN及數(shù)據(jù)增廣的滿文文檔印章檢測(cè)[J]. 盧海濤,吳磊,周建云,鄭蕊蕊,賀建軍. 大連民族大學(xué)學(xué)報(bào). 2018(05)
[4]一種基于Boosting的集成學(xué)習(xí)算法在銀行個(gè)人信用評(píng)級(jí)中的應(yīng)用[J]. 陳力,黃艷瑩,游德創(chuàng). 價(jià)值工程. 2017(18)
[5]基于遷移學(xué)習(xí)的客戶信用評(píng)估模型研究[J]. 朱兵,賀昌政,李慧媛. 運(yùn)籌與管理. 2015(02)
[6]銀行客戶信用評(píng)估動(dòng)態(tài)分類器集成選擇模型[J]. 肖進(jìn),劉敦虎,顧新,汪壽陽(yáng). 管理科學(xué)學(xué)報(bào). 2015(03)
[7]基于隨機(jī)森林的個(gè)人信用評(píng)估模型研究及實(shí)證分析[J]. 蕭超武,蔡文學(xué),黃曉宇,陳康. 管理現(xiàn)代化. 2014(06)
[8]個(gè)人信用評(píng)分關(guān)鍵技術(shù)研究的新進(jìn)展[J]. 向暉,楊勝剛. 財(cái)經(jīng)理論與實(shí)踐. 2011(04)
[9]基于PSO的個(gè)人信用評(píng)估組合預(yù)測(cè)模型[J]. 殷爽,姜明輝. 經(jīng)濟(jì)研究導(dǎo)刊. 2008(14)
[10]精煉決策樹模型在個(gè)人信用評(píng)估中的應(yīng)用[J]. 朱毅峰,孫亞南. 統(tǒng)計(jì)教育. 2008(01)
碩士論文
[1]我國(guó)P2P網(wǎng)絡(luò)信貸風(fēng)險(xiǎn)評(píng)估研究[D]. 劉峙廷.廣西大學(xué) 2013
[2]遺傳規(guī)劃模型在我國(guó)個(gè)人信用評(píng)估中的應(yīng)用研究[D]. 金妍彥.哈爾濱工業(yè)大學(xué) 2006
本文編號(hào):2931511
【文章來源】:軟件導(dǎo)刊. 2020年08期
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
數(shù)據(jù)增廣實(shí)例
由表3可以看出,在德國(guó)信用數(shù)據(jù)集上,除回歸(lr)、樸素貝葉斯(mnb)與數(shù)據(jù)增廣技術(shù)融合后的模型較原模型性能低外,其它6個(gè)融合模型都比原模型性能好,特別是k近鄰(knn)、決策樹(dtc)、隨機(jī)森林(rfc)、極限梯度提升(XGBoost)、梯度提升樹(GBDT)等融合后的模型在所有性能指標(biāo)上都比原模型要高出不少,準(zhǔn)確率平均高出6%左右。由圖2可以看出,兩個(gè)ROC曲線凸出,也即在德國(guó)數(shù)據(jù)集上,經(jīng)過與數(shù)據(jù)增廣技術(shù)融合的算法性能都得到了顯著提升。
【參考文獻(xiàn)】:
期刊論文
[1]基于數(shù)據(jù)增廣和CNN的地震隨機(jī)噪聲壓制[J]. 王鈺清,陸文凱,劉金林,張猛,苗永康. 地球物理學(xué)報(bào). 2019(01)
[2]基于優(yōu)化分類的數(shù)據(jù)增廣方法[J]. 蔣夢(mèng)瑩,林小竹,柯巖. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(11)
[3]基于Faster R-CNN及數(shù)據(jù)增廣的滿文文檔印章檢測(cè)[J]. 盧海濤,吳磊,周建云,鄭蕊蕊,賀建軍. 大連民族大學(xué)學(xué)報(bào). 2018(05)
[4]一種基于Boosting的集成學(xué)習(xí)算法在銀行個(gè)人信用評(píng)級(jí)中的應(yīng)用[J]. 陳力,黃艷瑩,游德創(chuàng). 價(jià)值工程. 2017(18)
[5]基于遷移學(xué)習(xí)的客戶信用評(píng)估模型研究[J]. 朱兵,賀昌政,李慧媛. 運(yùn)籌與管理. 2015(02)
[6]銀行客戶信用評(píng)估動(dòng)態(tài)分類器集成選擇模型[J]. 肖進(jìn),劉敦虎,顧新,汪壽陽(yáng). 管理科學(xué)學(xué)報(bào). 2015(03)
[7]基于隨機(jī)森林的個(gè)人信用評(píng)估模型研究及實(shí)證分析[J]. 蕭超武,蔡文學(xué),黃曉宇,陳康. 管理現(xiàn)代化. 2014(06)
[8]個(gè)人信用評(píng)分關(guān)鍵技術(shù)研究的新進(jìn)展[J]. 向暉,楊勝剛. 財(cái)經(jīng)理論與實(shí)踐. 2011(04)
[9]基于PSO的個(gè)人信用評(píng)估組合預(yù)測(cè)模型[J]. 殷爽,姜明輝. 經(jīng)濟(jì)研究導(dǎo)刊. 2008(14)
[10]精煉決策樹模型在個(gè)人信用評(píng)估中的應(yīng)用[J]. 朱毅峰,孫亞南. 統(tǒng)計(jì)教育. 2008(01)
碩士論文
[1]我國(guó)P2P網(wǎng)絡(luò)信貸風(fēng)險(xiǎn)評(píng)估研究[D]. 劉峙廷.廣西大學(xué) 2013
[2]遺傳規(guī)劃模型在我國(guó)個(gè)人信用評(píng)估中的應(yīng)用研究[D]. 金妍彥.哈爾濱工業(yè)大學(xué) 2006
本文編號(hào):2931511
本文鏈接:http://sikaile.net/jingjilunwen/guojijinrong/2931511.html
最近更新
教材專著