集成學(xué)習(xí)在互聯(lián)網(wǎng)借貸反欺詐中的應(yīng)用研究
發(fā)布時間:2021-06-23 03:11
本文介紹了基于集成學(xué)習(xí)的互聯(lián)網(wǎng)借貸反欺詐方法的研究;ヂ(lián)網(wǎng)借貸反欺詐是互聯(lián)網(wǎng)金融領(lǐng)域中的一個重要研究方向,傳統(tǒng)的互聯(lián)網(wǎng)借貸反欺詐算法大多基于規(guī)則。本文主要使用了多種機(jī)器學(xué)習(xí)算法訓(xùn)練反欺詐模型,并結(jié)合模型原理與場景特點分析了各模型性能上的差異,給出一種適合借貸反欺詐問題的交叉特征加權(quán)的模型集成策略。
【文章來源】:福建電腦. 2020,36(03)
【文章頁數(shù)】:5 頁
【部分圖文】:
交叉特征加權(quán)的集成示意圖
從上圖中可以發(fā)現(xiàn),基學(xué)習(xí)器中XGBoost的各項指標(biāo)結(jié)果是最優(yōu)秀。KS值能夠達(dá)到0.5以上的只有邏輯回歸、線性核SVM、高斯核SVM、lightGBM以及XGBoost這五個學(xué)習(xí)器。各個學(xué)習(xí)器的ROC曲線對比圖,如圖3所示,其中前五張圖為各學(xué)習(xí)器ROC曲線,第六張圖為所有ROC曲線的比較。由圖3可以看到,XGBoost模型和LightGBM模型的效果在該借貸數(shù)據(jù)集上是最優(yōu)秀的,也是最穩(wěn)定的。在使用同樣特征的情況下,各個模型的差距都不是很大,AUC都達(dá)到了0.8以上,效果最好的XGBoost模型和LightGBM模型更是達(dá)到了0.82以上。將以上所有學(xué)習(xí)器的效果,從不同的評價指標(biāo)進(jìn)行對比之后,找到對于借貸數(shù)據(jù)集效果最好、最穩(wěn)定的學(xué)習(xí)器作為集成策略的基學(xué)習(xí)器。最終選擇將邏輯回歸、線性核SVM、高斯核SVM、LightGBM與XGBoost作為集成策略的基學(xué)習(xí)器。
本文使用的是某公司的借貸數(shù)據(jù)集,通過上一節(jié)特征提取的方法得到了處理好特征的訓(xùn)練集與測試集。為了得到性能較好的學(xué)習(xí)器作為集成策略的基學(xué)習(xí)器,使用特征訓(xùn)練各個常用的學(xué)習(xí)器,通過實驗比較,得到各個學(xué)習(xí)器在反欺詐任務(wù)上的適應(yīng)性與性能優(yōu)劣,選擇性能較好的若干個學(xué)習(xí)器作為集成策略的基學(xué)習(xí)器。各個學(xué)習(xí)器的效果如圖2所示。從上圖中可以發(fā)現(xiàn),基學(xué)習(xí)器中XGBoost的各項指標(biāo)結(jié)果是最優(yōu)秀。KS值能夠達(dá)到0.5以上的只有邏輯回歸、線性核SVM、高斯核SVM、lightGBM以及XGBoost這五個學(xué)習(xí)器。各個學(xué)習(xí)器的ROC曲線對比圖,如圖3所示,其中前五張圖為各學(xué)習(xí)器ROC曲線,第六張圖為所有ROC曲線的比較。
【參考文獻(xiàn)】:
期刊論文
[1]P2P網(wǎng)絡(luò)借貸平臺中借款人違約風(fēng)險影響因素研究——以WDW為例[J]. 顧慧瑩,姚錚. 上海經(jīng)濟(jì)研究. 2015(11)
本文編號:3244108
【文章來源】:福建電腦. 2020,36(03)
【文章頁數(shù)】:5 頁
【部分圖文】:
交叉特征加權(quán)的集成示意圖
從上圖中可以發(fā)現(xiàn),基學(xué)習(xí)器中XGBoost的各項指標(biāo)結(jié)果是最優(yōu)秀。KS值能夠達(dá)到0.5以上的只有邏輯回歸、線性核SVM、高斯核SVM、lightGBM以及XGBoost這五個學(xué)習(xí)器。各個學(xué)習(xí)器的ROC曲線對比圖,如圖3所示,其中前五張圖為各學(xué)習(xí)器ROC曲線,第六張圖為所有ROC曲線的比較。由圖3可以看到,XGBoost模型和LightGBM模型的效果在該借貸數(shù)據(jù)集上是最優(yōu)秀的,也是最穩(wěn)定的。在使用同樣特征的情況下,各個模型的差距都不是很大,AUC都達(dá)到了0.8以上,效果最好的XGBoost模型和LightGBM模型更是達(dá)到了0.82以上。將以上所有學(xué)習(xí)器的效果,從不同的評價指標(biāo)進(jìn)行對比之后,找到對于借貸數(shù)據(jù)集效果最好、最穩(wěn)定的學(xué)習(xí)器作為集成策略的基學(xué)習(xí)器。最終選擇將邏輯回歸、線性核SVM、高斯核SVM、LightGBM與XGBoost作為集成策略的基學(xué)習(xí)器。
本文使用的是某公司的借貸數(shù)據(jù)集,通過上一節(jié)特征提取的方法得到了處理好特征的訓(xùn)練集與測試集。為了得到性能較好的學(xué)習(xí)器作為集成策略的基學(xué)習(xí)器,使用特征訓(xùn)練各個常用的學(xué)習(xí)器,通過實驗比較,得到各個學(xué)習(xí)器在反欺詐任務(wù)上的適應(yīng)性與性能優(yōu)劣,選擇性能較好的若干個學(xué)習(xí)器作為集成策略的基學(xué)習(xí)器。各個學(xué)習(xí)器的效果如圖2所示。從上圖中可以發(fā)現(xiàn),基學(xué)習(xí)器中XGBoost的各項指標(biāo)結(jié)果是最優(yōu)秀。KS值能夠達(dá)到0.5以上的只有邏輯回歸、線性核SVM、高斯核SVM、lightGBM以及XGBoost這五個學(xué)習(xí)器。各個學(xué)習(xí)器的ROC曲線對比圖,如圖3所示,其中前五張圖為各學(xué)習(xí)器ROC曲線,第六張圖為所有ROC曲線的比較。
【參考文獻(xiàn)】:
期刊論文
[1]P2P網(wǎng)絡(luò)借貸平臺中借款人違約風(fēng)險影響因素研究——以WDW為例[J]. 顧慧瑩,姚錚. 上海經(jīng)濟(jì)研究. 2015(11)
本文編號:3244108
本文鏈接:http://sikaile.net/falvlunwen/xingfalunwen/3244108.html