基于機(jī)器學(xué)習(xí)的車險(xiǎn)索賠頻率預(yù)測
發(fā)布時(shí)間:2021-02-25 18:01
近年來,廣義線性模型已被廣泛用于車險(xiǎn)定價(jià),而一些研究結(jié)果顯示機(jī)器學(xué)習(xí)在某些方面優(yōu)于廣義線性模型,但這些結(jié)果都只是基于某個(gè)單一數(shù)據(jù)集。為了更全面地比較廣義線性模型與機(jī)器學(xué)習(xí)方法在車險(xiǎn)索賠頻率預(yù)測問題上的效果,對(duì)7個(gè)車險(xiǎn)數(shù)據(jù)集進(jìn)行了比較測試,包括深度學(xué)習(xí)、隨機(jī)森林、支持向量機(jī)、XGboost等機(jī)器學(xué)習(xí)方法;基于相同的訓(xùn)練集,建立不同的廣義線性模型預(yù)測索賠頻率,根據(jù)最小信息準(zhǔn)則(AIC)選取最優(yōu)的廣義線性模型;通過交叉驗(yàn)證調(diào)參獲得機(jī)器學(xué)習(xí)最佳參數(shù)和模型。研究結(jié)果顯示:在所有的數(shù)據(jù)集上XGboost的預(yù)測效果一致地優(yōu)于廣義線性模型;對(duì)于某些自變量較多、變量間相關(guān)性強(qiáng)的數(shù)據(jù)集,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)和隨機(jī)森林的預(yù)測效果比廣義線性模型更好。
【文章來源】:統(tǒng)計(jì)與信息論壇. 2019,34(05)北大核心CSSCI
【文章頁數(shù)】:10 頁
【文章目錄】:
一、引 言
二、模型介紹
(一) 廣義線性模型 (GLM)
(二) 支持向量機(jī) (SVM)
(三) 隨機(jī)森林 (Random Forest)
features) 。"> 1.最大特征數(shù) (maxfeatures) 。
estimators) 。"> 2.子樹的數(shù)量 (nestimators) 。
samplesleaf) 。"> 3.葉子節(jié)點(diǎn)最少樣本數(shù) (minsamplesleaf) 。
(四) 神經(jīng)網(wǎng)絡(luò) (ANN) 和深度神經(jīng)網(wǎng)絡(luò) (DNN) 模型
(五) 梯度提升算法 (Gradient Boosting)
三、數(shù)據(jù)介紹
(一) 數(shù)據(jù)集AutoClaim
(二) 數(shù)據(jù)集Tangshan
(三) 數(shù)據(jù)預(yù)處理
四、實(shí)證結(jié)果分析
(一) 各種方法的最優(yōu)模型和最優(yōu)參數(shù)
(二) 各種方法的比較分析
五、結(jié) 論
附錄:有序Lorenz曲線和Gini系數(shù)及其計(jì)算方法。
【參考文獻(xiàn)】:
期刊論文
[1]駕駛行為保險(xiǎn)的風(fēng)險(xiǎn)預(yù)測模型研究[J]. 孟生旺,黃一凡. 保險(xiǎn)研究. 2018(08)
[2]污染數(shù)據(jù)的穩(wěn)健稀疏成組變量選擇方法研究[J]. 李揚(yáng),許文甫,馬雙鴿. 統(tǒng)計(jì)與信息論壇. 2018(06)
[3]互聯(lián)網(wǎng)環(huán)境下基于消費(fèi)者搜索的酒店入住率預(yù)測研究[J]. 張斌儒,劉樹林,張超鋒,蒲玉蓮. 統(tǒng)計(jì)與信息論壇. 2018(03)
[4]基于機(jī)器學(xué)習(xí)算法的車險(xiǎn)索賠概率與累積賠款預(yù)測[J]. 孟生旺,李天博,高光遠(yuǎn). 保險(xiǎn)研究. 2017(10)
本文編號(hào):3051349
【文章來源】:統(tǒng)計(jì)與信息論壇. 2019,34(05)北大核心CSSCI
【文章頁數(shù)】:10 頁
【文章目錄】:
一、引 言
二、模型介紹
(一) 廣義線性模型 (GLM)
(二) 支持向量機(jī) (SVM)
(三) 隨機(jī)森林 (Random Forest)
features) 。"> 1.最大特征數(shù) (maxfeatures) 。
estimators) 。"> 2.子樹的數(shù)量 (nestimators) 。
samplesleaf) 。"> 3.葉子節(jié)點(diǎn)最少樣本數(shù) (minsamplesleaf) 。
(四) 神經(jīng)網(wǎng)絡(luò) (ANN) 和深度神經(jīng)網(wǎng)絡(luò) (DNN) 模型
(五) 梯度提升算法 (Gradient Boosting)
三、數(shù)據(jù)介紹
(一) 數(shù)據(jù)集AutoClaim
(二) 數(shù)據(jù)集Tangshan
(三) 數(shù)據(jù)預(yù)處理
四、實(shí)證結(jié)果分析
(一) 各種方法的最優(yōu)模型和最優(yōu)參數(shù)
(二) 各種方法的比較分析
五、結(jié) 論
附錄:有序Lorenz曲線和Gini系數(shù)及其計(jì)算方法。
【參考文獻(xiàn)】:
期刊論文
[1]駕駛行為保險(xiǎn)的風(fēng)險(xiǎn)預(yù)測模型研究[J]. 孟生旺,黃一凡. 保險(xiǎn)研究. 2018(08)
[2]污染數(shù)據(jù)的穩(wěn)健稀疏成組變量選擇方法研究[J]. 李揚(yáng),許文甫,馬雙鴿. 統(tǒng)計(jì)與信息論壇. 2018(06)
[3]互聯(lián)網(wǎng)環(huán)境下基于消費(fèi)者搜索的酒店入住率預(yù)測研究[J]. 張斌儒,劉樹林,張超鋒,蒲玉蓮. 統(tǒng)計(jì)與信息論壇. 2018(03)
[4]基于機(jī)器學(xué)習(xí)算法的車險(xiǎn)索賠概率與累積賠款預(yù)測[J]. 孟生旺,李天博,高光遠(yuǎn). 保險(xiǎn)研究. 2017(10)
本文編號(hào):3051349
本文鏈接:http://sikaile.net/jingjilunwen/bxjjlw/3051349.html
最近更新
教材專著