采用混合模型的電信領(lǐng)域用戶流失預(yù)測
發(fā)布時(shí)間:2023-01-08 14:15
用戶流失預(yù)測能夠幫助公司減少客戶的流失,對公司的營收和提高競爭力有重要意義。然而,由于電信領(lǐng)域數(shù)據(jù)的稀疏性和不平衡等問題,國內(nèi)外對于電信領(lǐng)域的用戶流失預(yù)測大多處于研究階段,還沒有真正應(yīng)用到實(shí)際生產(chǎn)當(dāng)中。提出了利用神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)與樸素隨機(jī)過采樣、投票相結(jié)合的混合模型來預(yù)測電信領(lǐng)域的流失用戶。數(shù)據(jù)集使用的是KDD Cup 2009年比賽數(shù)據(jù),該數(shù)據(jù)由法國電信運(yùn)行商Orange公司提供。在十折交叉驗(yàn)證下,AdaBoost和Gradient Boosting一次投票分類后AUC值能夠達(dá)到0.677 1,利用其他模型對混合模型預(yù)測出的流失用戶清單進(jìn)行二次投票分類,前200名高危流失用戶的預(yù)測準(zhǔn)確率能夠達(dá)到31.8%。實(shí)驗(yàn)結(jié)果表明,樸素隨機(jī)過采樣和投票相結(jié)合有效提升了模型的準(zhǔn)確性。
【文章頁數(shù)】:9 頁
【文章目錄】:
1 引言
2 相關(guān)工作
3 模型方法
3.1 數(shù)據(jù)預(yù)處理
3.2 樸素隨機(jī)過采樣(RandomOverSampler)
3.3 一次投票分類(投票分類器)
3.4 二次投票分類
4 實(shí)驗(yàn)結(jié)果及分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 評價(jià)標(biāo)準(zhǔn)
4.3 實(shí)驗(yàn)結(jié)果
5 結(jié)論
本文編號:3728624
【文章頁數(shù)】:9 頁
【文章目錄】:
1 引言
2 相關(guān)工作
3 模型方法
3.1 數(shù)據(jù)預(yù)處理
3.2 樸素隨機(jī)過采樣(RandomOverSampler)
3.3 一次投票分類(投票分類器)
3.4 二次投票分類
4 實(shí)驗(yàn)結(jié)果及分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 評價(jià)標(biāo)準(zhǔn)
4.3 實(shí)驗(yàn)結(jié)果
5 結(jié)論
本文編號:3728624
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/3728624.html
最近更新
教材專著