基于商務(wù)智能的客戶流失預(yù)測模型與算法研究
發(fā)布時(shí)間:2020-04-18 17:28
【摘要】: 客戶流失管理是許多行業(yè)關(guān)注的一個重要問題,近年來,,以傳統(tǒng)統(tǒng)計(jì)學(xué)方法和人工智能方法為基礎(chǔ),客戶流失預(yù)測研究取得了豐富的研究成果,但尚存許多值得研究的問題。商務(wù)智能的崛起為客戶流失預(yù)測的研究提供了新的思路。 本文在商務(wù)智能理論和客戶關(guān)系理論框架下,對現(xiàn)有客戶流失預(yù)測模型結(jié)構(gòu)進(jìn)行修訂,提出了新的預(yù)測模型結(jié)構(gòu)。然后,以新的預(yù)測模型結(jié)構(gòu)為基礎(chǔ)建立了客戶流失策略管理模型、客戶流失特征提取與屬性選擇方法、客戶流失預(yù)測模型,對電信業(yè)的客戶流失預(yù)測問題進(jìn)行了實(shí)證考察,從一個新的角度加深了對客戶流失的規(guī)律理解。最后,對控制客戶流失的策略進(jìn)行了研究。現(xiàn)總結(jié)如下 一、提出一種新的客戶流失預(yù)測模型結(jié)構(gòu),以一種嶄新的思路研究客戶流失問題。根據(jù)客戶數(shù)據(jù)的特點(diǎn)和現(xiàn)用預(yù)測方式的不足,采用特征提取、屬性選擇、預(yù)測模型設(shè)計(jì)的預(yù)測新思路來研究客戶流失問題。通過對新模型結(jié)構(gòu)實(shí)現(xiàn)算法和實(shí)證的研究,證明了新模型結(jié)構(gòu)比現(xiàn)用模型結(jié)構(gòu)更加有效。 二、應(yīng)用基于企業(yè)競爭的Delta策略模型,提出一種用于電信業(yè)的客戶流失管理策略模型(CMSM)。通過使用某電信企業(yè)客戶流失數(shù)據(jù)集,對CMSM進(jìn)行了驗(yàn)證。其結(jié)果表明,該模型描述了客戶流失的原因且包含了與企業(yè)競爭策略相關(guān)的主要預(yù)測因子,從而使其實(shí)際應(yīng)用更易控制。 三、利用特征提取和指標(biāo)屬性選擇方法,對電信業(yè)客戶流失預(yù)測進(jìn)行實(shí)證分析。主要結(jié)論是 1、將核主成分分析(KPCA)引入到客戶流失預(yù)測中,提出了相應(yīng)的特征提取算法,將KPCA與Logistic回歸結(jié)合,設(shè)計(jì)了預(yù)測模型。對某電信公司客戶流失預(yù)測的實(shí)證結(jié)果表明,該方法獲得的命中率、覆蓋率、準(zhǔn)確率、提升系數(shù)、命中率置信度區(qū)間、覆蓋率置信度區(qū)間、整體準(zhǔn)確率置信度區(qū)間和Kappa,高于原始屬性集和主成分分析(PCA)特征提取法。這表明KPCA能提取客戶數(shù)據(jù)的非線性特征,是研究客戶流失預(yù)測問題的有效方法。 2、將信息增益(IG)引入到客戶流失預(yù)測中,提出了相應(yīng)的屬性選擇算法,將IG與神經(jīng)網(wǎng)絡(luò)(NN)結(jié)合,設(shè)計(jì)信息增益神經(jīng)網(wǎng)絡(luò)(IGNN)預(yù)測模型。對某電信公司客戶流失預(yù)測的實(shí)證結(jié)果表明,該方法獲得的命中率、覆蓋率、準(zhǔn)確率、提升系數(shù)、命中率置信度區(qū)間、覆蓋率置信度區(qū)間、整體準(zhǔn)確率置信度區(qū)間和Kappa,高于屬性相關(guān)性選擇法、一致性選擇法、實(shí)例選擇法和對稱不確定性選擇法,這表明IGNN具有比NN更好的預(yù)測能力和泛化能力,從而證實(shí)了該方法的有效性、可行性和可靠性。 3、客戶流失預(yù)測中的屬性選擇是一個滿意優(yōu)化問題。針對已有屬性選擇方法較少考慮屬性獲取代價(jià)和屬性集維數(shù)的自動確定問題,提出一種滿意屬性選擇方法(SASM),將樣本分類性能、屬性集維數(shù)和屬性提取復(fù)雜性等多種因素綜合考慮。給出屬性滿意度和屬性集滿意度定義,設(shè)計(jì)出滿意度函數(shù),導(dǎo)出滿意屬性集評價(jià)準(zhǔn)則,詳細(xì)描述了屬性選擇算法。對某電信公司客戶流失預(yù)測的實(shí)證結(jié)果顯示,SASM獲得的命中率、覆蓋率、準(zhǔn)確率、提升系數(shù)、命中率置信度區(qū)間、覆蓋率置信度區(qū)間、整體準(zhǔn)確率置信度區(qū)間和Kappa,高于屬性相關(guān)性選擇法、一致性選擇法、實(shí)例選擇法和對稱不確定性選擇法。證實(shí)了SASM的有效性、可靠性和實(shí)用性。 4、隨著時(shí)間跨度增加,利用特征提取和屬性選擇方法所建立的預(yù)測模型,需重新訓(xùn)練,才可能得到滿意的結(jié)果。 四、利用基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的SVM方法,對電信業(yè)客戶流失預(yù)測進(jìn)行實(shí)證分析。主要結(jié)論是 1、應(yīng)用標(biāo)準(zhǔn)SVM,研究了電信業(yè)客戶流失預(yù)測問題,并以某電信公司客戶流失預(yù)測為實(shí)例,與人工神經(jīng)網(wǎng)絡(luò)、決策樹、貝葉斯分類器等方法進(jìn)行了對比,發(fā)現(xiàn),除模型整體準(zhǔn)確率、整體準(zhǔn)確率置信度區(qū)間略低于決策樹C4.5外,該方法能獲得最好的命中率、覆蓋率、提升系數(shù)、命中率置信度區(qū)間、覆蓋率置信度區(qū)間、Kappa,是研究客戶流失預(yù)測問題的有效方法。 2、針對目前客戶流失預(yù)測方法的不足,在利用訓(xùn)練樣本中不同類個數(shù)比值來確定各類懲罰參數(shù)的基礎(chǔ)上,改進(jìn)標(biāo)準(zhǔn)的C支持向量分類機(jī)(SVC)。通過以某電信公司客戶流失預(yù)測為實(shí)例,與標(biāo)準(zhǔn)C-SVC、人工神經(jīng)網(wǎng)絡(luò)、決策樹、貝葉斯分類器等方法進(jìn)行了對比,發(fā)現(xiàn),除模型整體準(zhǔn)確率、整體準(zhǔn)確率置信度區(qū)間略低于ANN,Logistic回歸和貝葉斯分類器外,該方法能獲得較好的正確率、命中率、覆蓋率、提升系數(shù)、命中率置信度區(qū)間、覆蓋率置信度區(qū)間、Kappa,是研究客戶流失預(yù)測問題的有效方法; 3、利用簡易SVM方法所建的客戶流失預(yù)測模型,在模型評價(jià)結(jié)果相當(dāng)?shù)臈l件下,其運(yùn)算花費(fèi)的時(shí)間較小: 4、通過對“拒真納偽”兩類錯誤在客戶流失預(yù)測中不同影響分析比較,采用SVM作為預(yù)測模型,并利用某電信公司實(shí)際數(shù)據(jù)對兩類錯誤的平衡控制進(jìn)行了研究。實(shí)驗(yàn)結(jié)果表明,選取一個適當(dāng)?shù)膿p失比例系數(shù),預(yù)測模型能在控制兩類錯誤的前提下,有效地減少期望損失函數(shù)值,這在實(shí)際應(yīng)用中具有反映問題本質(zhì)的現(xiàn)實(shí)意義。 5、隨時(shí)間跨度的增加,預(yù)測模型應(yīng)該重新訓(xùn)練才能得到滿意的效果。 五、結(jié)合客戶關(guān)系管理理論,從客戶價(jià)值和客戶滿意的角度提出了客戶流失分類表;然后通過對客戶流失進(jìn)行受力分析,發(fā)現(xiàn)導(dǎo)致客戶流失的為推力和引力;最后通過引入拉力策略和阻力策略來控制客戶流失。
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2007
【分類號】:F274;F224
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2007
【分類號】:F274;F224
【引證文獻(xiàn)】
相關(guān)期刊論文 前2條
1 楊智;夏國恩;金煒東;;基于不平衡數(shù)據(jù)集的客戶流失預(yù)測研究[J];計(jì)算機(jī)應(yīng)用研究;2010年12期
2 劉飛;;我國通信企業(yè)客戶流失預(yù)測研究綜述[J];企業(yè)科技與發(fā)展;2011年07期
相關(guān)博士學(xué)位論文 前3條
1 史e
本文編號:2632341
本文鏈接:http://sikaile.net/jingjifazhanlunwen/2632341.html
最近更新
教材專著