某上市公司的客戶資源分析與預(yù)測
發(fā)布時(shí)間:2017-08-16 10:20
本文關(guān)鍵詞:某上市公司的客戶資源分析與預(yù)測
更多相關(guān)文章: Logistic模型 客戶流失 RFM模型 客戶維護(hù)
【摘要】:隨著國際化的進(jìn)程,全球品牌的服裝產(chǎn)業(yè)競爭日益激烈,交易的主動(dòng)權(quán)逐漸由企業(yè)向客戶轉(zhuǎn)移,只有以客戶為中心的企業(yè)才能在競爭中獲取優(yōu)勢?蛻絷P(guān)系管理理論讓我們知道企業(yè)80%的利潤由20%的客戶產(chǎn)生,且開發(fā)一個(gè)新客戶成本要比維持一個(gè)老客戶的成本要高5倍,所以在營銷資源有限的情況下,必須對客戶進(jìn)行細(xì)分,以保證將有限的營銷資源分配給最有價(jià)值的客戶,以達(dá)到客戶保持,增加營收的目的。而本文的研究重點(diǎn)就是從暫時(shí)性流失的老客戶中找出最可能回歸的客戶,并將他們交給公司進(jìn)行精準(zhǔn)營銷,提高客戶保留率,進(jìn)而擴(kuò)大營收。本文研究的數(shù)據(jù)集如下:A公司數(shù)據(jù)庫中有所有客戶的歷史購買數(shù)據(jù)、郵件營銷數(shù)據(jù)以及網(wǎng)頁點(diǎn)擊數(shù)據(jù)。將截止2015年1月1日與2014年1月1日的暫時(shí)性流失客戶數(shù)據(jù)集分別記為樣本內(nèi)數(shù)據(jù)集與樣本外數(shù)據(jù)集,用bootstrap方法分別抽取200000條數(shù)據(jù),按樣本內(nèi)抽取數(shù)據(jù)照7/3的比例分為建模數(shù)據(jù)集與樣本內(nèi)驗(yàn)證數(shù)據(jù)集,響應(yīng)率分別為1.6%與1.7%,樣本外數(shù)據(jù)集抽取的記為樣本外驗(yàn)證集。本文先通過RFM模型的理念,對歷史數(shù)據(jù)進(jìn)行重新架構(gòu),得到2800多個(gè)變量。通過變量意義檢測,異常值處理,缺失值處理以及轉(zhuǎn)化與比較,得到清洗好的數(shù)據(jù)集。并通過顯著性檢驗(yàn)、相關(guān)性檢驗(yàn)、主成分分析、方差膨脹因子等統(tǒng)計(jì)方法并結(jié)合變量實(shí)際意義進(jìn)行變量篩選,最終為挑選出最優(yōu)的7個(gè)變量進(jìn)入模型。模型在建模數(shù)據(jù)集內(nèi)的預(yù)測正確率高達(dá)73%,符合預(yù)期,并對7個(gè)變量以及模型結(jié)果分別進(jìn)行十分位數(shù)檢驗(yàn)與Lift Chart檢驗(yàn),發(fā)現(xiàn)變量的可解釋性都很高,模型對客戶的分類排序的效果很好。再將模型代到樣本內(nèi)驗(yàn)證集與樣本外驗(yàn)證集中檢驗(yàn)?zāi)P偷姆(wěn)健性,發(fā)現(xiàn)模型在三個(gè)數(shù)據(jù)集上的預(yù)測效果很相近,說明模型的穩(wěn)健性很好。三組數(shù)據(jù)集中的結(jié)果都表示:最可能回歸的客戶是第一類,再回歸可能較大的是第二類到第四類,第五類到第十類回歸可能最差。說明該模型不但準(zhǔn)確而且穩(wěn)定性很好,有顯著的商業(yè)意義,可幫助企業(yè)精確識(shí)別客戶,獲取更多利益。
【關(guān)鍵詞】:Logistic模型 客戶流失 RFM模型 客戶維護(hù)
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F274
【目錄】:
- 摘要5-6
- Abstract6-9
- 第一章 緒論9-14
- 1.1 研究背景與狀況9-12
- 1.1.1 RMF模型9-10
- 1.1.2 客戶流失與挽回10-12
- 1.2 本文研究的問題12
- 1.3 研究意義與方法12-13
- 1.4 本文組織結(jié)構(gòu)13-14
- 第二章 數(shù)據(jù)預(yù)處理14-23
- 2.1 創(chuàng)造變量14-15
- 2.2 數(shù)據(jù)集與抽樣15
- 2.3 數(shù)據(jù)的重抽樣15-17
- 2.3.1 數(shù)據(jù)的處理與轉(zhuǎn)化15-17
- 2.4 篩選變量使用的統(tǒng)計(jì)方法簡介17-21
- 2.4.1 P值17
- 2.4.2 模型卡方統(tǒng)計(jì)17
- 2.4.3 相關(guān)性分析17-18
- 2.4.4 主成分分析18-19
- 2.4.5 聚類分析19
- 2.4.6 逐步回歸19-20
- 2.4.7 熵值20
- 2.4.8 AIC和SC20
- 2.4.9 方差膨脹因子20-21
- 2.5 篩選自變量原則21
- 2.6 變量趨勢圖21-23
- 第三章 客戶再回歸模型分析23-35
- 3.1 Logistic模型理論分析23-24
- 3.1.1 Logistic模型的發(fā)展與優(yōu)勢23-24
- 3.2 基于Logistic回歸的客戶再回歸模型24-26
- 3.2.1 Logistic模型公式推導(dǎo)24-26
- 3.2.2 Logistic模型的參數(shù)估計(jì)26
- 3.2.3 Logistic模型應(yīng)用需注意的問題26
- 3.3 模型結(jié)果26-28
- 3.4 模型驗(yàn)證28-35
- 第四章 結(jié)論與展望35-37
- 4.1 總結(jié)與建議35
- 4.2 不足與展望35-37
- 參考文獻(xiàn)37-39
- 致謝39-40
- 附錄40-41
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 肖水清;;基于CRM探討電信業(yè)的客戶流失問題[J];現(xiàn)代計(jì)算機(jī);2006年01期
,本文編號:682737
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/682737.html
最近更新
教材專著