分層次電信客戶流失預(yù)測研究
發(fā)布時間:2022-01-19 11:19
隨著近年來電信行業(yè)市場逐漸飽和,國內(nèi)三大運(yùn)營商之間的競爭日益激烈,導(dǎo)致客戶的流失率居高不下,降低客戶流失率成了運(yùn)營商亟待處理的一大難題。據(jù)研究表明運(yùn)營商開發(fā)一名新用戶的成本是維系一名老用戶的6倍,且高價值的老用戶給公司帶來的收益明顯高于新客戶,因此維系客戶、減少客戶流失越來越受到各大運(yùn)營商的重視。新用戶相對于老用戶更容易流失,兩種類型用戶的流失影響因素也存在差異,本文重點(diǎn)從客戶存留時間切入,分短期和長期兩方面研究用戶流失問題。對于短期內(nèi)流失用戶,重點(diǎn)為準(zhǔn)確預(yù)測有離網(wǎng)傾向的用戶,縮短觀察周期,以便及時采取挽留措施;對于長期在網(wǎng)用戶,關(guān)注其留存時間、流失風(fēng)險概率和主要影響因素,采取持續(xù)性政策維系客戶。本文主要工作包括:(1)分析客戶流失問題現(xiàn)狀和研究方法,探討問題研究的不同角度。(2)在數(shù)據(jù)準(zhǔn)備方面,以某省電信用戶為研究對象,分別獲取短期數(shù)據(jù)和長期數(shù)據(jù),基于日指標(biāo)和月指標(biāo)重點(diǎn)設(shè)計組合特征,并進(jìn)行基本數(shù)據(jù)預(yù)處理;特征選擇方面,針對各自模型特點(diǎn),采用不同的特征篩選方法。(3)對于短期客戶流失問題,選用邏輯回歸、支持向量機(jī)、隨機(jī)森林、lightGBM四種數(shù)據(jù)挖掘方法構(gòu)建短期客戶流失預(yù)警模型,進(jìn)行...
【文章來源】:福建師范大學(xué)福建省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘流程
福建師范大學(xué)碩士學(xué)位論文10數(shù)據(jù)準(zhǔn)備:首先進(jìn)行數(shù)據(jù)采集,提取出目標(biāo)數(shù)據(jù),再做數(shù)據(jù)的預(yù)處理,包括清洗、合并、轉(zhuǎn)化等內(nèi)容,保證數(shù)據(jù)質(zhì)量。模型構(gòu)建:基于處理后數(shù)據(jù),結(jié)合業(yè)務(wù)實(shí)際,分析不同算法的優(yōu)劣勢、選取合適的算法構(gòu)建挖掘模型。方案評估:通過對整體實(shí)施流程的梳理以及模型的效果評估,確定方案對于實(shí)際需求的可行性。方案實(shí)施:確認(rèn)方案以后,將方案投入到實(shí)際應(yīng)用。圖1-1數(shù)據(jù)挖掘流程三、集成學(xué)習(xí)理論集成學(xué)習(xí)是指用一系列“弱學(xué)習(xí)器”,通過某種策略整合成“強(qiáng)學(xué)習(xí)器”。通過對多個學(xué)習(xí)器的整合得到的新模型往往具有更好的性能。首先訓(xùn)練單個基學(xué)習(xí)器,然后基于算法將每個學(xué)習(xí)器的結(jié)果匯總輸出,如圖1-2所示。圖1-2集成學(xué)習(xí)過程
第二章數(shù)據(jù)處理與特征選擇13第二章數(shù)據(jù)處理與特征選擇第一節(jié)數(shù)據(jù)介紹一、數(shù)據(jù)來源本文研究數(shù)據(jù)源自中國移動A省大數(shù)據(jù)中心,共計兩份,分別用于研究短期客戶和長期客戶的流失問題。短期數(shù)據(jù):從圖2-1可以看出,新入網(wǎng)用戶在一個月以后離網(wǎng)比例明顯上升,為縮短觀察期,并充分獲取客戶業(yè)務(wù)行為數(shù)據(jù),選擇入網(wǎng)時長大于一個月且小于兩個月的用戶數(shù)據(jù)作為短期數(shù)據(jù)。研究對象為2018年6月份新入網(wǎng)用戶,刪除前30天離網(wǎng)用戶和一些特殊用戶如養(yǎng)卡用戶、非自然人,主要提取用戶基本屬性以及從入網(wǎng)日起‘當(dāng)天’,‘前3天’、‘前7天’、‘前15天’、‘前30天’的業(yè)務(wù)特征、行為特征等字段,例如用戶6月1號入網(wǎng),‘當(dāng)天’是指6月1號數(shù)據(jù),‘前3天’是指6月1號-3號數(shù)據(jù),如果用戶6月5號入網(wǎng),當(dāng)天是值,6月5號數(shù)據(jù),‘前3天’是指6月5號-7號數(shù)據(jù)。共獲取數(shù)據(jù)500000條,樣本含76個字段。圖2-1六月份入網(wǎng)用戶在網(wǎng)天數(shù)分布長期數(shù)據(jù):考慮到用戶優(yōu)惠政策、合約情況,選擇入網(wǎng)時長大于一年的用戶數(shù)據(jù)作為長期數(shù)據(jù)。研究對象為截止2018年8月31日入網(wǎng)時長一年以上的用戶,以8月31日為統(tǒng)計日,刪除特殊用戶如養(yǎng)卡用戶、非自然人,主要提取用戶基本屬性以及統(tǒng)計日‘當(dāng)月’,‘近3月’的業(yè)務(wù)特征、行為特征等字段,‘當(dāng)月’是指8月份數(shù)據(jù),‘近3月’是指6、7、8月份的數(shù)據(jù),共獲取數(shù)據(jù)500000條,樣本含52個字段。
【參考文獻(xiàn)】:
期刊論文
[1]基于LightGBM算法的P2P項(xiàng)目信用評級模型的設(shè)計及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
[2]基于生存分析模型的電信客戶流失研究[J]. 張珠香,駱念蓓. 福州大學(xué)學(xué)報(哲學(xué)社會科學(xué)版). 2018(01)
[3]基于變精度加權(quán)平均粗糙度決策樹的財務(wù)預(yù)警研究[J]. 鮑新中,傅宏宇. 運(yùn)籌與管理. 2015(03)
[4]基于數(shù)據(jù)挖掘的固網(wǎng)大客戶流失組合預(yù)警[J]. 何躍,何正林,周欣胤. 軟科學(xué). 2012(01)
[5]基于LVQ神經(jīng)網(wǎng)絡(luò)的電信企業(yè)客戶流失預(yù)測模型研究[J]. 代逸生,楊永升. 價值工程. 2011(13)
[6]基于Cox模型的移動通信行業(yè)中低端客戶流失預(yù)測研究[J]. 鄧森文,馬溪駿. 合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版). 2010(11)
[7]中國電信市場的去壟斷改革與技術(shù)進(jìn)步[J]. 高錫榮. 經(jīng)濟(jì)科學(xué). 2008(06)
[8]電信重組后三大運(yùn)營商競爭形勢分析[J]. 杜振華. 移動通信. 2008(19)
[9]基于改進(jìn)支持向量機(jī)的客戶流失分析研究[J]. 趙宇,李兵,李秀,劉文煌,任守榘. 計算機(jī)集成制造系統(tǒng). 2007(01)
[10]生存分析在電信增值服務(wù)行業(yè)客戶流失分析中的應(yīng)用[J]. 劉紹清,黃章樹. 廣州大學(xué)學(xué)報(自然科學(xué)版). 2006(06)
碩士論文
[1]基于數(shù)據(jù)挖掘的模具業(yè)客戶流失分析[D]. ;.廣東工業(yè)大學(xué) 2014
[2]基于生存分析的客戶流失模型研究[D]. 鄭為益.華南理工大學(xué) 2011
[3]電信企業(yè)客戶關(guān)系生存分析模型研究[D]. 張永樂.北京郵電大學(xué) 2009
本文編號:3596759
【文章來源】:福建師范大學(xué)福建省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘流程
福建師范大學(xué)碩士學(xué)位論文10數(shù)據(jù)準(zhǔn)備:首先進(jìn)行數(shù)據(jù)采集,提取出目標(biāo)數(shù)據(jù),再做數(shù)據(jù)的預(yù)處理,包括清洗、合并、轉(zhuǎn)化等內(nèi)容,保證數(shù)據(jù)質(zhì)量。模型構(gòu)建:基于處理后數(shù)據(jù),結(jié)合業(yè)務(wù)實(shí)際,分析不同算法的優(yōu)劣勢、選取合適的算法構(gòu)建挖掘模型。方案評估:通過對整體實(shí)施流程的梳理以及模型的效果評估,確定方案對于實(shí)際需求的可行性。方案實(shí)施:確認(rèn)方案以后,將方案投入到實(shí)際應(yīng)用。圖1-1數(shù)據(jù)挖掘流程三、集成學(xué)習(xí)理論集成學(xué)習(xí)是指用一系列“弱學(xué)習(xí)器”,通過某種策略整合成“強(qiáng)學(xué)習(xí)器”。通過對多個學(xué)習(xí)器的整合得到的新模型往往具有更好的性能。首先訓(xùn)練單個基學(xué)習(xí)器,然后基于算法將每個學(xué)習(xí)器的結(jié)果匯總輸出,如圖1-2所示。圖1-2集成學(xué)習(xí)過程
第二章數(shù)據(jù)處理與特征選擇13第二章數(shù)據(jù)處理與特征選擇第一節(jié)數(shù)據(jù)介紹一、數(shù)據(jù)來源本文研究數(shù)據(jù)源自中國移動A省大數(shù)據(jù)中心,共計兩份,分別用于研究短期客戶和長期客戶的流失問題。短期數(shù)據(jù):從圖2-1可以看出,新入網(wǎng)用戶在一個月以后離網(wǎng)比例明顯上升,為縮短觀察期,并充分獲取客戶業(yè)務(wù)行為數(shù)據(jù),選擇入網(wǎng)時長大于一個月且小于兩個月的用戶數(shù)據(jù)作為短期數(shù)據(jù)。研究對象為2018年6月份新入網(wǎng)用戶,刪除前30天離網(wǎng)用戶和一些特殊用戶如養(yǎng)卡用戶、非自然人,主要提取用戶基本屬性以及從入網(wǎng)日起‘當(dāng)天’,‘前3天’、‘前7天’、‘前15天’、‘前30天’的業(yè)務(wù)特征、行為特征等字段,例如用戶6月1號入網(wǎng),‘當(dāng)天’是指6月1號數(shù)據(jù),‘前3天’是指6月1號-3號數(shù)據(jù),如果用戶6月5號入網(wǎng),當(dāng)天是值,6月5號數(shù)據(jù),‘前3天’是指6月5號-7號數(shù)據(jù)。共獲取數(shù)據(jù)500000條,樣本含76個字段。圖2-1六月份入網(wǎng)用戶在網(wǎng)天數(shù)分布長期數(shù)據(jù):考慮到用戶優(yōu)惠政策、合約情況,選擇入網(wǎng)時長大于一年的用戶數(shù)據(jù)作為長期數(shù)據(jù)。研究對象為截止2018年8月31日入網(wǎng)時長一年以上的用戶,以8月31日為統(tǒng)計日,刪除特殊用戶如養(yǎng)卡用戶、非自然人,主要提取用戶基本屬性以及統(tǒng)計日‘當(dāng)月’,‘近3月’的業(yè)務(wù)特征、行為特征等字段,‘當(dāng)月’是指8月份數(shù)據(jù),‘近3月’是指6、7、8月份的數(shù)據(jù),共獲取數(shù)據(jù)500000條,樣本含52個字段。
【參考文獻(xiàn)】:
期刊論文
[1]基于LightGBM算法的P2P項(xiàng)目信用評級模型的設(shè)計及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
[2]基于生存分析模型的電信客戶流失研究[J]. 張珠香,駱念蓓. 福州大學(xué)學(xué)報(哲學(xué)社會科學(xué)版). 2018(01)
[3]基于變精度加權(quán)平均粗糙度決策樹的財務(wù)預(yù)警研究[J]. 鮑新中,傅宏宇. 運(yùn)籌與管理. 2015(03)
[4]基于數(shù)據(jù)挖掘的固網(wǎng)大客戶流失組合預(yù)警[J]. 何躍,何正林,周欣胤. 軟科學(xué). 2012(01)
[5]基于LVQ神經(jīng)網(wǎng)絡(luò)的電信企業(yè)客戶流失預(yù)測模型研究[J]. 代逸生,楊永升. 價值工程. 2011(13)
[6]基于Cox模型的移動通信行業(yè)中低端客戶流失預(yù)測研究[J]. 鄧森文,馬溪駿. 合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版). 2010(11)
[7]中國電信市場的去壟斷改革與技術(shù)進(jìn)步[J]. 高錫榮. 經(jīng)濟(jì)科學(xué). 2008(06)
[8]電信重組后三大運(yùn)營商競爭形勢分析[J]. 杜振華. 移動通信. 2008(19)
[9]基于改進(jìn)支持向量機(jī)的客戶流失分析研究[J]. 趙宇,李兵,李秀,劉文煌,任守榘. 計算機(jī)集成制造系統(tǒng). 2007(01)
[10]生存分析在電信增值服務(wù)行業(yè)客戶流失分析中的應(yīng)用[J]. 劉紹清,黃章樹. 廣州大學(xué)學(xué)報(自然科學(xué)版). 2006(06)
碩士論文
[1]基于數(shù)據(jù)挖掘的模具業(yè)客戶流失分析[D]. ;.廣東工業(yè)大學(xué) 2014
[2]基于生存分析的客戶流失模型研究[D]. 鄭為益.華南理工大學(xué) 2011
[3]電信企業(yè)客戶關(guān)系生存分析模型研究[D]. 張永樂.北京郵電大學(xué) 2009
本文編號:3596759
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3596759.html
最近更新
教材專著