基于數(shù)據(jù)挖掘的運(yùn)營商用戶流失預(yù)測(cè)研究與應(yīng)用
發(fā)布時(shí)間:2021-01-31 10:49
用戶是電信運(yùn)營商利益的核心。面對(duì)激烈的業(yè)內(nèi)競(jìng)爭(zhēng)、日益飽和的電信市場(chǎng)和互聯(lián)網(wǎng)大潮的不斷沖擊,提前預(yù)測(cè)用戶流失傾向,有針對(duì)性地挽留用戶,對(duì)提高運(yùn)營商收益十分重要。數(shù)據(jù)挖掘是從數(shù)據(jù)中獲取有價(jià)值信息的重要手段,用數(shù)據(jù)挖掘技術(shù)對(duì)運(yùn)營商存儲(chǔ)的海量數(shù)據(jù)進(jìn)行用戶流失預(yù)測(cè)建模,可以準(zhǔn)確地預(yù)測(cè)用戶流失傾向。本文基于數(shù)據(jù)挖掘技術(shù)對(duì)運(yùn)營商計(jì)費(fèi)系統(tǒng)中數(shù)據(jù)進(jìn)行分析,構(gòu)建運(yùn)營商用戶流失預(yù)測(cè)系統(tǒng),預(yù)測(cè)用戶是否流失及流失的概率,使運(yùn)營商制定用戶挽留策略更有針對(duì)性。論文主要工作包括:1.基于數(shù)據(jù)挖掘過程,對(duì)運(yùn)營商計(jì)費(fèi)系統(tǒng)中數(shù)據(jù)進(jìn)行預(yù)處理、特征構(gòu)建和選擇,以梯度提升算法LightGBM做為分類器,提出了運(yùn)營商用戶流失預(yù)測(cè)模型,并對(duì)基于LightGBM的用戶流失預(yù)測(cè)模型進(jìn)行了性能測(cè)試。結(jié)果表明,本文提出模型的正確率、召回率、調(diào)和均值(F1)和曲線下面積(AUC)均優(yōu)于常用的邏輯回歸、支持向量機(jī)、決策樹和隨機(jī)森林模型。在此基礎(chǔ)上,本文搭建了便于實(shí)際部署和應(yīng)用的用戶流失預(yù)測(cè)系統(tǒng),采用運(yùn)營商計(jì)費(fèi)系統(tǒng)中提取的用戶真實(shí)數(shù)據(jù)進(jìn)行了系統(tǒng)測(cè)試。2.本文從數(shù)據(jù)處理方面對(duì)運(yùn)營商用戶流失預(yù)測(cè)數(shù)據(jù)不均衡問題進(jìn)行了研究,提出了基于生成對(duì)抗網(wǎng)絡(luò)的過采樣...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:104 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?CRISP-DM數(shù)據(jù)挖掘過程??
的基分類器應(yīng)該同時(shí)具備精準(zhǔn)性和多樣性的特點(diǎn)。一般集成分類器具有比單個(gè)分??類器更強(qiáng)的泛化能力。從基分類器生成策略考慮,集成學(xué)習(xí)方法主要可以分為??Bagging策略、Boosting策略和Stacking策略三種,具體結(jié)構(gòu)分別如圖2-2、圖2-3??和圖2-4所示。??(1)?Bagging?策略??Bagging策略是一種并行化訓(xùn)練基分類器的方法,通過可重復(fù)采樣的方式,生??成多個(gè)具有一定差異的樣本子集,然后用這些不同的樣本子集分別訓(xùn)練多個(gè)基分??類器,再對(duì)這些分類器進(jìn)行集成得到具有一定多樣性的集成分類器。Bagging策略??結(jié)構(gòu)如圖2-2所示,該策略簡(jiǎn)單有效,其中隨機(jī)森林就是它的典型代表。由于??Bagging策略采取并行化結(jié)合方式,當(dāng)基分類器相互獨(dú)立時(shí),可以顯著降低集成后??分類器的方差。?? ̄H?基分類器1?? ̄ ̄八枉女—I? ̄ ̄入擇士?|訓(xùn)練?????—基分類器2集成分類器??機(jī)?S??采????策??樣.?.略??m個(gè)樣本?訓(xùn)練??H?基分類器7??圖2-2?Bagging策略結(jié)構(gòu)圖??Figure?2-2?the?Structure?of?Bagging?Strategy??(2)?Boosting?策略??與Bagging并行化策略不同,Boosting策略采用串行的方式訓(xùn)練基分類器,下??14??
?一個(gè)分類器的訓(xùn)練基于前一個(gè)分類器訓(xùn)練結(jié)果,分類器之間具有很強(qiáng)的相關(guān)性,??因此,Boosting策略降低的是集成分類器的偏差。Boosting策略結(jié)構(gòu)如圖2-3所示,??每一輪基分類器訓(xùn)練時(shí)根據(jù)上一輪分類器的誤差調(diào)整訓(xùn)練樣本的權(quán)重,提高誤差??率高的樣本的權(quán)重,使得誤差率高的樣本獲得更多的重視。AdaBoost、GBDT等??算法都屬于Boosting策略算法。??基分類丨h??根據(jù)基分類器1誤差更新樣本權(quán)重D(2>???——1?訓(xùn)練?, ̄ ̄??—??f權(quán)重D(2_)?J——?——?基分類器2??集成分類器??根據(jù)基分^器2誤差更新樣本權(quán)^D(3)?2?????口??????.略
【參考文獻(xiàn)】:
期刊論文
[1]論電子商務(wù)通信運(yùn)營商存量客戶的維系[J]. 李尚琛. 中國市場(chǎng). 2018(04)
[2]中國電信產(chǎn)業(yè)的外部分析[J]. 于可慧. 中國管理信息化. 2014(02)
博士論文
[1]集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D]. 王清.復(fù)旦大學(xué) 2011
碩士論文
[1]基于生成對(duì)抗網(wǎng)絡(luò)的圖像類別不平衡問題數(shù)據(jù)擴(kuò)充方法[D]. 俞彬.華南理工大學(xué) 2018
[2]電信客戶細(xì)分研究[D]. 何靈.西南交通大學(xué) 2016
[3]數(shù)據(jù)挖掘在電信運(yùn)營商客戶關(guān)系管理中的應(yīng)用[D]. 張雋.上海交通大學(xué) 2015
[4]基于數(shù)據(jù)挖掘的電信反欺詐管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 郭紅宇.電子科技大學(xué) 2012
[5]基于數(shù)據(jù)挖掘的個(gè)性化營銷算法的設(shè)計(jì)與實(shí)現(xiàn)[D]. 吳曉黎.北京郵電大學(xué) 2010
本文編號(hào):3010720
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:104 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?CRISP-DM數(shù)據(jù)挖掘過程??
的基分類器應(yīng)該同時(shí)具備精準(zhǔn)性和多樣性的特點(diǎn)。一般集成分類器具有比單個(gè)分??類器更強(qiáng)的泛化能力。從基分類器生成策略考慮,集成學(xué)習(xí)方法主要可以分為??Bagging策略、Boosting策略和Stacking策略三種,具體結(jié)構(gòu)分別如圖2-2、圖2-3??和圖2-4所示。??(1)?Bagging?策略??Bagging策略是一種并行化訓(xùn)練基分類器的方法,通過可重復(fù)采樣的方式,生??成多個(gè)具有一定差異的樣本子集,然后用這些不同的樣本子集分別訓(xùn)練多個(gè)基分??類器,再對(duì)這些分類器進(jìn)行集成得到具有一定多樣性的集成分類器。Bagging策略??結(jié)構(gòu)如圖2-2所示,該策略簡(jiǎn)單有效,其中隨機(jī)森林就是它的典型代表。由于??Bagging策略采取并行化結(jié)合方式,當(dāng)基分類器相互獨(dú)立時(shí),可以顯著降低集成后??分類器的方差。?? ̄H?基分類器1?? ̄ ̄八枉女—I? ̄ ̄入擇士?|訓(xùn)練?????—基分類器2集成分類器??機(jī)?S??采????策??樣.?.略??m個(gè)樣本?訓(xùn)練??H?基分類器7??圖2-2?Bagging策略結(jié)構(gòu)圖??Figure?2-2?the?Structure?of?Bagging?Strategy??(2)?Boosting?策略??與Bagging并行化策略不同,Boosting策略采用串行的方式訓(xùn)練基分類器,下??14??
?一個(gè)分類器的訓(xùn)練基于前一個(gè)分類器訓(xùn)練結(jié)果,分類器之間具有很強(qiáng)的相關(guān)性,??因此,Boosting策略降低的是集成分類器的偏差。Boosting策略結(jié)構(gòu)如圖2-3所示,??每一輪基分類器訓(xùn)練時(shí)根據(jù)上一輪分類器的誤差調(diào)整訓(xùn)練樣本的權(quán)重,提高誤差??率高的樣本的權(quán)重,使得誤差率高的樣本獲得更多的重視。AdaBoost、GBDT等??算法都屬于Boosting策略算法。??基分類丨h??根據(jù)基分類器1誤差更新樣本權(quán)重D(2>???——1?訓(xùn)練?, ̄ ̄??—??f權(quán)重D(2_)?J——?——?基分類器2??集成分類器??根據(jù)基分^器2誤差更新樣本權(quán)^D(3)?2?????口??????.略
【參考文獻(xiàn)】:
期刊論文
[1]論電子商務(wù)通信運(yùn)營商存量客戶的維系[J]. 李尚琛. 中國市場(chǎng). 2018(04)
[2]中國電信產(chǎn)業(yè)的外部分析[J]. 于可慧. 中國管理信息化. 2014(02)
博士論文
[1]集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D]. 王清.復(fù)旦大學(xué) 2011
碩士論文
[1]基于生成對(duì)抗網(wǎng)絡(luò)的圖像類別不平衡問題數(shù)據(jù)擴(kuò)充方法[D]. 俞彬.華南理工大學(xué) 2018
[2]電信客戶細(xì)分研究[D]. 何靈.西南交通大學(xué) 2016
[3]數(shù)據(jù)挖掘在電信運(yùn)營商客戶關(guān)系管理中的應(yīng)用[D]. 張雋.上海交通大學(xué) 2015
[4]基于數(shù)據(jù)挖掘的電信反欺詐管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 郭紅宇.電子科技大學(xué) 2012
[5]基于數(shù)據(jù)挖掘的個(gè)性化營銷算法的設(shè)計(jì)與實(shí)現(xiàn)[D]. 吳曉黎.北京郵電大學(xué) 2010
本文編號(hào):3010720
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3010720.html
最近更新
教材專著