天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于數(shù)據(jù)挖掘的電信客戶流失預(yù)警研究

發(fā)布時(shí)間:2021-02-21 15:09
  計(jì)算機(jī)、通信技術(shù)的飛速發(fā)展,加速了互聯(lián)網(wǎng)和通訊網(wǎng)的融合,由此帶來的是在線社交網(wǎng)絡(luò)日益成為人們溝通交流、交友等的重要平臺(tái),人們對(duì)于通信服務(wù)的需求也迅速攀升,這給電信行業(yè)帶來了一系列的機(jī)遇。同時(shí)又由于市場(chǎng)的飽和、行業(yè)服務(wù)趨于同質(zhì)化等因素的影響加劇了電信企業(yè)之間的競(jìng)爭(zhēng),客戶更是成為了稀缺資源,增加新客戶變得愈加困難,所以如何穩(wěn)定住現(xiàn)有的客戶不流仍然是各大電信企業(yè)關(guān)注的焦點(diǎn)問題。而且增加新的客戶所花費(fèi)的成本高于保留老客戶的成本,老客戶的流失會(huì)給企業(yè)帶來許多損失,所以研究預(yù)測(cè)客戶的流失模型是有必要且有意義的。國內(nèi)外的專家學(xué)者也已經(jīng)對(duì)此進(jìn)行了大量的研究并取得了許多有價(jià)值、可供參考的成果。同時(shí),數(shù)據(jù)挖掘技術(shù)的發(fā)展為企業(yè)探究預(yù)測(cè)客戶流失模型提供了大量的理論方法支持。本文先對(duì)數(shù)據(jù)挖掘這一領(lǐng)域做了概述,了解了相關(guān)的概念、流程和應(yīng)用功能。鑒于電信客戶流失問題本質(zhì)上是一個(gè)二分類問題,所以將應(yīng)用數(shù)據(jù)挖掘中的分類方法來解決,在眾多分類方法中,選擇了運(yùn)用機(jī)器學(xué)習(xí)方法來解決。因此,在第三章對(duì)第四章進(jìn)行實(shí)證分析時(shí)所用到的機(jī)器學(xué)習(xí)理論逐一做了介紹,包括先研究了建模前進(jìn)行數(shù)據(jù)準(zhǔn)備的數(shù)據(jù)預(yù)處理方法,接下來著重探討和總結(jié)歸納了... 

【文章來源】:云南財(cái)經(jīng)大學(xué)云南省

【文章頁數(shù)】:73 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于數(shù)據(jù)挖掘的電信客戶流失預(yù)警研究


CRISP-DM標(biāo)準(zhǔn)流程

ROC曲線,ROC曲線,示例,交叉驗(yàn)證


第3章相關(guān)理論技術(shù)40曲線以真正例率(即召回率)作為圖像的縱坐標(biāo),假正例率作為圖像的橫坐標(biāo),例如圖3.1所示。假正例率是假正例占所有反類樣本的比例,表達(dá)式為:TNFPFPFPR圖3.1示例ROC曲線AUC值即為ROC曲線包含的圖中右下部分的面積的值。建議在不平衡數(shù)據(jù)集上評(píng)估模型時(shí)選擇AUC值作為評(píng)價(jià)指標(biāo)53。在第四章的實(shí)證分析中,我們將選擇AUC來作為模型的評(píng)價(jià)指標(biāo)。3.9.3交叉驗(yàn)證交叉驗(yàn)證是用來評(píng)估泛化性能的統(tǒng)計(jì)學(xué)方法。在將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集時(shí),相比于只進(jìn)行一次劃分的方法,交叉驗(yàn)證更全面、穩(wěn)定。因?yàn)榻徊骝?yàn)證會(huì)對(duì)數(shù)據(jù)進(jìn)行多次劃分,訓(xùn)練多個(gè)模型。在眾多交叉驗(yàn)證方法中k折交叉驗(yàn)證是最常用的。k一般取5或10。k這交叉驗(yàn)證就是將數(shù)據(jù)集劃分為大致相等的k等分,每部分稱為折,每次取其中1部分為測(cè)試集,剩下k-1部分為訓(xùn)練集,訓(xùn)練一個(gè)模型;然后再取不重復(fù)的另一部分為測(cè)試集,剩余部分為訓(xùn)練集,訓(xùn)練一個(gè)模型,如此類推,直至訓(xùn)練了k個(gè)模型。k個(gè)模型有k個(gè)得分,可以取其均值作為訓(xùn)練集上模型得分。交叉驗(yàn)證因?yàn)橐?xùn)練多個(gè)模型因而加大了計(jì)算成本,減慢了運(yùn)算速度。

示意圖,特征變量,變量,缺失


第4章流失預(yù)測(cè)模型的選擇與建立44圖4.1變量Var1~變量Var190數(shù)據(jù)缺失情況示意圖圖4.2變量Var191~變量Var230數(shù)據(jù)缺失情況示意圖4.1.2數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理的目的就是要找出那些對(duì)模型準(zhǔn)確預(yù)測(cè)結(jié)果有重要影響的特征變量。并非每個(gè)特征變量對(duì)模型都有相同的影響,因此需要找出哪些特征變量對(duì)預(yù)測(cè)有更大的影響。對(duì)此,分兩個(gè)步驟進(jìn)行操作:1)刪除特征變量:根據(jù)特征變量包含不同值的數(shù)量刪除特征變量,2)提取特征變量:對(duì)特征變量進(jìn)行重要性的排序,選擇對(duì)預(yù)測(cè)結(jié)果有重要影響的特征變量,因?yàn)橛行┨卣髯兞繉?duì)模型的預(yù)測(cè)效果幾乎無影響,甚至去掉后,模型的性能會(huì)得到提升。關(guān)于缺失值,分類型特征變量實(shí)例數(shù)據(jù)用字符串"missing"填充,數(shù)值性特征變量的實(shí)例數(shù)據(jù)由其平均值填充。

【參考文獻(xiàn)】:
期刊論文
[1]基于Logistic回歸的電信寬帶客戶流失預(yù)警分析[J]. 林濤.  中國新通信. 2019(11)
[2]基于隨機(jī)森林算法的客戶流失模型[J]. 朱琦,朱正鍵,陳倫楷.  電信快報(bào). 2019(04)
[3]決策樹算法在客戶流失建模中的應(yīng)用[J]. 朱正鍵,胡芬芬,梅嘉玲.  移動(dòng)通信. 2018(11)
[4]數(shù)據(jù)挖掘研究綜述[J]. 周九常,劉智明.  河南圖書館學(xué)刊. 2018(08)
[5]基于改進(jìn)的K近鄰和支持向量機(jī)客戶流失預(yù)測(cè)[J]. 盧光躍,王航龍,李創(chuàng)創(chuàng),趙宇翔,李四維.  西安郵電大學(xué)學(xué)報(bào). 2018(02)
[6]A Heterogeneous Ensemble of Extreme Learning Machines with Correntropy and Negative Correlation[J]. Adnan O.M.Abuassba,Yao Zhang,Xiong Luo,Dezheng Zhang,Wulamu Aziguli.  Tsinghua Science and Technology. 2017(06)
[7]基于決策樹的信用卡高端客戶流失預(yù)測(cè)模型研究[J]. 曹淑鵬,閔杰.  北京金融評(píng)論. 2017(03)
[8]基于樸素貝葉斯分類算法的學(xué)員流失預(yù)警應(yīng)用研究[J]. 陳紀(jì)銘.  福建電腦. 2017(08)
[9]電信客戶流失預(yù)測(cè)模型的構(gòu)建及客戶流失因素分析[J]. 李會(huì),吳小蘭,李俠.  內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2017(03)
[10]基于客戶細(xì)分和AdaBoost的電子商務(wù)客戶流失預(yù)測(cè)研究[J]. 武小軍,孟蘇芳.  工業(yè)工程. 2017(02)

碩士論文
[1]基于PCA-NB算法的客戶流失預(yù)測(cè)[D]. 金鑫.蘭州財(cái)經(jīng)大學(xué) 2016
[2]樸素貝葉斯算法及其在電信客戶流失分析中的應(yīng)用研究[D]. 孫源澤.湖南大學(xué) 2008
[3]基于Pareto/NBD+樸素貝葉斯組合模型的電子商務(wù)客戶流失預(yù)測(cè)研究[D]. 劉學(xué)偉.四川大學(xué) 2006



本文編號(hào):3044526

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3044526.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8fb9e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com