天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

數(shù)據(jù)挖掘在電信客戶分析中的應(yīng)用研究

發(fā)布時間:2018-05-24 05:01

  本文選題:客戶流失預(yù)測 + 不平衡數(shù)據(jù) ; 參考:《西安理工大學(xué)》2016年碩士論文


【摘要】:隨著2013年底4G牌照的發(fā)放,三大電信運(yùn)營商開啟了更為激烈的用戶市場競爭,紛紛使用不同的營銷手段來吸引新客戶,這也必然導(dǎo)致了客戶狀態(tài)的不穩(wěn)定以及大量客戶的流失。而客戶流失又會造成運(yùn)營商的市場占有率下降,直接給電信企業(yè)造成經(jīng)濟(jì)損失,因此對電信客戶進(jìn)行流失預(yù)測具有重要的實(shí)際意義。某地聯(lián)通公司數(shù)據(jù)庫中已存儲大量客戶數(shù)據(jù),現(xiàn)需要利用這些數(shù)據(jù)進(jìn)行客戶的流失預(yù)測分析。本課題結(jié)合實(shí)際情況,主要工作如下:1.從電信客戶流失原因、流失預(yù)測屬性的選取以及預(yù)測算法模型的選取三方面詳細(xì)分析了國內(nèi)外學(xué)者的研究成果。2.通過對真實(shí)數(shù)據(jù)的分析研究,發(fā)現(xiàn)流失客戶數(shù)量僅占總客戶數(shù)量的7%左右,數(shù)據(jù)分布存在嚴(yán)重的不平衡性,這對于后期的建模預(yù)測有很大影響。為了解決此問題,采用欠抽樣的方法對原始數(shù)據(jù)進(jìn)行了處理。首先對訓(xùn)練數(shù)據(jù)集進(jìn)行不同比例的欠抽樣處理,然后分別采用C5.0決策樹、神經(jīng)網(wǎng)絡(luò)和Logistic回歸算法進(jìn)行建模分析。3.由于單一的分類算法都有其自身的優(yōu)點(diǎn)和缺陷,能夠利用的數(shù)據(jù)信息非常有限。針對這一問題,采用不同分類器組合的預(yù)測方法進(jìn)行客戶流失預(yù)測研究。選擇C5.0決策樹、神經(jīng)網(wǎng)絡(luò)和Logistic回歸算法作為子分類器。在計算各個子分類器的權(quán)重系數(shù)時,以組合預(yù)測誤差平方和最小為準(zhǔn)則,構(gòu)建Lagrange方程。4.使用組合預(yù)測的方法對某聯(lián)通公司的客戶數(shù)據(jù)進(jìn)行了流失預(yù)測建模,找出了潛在的流失客戶,為企業(yè)進(jìn)行客戶挽留決策提供了依據(jù)。綜上所述,本文首先通過對數(shù)據(jù)進(jìn)行欠抽樣處理之后,發(fā)現(xiàn)模型的分類預(yù)測效果確實(shí)有所提高,并且不同分類算法對抽樣比例的要求是不同的。采用組合預(yù)測方法對客戶數(shù)據(jù)進(jìn)行流失預(yù)測建模,結(jié)果表明其預(yù)測效果比較好,因此在實(shí)際應(yīng)用中是有意義的。
[Abstract]:With the issuance of 4G licences at the end of 2013, the three telecom operators have opened up more intense competition in the user market, using different marketing methods to attract new customers, which will inevitably lead to unstable customer status and the loss of a large number of customers. The loss of customers will lead to the decline of market share of operators and directly to the economic losses of telecom enterprises, so it is of great practical significance to forecast the loss of telecom customers. A large number of customer data have been stored in the database of a local Unicom, which need to be used for customer churn prediction and analysis. This subject combines the actual situation, the main work is as follows: 1. This paper analyzes the research results of domestic and foreign scholars in detail from three aspects: the reasons of telecom customer churn, the selection of loss prediction attributes and the selection of prediction algorithm model. Through the analysis of the real data, it is found that the number of lost customers is only about 7% of the total number of customers, and the distribution of the data is seriously unbalanced, which has a great impact on the modeling and prediction of the later period. In order to solve this problem, the method of under-sampling is used to deal with the original data. Firstly, the training data sets are processed with different proportions of under-sampling, and then C5.0 decision tree, neural network and Logistic regression algorithm are used to model and analyze. Because the single classification algorithm has its own advantages and disadvantages, the data information that can be used is very limited. In order to solve this problem, different classifier combinations are used to predict customer churn. C5.0 decision tree, neural network and Logistic regression algorithm are selected as subclassifiers. When calculating the weight coefficients of each subclassifier, the Lagrange equation. 4. 4 is constructed based on the least square sum of combined prediction errors. By using the method of combination prediction, the loss prediction model of customer data of a certain Unicom company is established, and the potential lost customers are found out, which provides a basis for enterprises to make customer retention decisions. To sum up, after processing the data under sampling, we find that the classification and prediction effect of the model has been improved, and different classification algorithms have different requirements for sampling ratio. The combined forecasting method is used to predict the loss of customer data. The results show that the forecasting effect is good, so it is meaningful in practical application.
【學(xué)位授予單位】:西安理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F626;TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 宋凱;王開祥;;關(guān)聯(lián)規(guī)則在電信業(yè)務(wù)交叉銷售中的應(yīng)用[J];沈陽理工大學(xué)學(xué)報;2015年04期

2 楊婷;滕少華;;改進(jìn)的貝葉斯分類方法在電信客戶流失中的研究與應(yīng)用[J];廣東工業(yè)大學(xué)學(xué)報;2015年03期

3 付杰;方芳;嚴(yán)克文;;基于Logistic回歸的通信業(yè)客戶流失預(yù)測與挽留研究[J];鄂州大學(xué)學(xué)報;2015年06期

4 湯加挺;顏小靈;;淺談數(shù)據(jù)挖掘技術(shù)在各行業(yè)中的應(yīng)用[J];電子制作;2015年10期

5 陳曄;覃曉群;;基于組合預(yù)測的電信客戶流失預(yù)測[J];計算機(jī)與數(shù)字工程;2015年04期

6 韓芳;孫立民;;不平衡樣本集分類算法研究[J];計算機(jī)應(yīng)用研究;2015年08期

7 張宇;張之明;;一種基于C5.0決策樹的客戶流失預(yù)測模型研究[J];統(tǒng)計與信息論壇;2015年01期

8 邱一卉;;基于剪枝隨機(jī)森林的電信行業(yè)客戶流失預(yù)測[J];廈門大學(xué)學(xué)報(自然科學(xué)版);2014年06期

9 張瑋;楊善林;劉婷婷;;基于CART和自適應(yīng)Boosting算法的移動通信企業(yè)客戶流失預(yù)測模型[J];中國管理科學(xué);2014年10期

10 職為梅;郭華平;張銀峰;范明;;一種面向非平衡數(shù)據(jù)集分類問題的組合選擇方法[J];小型微型計算機(jī)系統(tǒng);2014年04期

相關(guān)博士學(xué)位論文 前1條

1 遲準(zhǔn);電信運(yùn)營企業(yè)客戶流失預(yù)測與評價研究[D];哈爾濱工程大學(xué);2013年

相關(guān)碩士學(xué)位論文 前7條

1 楊婷;模糊貝葉斯網(wǎng)絡(luò)在電信客戶流失分析中的研究與應(yīng)用[D];廣東工業(yè)大學(xué);2014年

2 伏奕帆;基于SVM的電信客戶欺詐檢測技術(shù)應(yīng)用研究[D];湖南大學(xué);2011年

3 黃展輝;基于數(shù)據(jù)挖掘的電信客戶流失分析[D];廣東工業(yè)大學(xué);2011年

4 石瀚凌;基于集成代價敏感分類方法的客戶流失預(yù)測研究[D];重慶大學(xué);2011年

5 陳曄;基于組合預(yù)測的電信客戶流失預(yù)測分析[D];湖南大學(xué);2011年

6 張瑜;支持向量機(jī)在電信客戶欺詐檢測的應(yīng)用研究[D];長沙理工大學(xué);2010年

7 羅巧玲;面向客戶流失預(yù)測的關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用研究[D];河北工業(yè)大學(xué);2007年

,

本文編號:1927774

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1927774.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶612a9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com