基于數(shù)據(jù)挖掘的電信LTE用戶上網(wǎng)數(shù)據(jù)的用戶流失算法研究
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的電信LTE用戶上網(wǎng)數(shù)據(jù)的用戶流失算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:2008年中國(guó)電信業(yè)重組后,經(jīng)歷了3G時(shí)代以及4G時(shí)代的發(fā)展,電信市場(chǎng)的競(jìng)爭(zhēng)也越來(lái)越激烈。用戶已經(jīng)是每個(gè)運(yùn)營(yíng)商爭(zhēng)相搶奪的資源,但是由于電信市場(chǎng)日趨飽和,運(yùn)營(yíng)商逐漸意識(shí)到挽留在網(wǎng)用戶比發(fā)展新用戶要節(jié)約大量成本。因此,如何減少用戶流失已經(jīng)成為重要工作之一。目前,數(shù)據(jù)挖掘逐漸成為了被廣泛認(rèn)可的發(fā)現(xiàn)電信用戶流失的工具。它是從電信的大量而復(fù)雜的歷史數(shù)據(jù)中,利用數(shù)據(jù)挖掘算法,發(fā)現(xiàn)用戶流失的規(guī)律,進(jìn)而對(duì)將要流失的用戶進(jìn)行挽留,以達(dá)到防止用戶流失目的。然而,目前用戶流失主要關(guān)注于業(yè)務(wù)、費(fèi)用、投訴、網(wǎng)絡(luò)故障等方面。因此本文提出以最能貼近用戶行為的用戶LTE上網(wǎng)數(shù)據(jù)為研究?jī)?nèi)容,本文所用到的數(shù)據(jù)以日為單位,不同于以往的以月為單位的行為數(shù)據(jù),更能反映出用戶的行為變化規(guī)律。本文以用戶LTE上網(wǎng)變化數(shù)據(jù)為需要分析的數(shù)據(jù),并通過(guò)運(yùn)用K-Means算法、FCM算法以及樸素貝葉斯算法、BP神經(jīng)網(wǎng)絡(luò)算法和C4.5決策樹(shù)算法分別對(duì)數(shù)據(jù)進(jìn)行研究。本文的主要工作包括:1)提取電信LTE用戶上網(wǎng)行為數(shù)據(jù),數(shù)據(jù)字段包括用戶每日上網(wǎng)頻次;每日使用上行流量大;每日使用下行流量大。幻咳丈暇W(wǎng)時(shí)長(zhǎng)和上網(wǎng)的具體日期。2)對(duì)提取的數(shù)據(jù)進(jìn)行預(yù)處理。3)采用Matlab工具,分別實(shí)現(xiàn)K-Means算法和FCM算法對(duì)數(shù)據(jù)的聚類并研究?jī)煞N算法之間的性能,得到更準(zhǔn)確的流失用戶的用戶特征。4) 最后通過(guò)樸素貝葉斯算法、BP神經(jīng)網(wǎng)絡(luò)算法和C4.5決策樹(shù)算法三種算法分別對(duì)電信用戶LTE上網(wǎng)變化數(shù)據(jù)進(jìn)行預(yù)測(cè)的對(duì)比試驗(yàn),分析三種算法的效率和準(zhǔn)確率。根據(jù)評(píng)估結(jié)果,進(jìn)行分析并得到電信用戶流失預(yù)警的最佳解決方案。本文以上海電信的用戶LTE上網(wǎng)數(shù)據(jù)和數(shù)據(jù)挖掘相結(jié)合,進(jìn)而分析用戶流失的原因和影響指標(biāo),為客戶提供個(gè)性化的挽留方案,減小用戶的流失率。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 用戶流失 LTE K-Means算法 FCM算法 樸素貝葉斯算法 BP神經(jīng)網(wǎng)絡(luò)算法 C4.5決策樹(shù)算法
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN929.5;TP311.13
【目錄】:
- 摘要6-7
- abstract7-12
- 第1章 緒論12-17
- 1.1 課題背景及意義12-13
- 1.1.1 電信行業(yè)的發(fā)展背景12
- 1.1.2 數(shù)據(jù)挖掘的誕生12-13
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀13-15
- 1.2.1 數(shù)據(jù)挖掘技術(shù)研究現(xiàn)狀13-14
- 1.2.2 數(shù)據(jù)挖掘在用戶流失領(lǐng)域的研究現(xiàn)狀14-15
- 1.3 本文研究的主要內(nèi)容15-16
- 1.3.1 主要研究目標(biāo)15
- 1.3.2 主要研究方法15-16
- 1.4 主要?jiǎng)?chuàng)新點(diǎn)16
- 1.5 本章小結(jié)16-17
- 第2章 LTE網(wǎng)絡(luò)技術(shù)與數(shù)據(jù)挖掘基礎(chǔ)知識(shí)17-24
- 2.1 LTE網(wǎng)絡(luò)技術(shù)概述17-21
- 2.1.1 網(wǎng)絡(luò)架構(gòu)17-18
- 2.1.2 LTE網(wǎng)絡(luò)演進(jìn)18-19
- 2.1.3 LTE網(wǎng)絡(luò)業(yè)務(wù)19-21
- 2.2 用戶流失21-22
- 2.2.1 用戶流失的定義21
- 2.2.2 用戶流失的原因21-22
- 2.3 基于用戶流失的數(shù)據(jù)挖掘22-23
- 2.3.1 數(shù)據(jù)挖掘技術(shù)的產(chǎn)生22
- 2.3.2 數(shù)據(jù)挖掘技術(shù)分類22-23
- 2.3.3 數(shù)據(jù)挖掘的基本過(guò)程23
- 2.4 本章小結(jié)23-24
- 第3章 電信數(shù)據(jù)采集與預(yù)處理24-36
- 3.1 數(shù)據(jù)采集24-31
- 3.1.1 大數(shù)據(jù)平臺(tái)介紹24
- 3.1.2 數(shù)據(jù)采集規(guī)模預(yù)估24-25
- 3.1.3 數(shù)據(jù)采集格式25-26
- 3.1.4 數(shù)據(jù)提取26-27
- 3.1.5 數(shù)據(jù)統(tǒng)計(jì)27-31
- 3.2 數(shù)據(jù)預(yù)處理31-35
- 3.2.1 數(shù)據(jù)選擇抽樣31-32
- 3.2.2 數(shù)據(jù)預(yù)處理32-34
- 3.2.3 數(shù)據(jù)歸一化34-35
- 3.3 本章小結(jié)35-36
- 第4章 聚類分析36-47
- 4.1 K-Means算法36-40
- 4.1.1 算法簡(jiǎn)介36-38
- 4.1.2 聚類結(jié)果及分析38-40
- 4.2 FCM算法40-45
- 4.2.1 算法簡(jiǎn)介40-41
- 4.2.2 聚類結(jié)果及分析41-45
- 4.3 兩種不同聚類算法對(duì)比分析45-46
- 4.4 本章小結(jié)46-47
- 第5章 用戶流失分析預(yù)警算法研究47-63
- 5.1 貝葉斯分類算法47-49
- 5.1.1 貝葉斯分類算法簡(jiǎn)介47
- 5.1.2 常用貝葉斯分類算法47-48
- 5.1.3 樸素貝葉斯算法分析用戶流失問(wèn)題48-49
- 5.2 人工神經(jīng)網(wǎng)絡(luò)算法49-54
- 5.2.1 人工神經(jīng)網(wǎng)絡(luò)算法簡(jiǎn)介49-50
- 5.2.2 常用人工神經(jīng)網(wǎng)絡(luò)算法50-53
- 5.2.3 BP神經(jīng)網(wǎng)絡(luò)算法分析用戶流失問(wèn)題53-54
- 5.3 決策樹(shù)算法54-58
- 5.3.1 決策樹(shù)算法簡(jiǎn)介54-55
- 5.3.2 常用決策樹(shù)算法55-56
- 5.3.3 C4.5算法分析用戶流失問(wèn)題56-58
- 5.4 三種常用算法的模型評(píng)價(jià)與比較58-61
- 5.4.1 模型評(píng)價(jià)58-60
- 5.4.2 模型比較60-61
- 5.5 本章小結(jié)61-63
- 結(jié)論和展望63-65
- 致謝65-66
- 參考文獻(xiàn)66-70
- 碩士期間發(fā)表論文70
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 方蕾;;用戶流失引發(fā)網(wǎng)游頹勢(shì) 提升服務(wù)是唯一救命稻草[J];IT時(shí)代周刊;2006年05期
2 肖勝;;準(zhǔn)確計(jì)算與解讀流失率[J];通信企業(yè)管理;2013年01期
3 馬鳳炯;;以優(yōu)質(zhì)服務(wù)推動(dòng)郵政企業(yè)持續(xù)發(fā)展[J];中國(guó)郵政;2009年09期
4 劉光遠(yuǎn);苑森淼;董立巖;李永麗;;基于進(jìn)化理論的用戶流失預(yù)測(cè)分析[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2007年02期
5 莊德尚;武艷;;新疆巴州鐵通 建立流失預(yù)警機(jī)制 減少用戶流失[J];通信企業(yè)管理;2007年12期
6 賴院根;劉礪利;;基于客戶價(jià)值的信息用戶流失預(yù)測(cè)研究[J];情報(bào)理論與實(shí)踐;2011年07期
7 ;為IPOT witter效仿FACEBOOK[J];工業(yè)設(shè)計(jì);2013年08期
8 馬會(huì)迎;;移動(dòng)互聯(lián)網(wǎng)對(duì)用戶流失的影響分析——以人人網(wǎng)為例[J];無(wú)線互聯(lián)科技;2014年04期
9 宋向東;;IP業(yè)務(wù)推動(dòng)NTT固話公司走出困境[J];通信世界;2011年05期
10 劉敏;;有線電視數(shù)字整體轉(zhuǎn)換后用戶流失問(wèn)題的探討[J];湖南農(nóng)機(jī);2012年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 車平;施剛;;一種基于決策樹(shù)的用戶流失預(yù)測(cè)分析方法[A];先進(jìn)制造技術(shù)論壇暨第五屆制造業(yè)自動(dòng)化與信息化技術(shù)交流會(huì)論文集[C];2006年
2 俞宙;莫麗珍;;廣東移動(dòng)天氣短信用戶流失分析及應(yīng)對(duì)[A];第31屆中國(guó)氣象學(xué)會(huì)年會(huì)S10 第四屆氣象服務(wù)發(fā)展論壇——提高水文氣象防災(zāi)減災(zāi)水平,推動(dòng)氣象服務(wù)社會(huì)化發(fā)展[C];2014年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 本報(bào)記者 梓莖;用戶流失:一個(gè)不容忽視的問(wèn)題[N];人民郵電;2003年
2 本報(bào)記者 席大偉;中電信手機(jī)用戶流失緩解 天翼彰顯發(fā)展后勁[N];通信信息報(bào);2009年
3 中興通訊 曾志 楊毅;借助大數(shù)據(jù)盤活“存量市場(chǎng)”[N];通信產(chǎn)業(yè)報(bào);2013年
4 ;用戶流失:帶號(hào)轉(zhuǎn)移政策的挑戰(zhàn)[N];人民郵電;2008年
5 ;NTTDoCoMo用戶流失加劇[N];人民郵電;2007年
6 李薇;防用戶流失,AT&T推出“免費(fèi)通信”[N];新華每日電訊;2007年
7 本報(bào)記者 于偉;美國(guó)有線和衛(wèi)星電視用戶流失加快寬帶互聯(lián)網(wǎng)替代效應(yīng)凸顯[N];通信信息報(bào);2011年
8 李雷 穆童;焦作聯(lián)通建檔維系防用戶流失[N];人民郵電;2010年
9 薛松;用戶流失 電信網(wǎng)通盼發(fā)移動(dòng)牌[N];廣州日?qǐng)?bào);2007年
10 本報(bào)記者 張韜;用戶流失股價(jià)反漲 重組預(yù)期支撐電信網(wǎng)通[N];上海證券報(bào);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 張迪;移動(dòng)游戲用戶流失因素分析[D];南京大學(xué);2016年
2 代曉菊;基于數(shù)據(jù)挖掘的電信LTE用戶上網(wǎng)數(shù)據(jù)的用戶流失算法研究[D];西南交通大學(xué);2016年
3 王娟;聯(lián)通某地市分公司用戶流失分析及對(duì)策研究[D];北京郵電大學(xué);2010年
4 曹潔;A電信分公司移動(dòng)用戶流失分析與對(duì)策研究[D];山東大學(xué);2011年
5 楊孝成;基于決策樹(shù)的移動(dòng)通信用戶流失預(yù)警模型研究與實(shí)現(xiàn)[D];中國(guó)海洋大學(xué);2014年
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的電信LTE用戶上網(wǎng)數(shù)據(jù)的用戶流失算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):385935
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/385935.html