基于數(shù)據(jù)挖掘的電信客戶WLAN業(yè)務(wù)訂購預(yù)測研究
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的電信客戶WLAN業(yè)務(wù)訂購預(yù)測研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著計(jì)算機(jī)技術(shù)特別是數(shù)據(jù)庫技術(shù)的廣泛應(yīng)用,各行各業(yè)積累了海量的數(shù)據(jù)。但是出現(xiàn)了數(shù)據(jù)豐富但信息貧乏的現(xiàn)象,數(shù)據(jù)密集型企業(yè)越來越認(rèn)可數(shù)據(jù)挖掘的重要性。數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究越來越廣泛,其中在電信行業(yè)中的應(yīng)用就是一大焦點(diǎn)。 基于數(shù)據(jù)挖掘的電信客戶WLAN業(yè)務(wù)訂購預(yù)測這項(xiàng)研究,是在數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)迅猛發(fā)展的基礎(chǔ)上,針對電信企業(yè)客戶關(guān)系管理的迫切需要,為了擴(kuò)大運(yùn)營商的WLAN客戶規(guī)模而設(shè)計(jì)提出的。 本文工作以K市“中國移動通信公司數(shù)據(jù)挖掘及數(shù)據(jù)分析服務(wù)”項(xiàng)目為背景,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到電信企業(yè)的WLAN業(yè)務(wù)推廣活動中。依托K市移動通信公司經(jīng)營分析系統(tǒng)中客戶數(shù)據(jù),以CRISP-DM方法論為建模過程框架,按照商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、模型建立、模型評估、模型部署的步驟,利用數(shù)據(jù)挖掘工具SPSS Clementine設(shè)計(jì)和實(shí)現(xiàn)了電信客戶WLAN業(yè)務(wù)訂購預(yù)測模型。 本文首先介紹了數(shù)據(jù)挖掘的相關(guān)理論知識。在模型建立以前,對數(shù)據(jù)進(jìn)行了有效的集成、規(guī)約、清理、轉(zhuǎn)換、探索等工作,處理了不平衡數(shù)據(jù)集,結(jié)合行業(yè)經(jīng)驗(yàn)初步確定了建模使用的樣本集和屬性指標(biāo)。最終建立了決策樹C5.0、CART分類回歸樹、二項(xiàng)Logistic回歸分析三類模型,通過對三類模型進(jìn)行多次訓(xùn)練和多項(xiàng)指標(biāo)的評估,最終選擇了最優(yōu)屬性和最佳模型應(yīng)用于電信客戶WLAN業(yè)務(wù)訂購預(yù)測研究。在模型部署階段,初步分析了客戶業(yè)務(wù)訂購原因,并根據(jù)預(yù)測模型給出的客戶得分情況,對得分較高者進(jìn)行業(yè)務(wù)推廣,從而擴(kuò)大用戶規(guī)模。應(yīng)用結(jié)果表明所建立的模型是科學(xué)的,基本上符合實(shí)際情況,能夠給決策人員提供有價(jià)值的預(yù)測信息并給出相應(yīng)的解決方案,該預(yù)測研究對電信運(yùn)營商擴(kuò)大WLAN客戶規(guī)模具有重要意義。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 電信行業(yè) WLAN業(yè)務(wù)訂購 決策樹C5.0 CART分類回歸樹 二項(xiàng)Logistic回歸分析
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP311.13
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 緒論11-19
- 1.1 研究背景和意義11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-16
- 1.2.1 數(shù)據(jù)挖掘的國內(nèi)外研究現(xiàn)狀13-14
- 1.2.2 數(shù)據(jù)挖掘在電信業(yè)的國內(nèi)外應(yīng)用現(xiàn)狀14-15
- 1.2.3 目前研究存在的問題15-16
- 1.3 本文所做的工作16-19
- 1.3.1 本文研究的內(nèi)容16-18
- 1.3.2 本文主要內(nèi)容安排18-19
- 第二章 數(shù)據(jù)挖掘理論與技術(shù)19-27
- 2.1 數(shù)據(jù)挖掘概述19
- 2.2 數(shù)據(jù)挖掘技術(shù)介紹19-20
- 2.3 數(shù)據(jù)挖掘功能分析20-22
- 2.4 數(shù)據(jù)挖掘算法22-26
- 2.4.1 決策樹算法22-25
- 2.4.2 二項(xiàng)Logistic回歸算法25-26
- 2.5 本章小結(jié)26-27
- 第三章 數(shù)據(jù)挖掘過程模型及實(shí)現(xiàn)27-33
- 3.1 CRISP-DM數(shù)據(jù)挖掘過程模型的介紹27-30
- 3.2 SPSS數(shù)據(jù)挖掘軟件的介紹30-31
- 3.3 本章小結(jié)31-33
- 第四章 電信客戶WLAN業(yè)務(wù)訂購預(yù)測模型的數(shù)據(jù)準(zhǔn)33-59
- 4.1 商業(yè)理解33-35
- 4.2 數(shù)據(jù)理解35-39
- 4.2.1 確定時(shí)間窗口35-37
- 4.2.2 確定相關(guān)數(shù)據(jù)字段37-39
- 4.3 數(shù)據(jù)準(zhǔn)備39-57
- 4.3.1 數(shù)據(jù)的集成40-41
- 4.3.2 數(shù)據(jù)預(yù)規(guī)約41-42
- 4.3.3 數(shù)據(jù)的平衡處理42-43
- 4.3.4 數(shù)據(jù)清理43-49
- 4.3.5 數(shù)據(jù)轉(zhuǎn)換49-52
- 4.3.6 數(shù)據(jù)探索52-56
- 4.3.7 數(shù)據(jù)分割56-57
- 4.4 本章小結(jié)57-59
- 第五章 模型的建立、評估與部署59-79
- 5.1 模型訓(xùn)練與建立59-68
- 5.1.1 決策樹分析59-61
- 5.1.2 決策樹C5.0模型建立61-64
- 5.1.3 C5.0最佳模型的結(jié)果解釋64-66
- 5.1.4 CART和二項(xiàng)Logistic最佳模型建立66-68
- 5.2 模型評估68-74
- 5.2.1 數(shù)值化模型評估69-71
- 5.2.2 圖形化模型評估71-74
- 5.3 模型部署74-77
- 5.4 本章小結(jié)77-79
- 第六章 總結(jié)與展望79-83
- 6.1 本文所做工作的總結(jié)79-80
- 6.2 不足與展望80-83
- 致謝83-85
- 參考文獻(xiàn)85-89
- 附錄A 碩士期間發(fā)表的論文89-91
- 附錄B 碩士期間發(fā)表的軟件著作權(quán)91
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 中原;;WLAN在3G時(shí)代的新機(jī)會[J];互聯(lián)網(wǎng)天地;2009年09期
2 盛昭瀚,柳炳祥;客戶流失危機(jī)分析的決策樹方法[J];管理科學(xué)學(xué)報(bào);2005年02期
3 姚勝;劉詠梅;;數(shù)據(jù)挖掘細(xì)分客戶群,精準(zhǔn)營銷贏得市場——精準(zhǔn)營銷在長沙移動增值業(yè)務(wù)中的應(yīng)用[J];經(jīng)濟(jì)師;2010年10期
4 羅可,林睦綱,郗東妹;數(shù)據(jù)挖掘中分類算法綜述[J];計(jì)算機(jī)工程;2005年01期
5 劉紅巖,陳劍,陳國青;數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年06期
6 朱世武,崔嵬,謝邦昌;移動電話客戶流失數(shù)據(jù)挖掘[J];數(shù)理統(tǒng)計(jì)與管理;2005年01期
7 陳琦;劉蓉;朱云峰;王佩君;;數(shù)據(jù)挖掘過程的標(biāo)準(zhǔn)模型展望[J];術(shù)語標(biāo)準(zhǔn)化與信息技術(shù);2005年04期
8 顧光同;王力賓;費(fèi)宇;;電信客戶流失預(yù)警規(guī)則及其信度測定實(shí)證研究——以云南電信為例[J];云南財(cái)經(jīng)大學(xué)學(xué)報(bào);2010年06期
9 王亮;胡虹;柳瑞蕓;;無線城市建設(shè)中的WLAN規(guī)劃方法研究[J];移動通信;2013年02期
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的電信客戶WLAN業(yè)務(wù)訂購預(yù)測研究,由筆耕文化傳播整理發(fā)布。
本文編號:317284
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/317284.html