基于神經(jīng)網(wǎng)絡(luò)算法構(gòu)建電信用戶流失預(yù)測(cè)模型的研究
本文關(guān)鍵詞:基于神經(jīng)網(wǎng)絡(luò)算法構(gòu)建電信用戶流失預(yù)測(cè)模型的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著大數(shù)據(jù)時(shí)代的到來(lái),移動(dòng)互聯(lián)網(wǎng)快速發(fā)展使傳統(tǒng)電信運(yùn)營(yíng)商面臨著互聯(lián)網(wǎng)企業(yè)以及同行業(yè)內(nèi)的雙重壓力,運(yùn)營(yíng)商手中掌握著大量的用戶數(shù)據(jù),卻苦于無(wú)法從數(shù)據(jù)中獲得其潛在的商業(yè)價(jià)值,這對(duì)傳統(tǒng)電信運(yùn)營(yíng)商轉(zhuǎn)型提出了迫切的要求。使傳統(tǒng)電信運(yùn)營(yíng)商必須向數(shù)據(jù)驅(qū)動(dòng)的商業(yè)模式轉(zhuǎn)變,從而提升企業(yè)的競(jìng)爭(zhēng)力。國(guó)內(nèi)電信企業(yè)將數(shù)據(jù)挖掘技術(shù)結(jié)合業(yè)務(wù)數(shù)據(jù)主要應(yīng)用于產(chǎn)品的精確營(yíng)銷(xiāo)、客戶分群、客戶行為分析、客戶流失預(yù)測(cè)、套餐制定以及電話欺詐等等。但大多都只是處于研究階段,并未使用到實(shí)際生產(chǎn)當(dāng)中,國(guó)內(nèi)運(yùn)營(yíng)商對(duì)大數(shù)據(jù)和數(shù)據(jù)挖掘等技術(shù)的應(yīng)用還處于起步階段,還需要不斷發(fā)展。對(duì)于企業(yè)來(lái)說(shuō),客戶都是企業(yè)最重要的資源,如何最大程度保留有價(jià)值、價(jià)值高的客戶是企業(yè)永恒的目標(biāo)。一是通過(guò)價(jià)格優(yōu)勢(shì)或提出新產(chǎn)品來(lái)發(fā)展新的客戶,二是通過(guò)提升服務(wù)和實(shí)施客戶挽留、客戶價(jià)值提升的政策最大限度的留住老客戶,而第二種方法所需要的成本明顯低于第一種,運(yùn)營(yíng)商們出于成本的考慮將重點(diǎn)放在客戶挽留。而在現(xiàn)實(shí)生活中,用戶的流失都是無(wú)預(yù)兆和沒(méi)有規(guī)律可循的,只有實(shí)現(xiàn)用戶的流失預(yù)測(cè),及早發(fā)現(xiàn)可能流失的用戶并對(duì)其采取正確的挽留措施,才能盡可能的保證企業(yè)的客戶資源不流失。本文按照跨行業(yè)數(shù)據(jù)挖掘過(guò)程CRISP-DM的6個(gè)步驟,從電信某公司的多個(gè)子系統(tǒng)中提取出了客戶信息、賬戶信息以及移動(dòng)用戶的語(yǔ)音、數(shù)據(jù)、增值業(yè)務(wù)等行為信息,通過(guò)數(shù)據(jù)集成、清洗、規(guī)約、轉(zhuǎn)換等方法對(duì)數(shù)據(jù)集進(jìn)行處理。使用BP神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)了電信用戶的流失預(yù)測(cè),模型的預(yù)測(cè)命中率可以達(dá)到82.12%。同時(shí)使用Map Reduce的編程框架將算法在Hadoop平臺(tái)上進(jìn)行了部署,在保證了算法的準(zhǔn)確度的情況下,解決了在單機(jī)計(jì)算量有限的問(wèn)題,有效地提高了模型訓(xùn)練效率。實(shí)驗(yàn)表明了基于MapReduce的編程框架下的BP神經(jīng)網(wǎng)絡(luò)算法在處理海量數(shù)據(jù)時(shí)具有明顯優(yōu)勢(shì)。
【關(guān)鍵詞】:流失預(yù)測(cè) 數(shù)據(jù)挖掘 BP神經(jīng)網(wǎng)絡(luò) 大數(shù)據(jù) Hadoop CRISP-DM
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:F626;TP183
【目錄】:
- 中文摘要3-4
- Abstract4-9
- 第一章 緒論9-17
- 1.1 研究背景9-12
- 1.1.1 電信運(yùn)營(yíng)商面臨的挑戰(zhàn)9-10
- 1.1.2 數(shù)據(jù)挖掘的發(fā)展10-11
- 1.1.3 數(shù)據(jù)挖掘技術(shù)在電信業(yè)的應(yīng)用11-12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-14
- 1.2.1 國(guó)外研究現(xiàn)狀12-13
- 1.2.2 國(guó)內(nèi)研究現(xiàn)狀13-14
- 1.3 主要研究?jī)?nèi)容14-15
- 1.4 文章的組織結(jié)構(gòu)15-17
- 第二章 相關(guān)理論知識(shí)介紹17-25
- 2.1 數(shù)據(jù)挖掘過(guò)程17-19
- 2.1.1 跨行業(yè)數(shù)據(jù)挖掘過(guò)程CRISP-DM17-19
- 2.2 神經(jīng)網(wǎng)絡(luò)算法19-21
- 2.3 Hadoop21-25
- 2.3.1 分布式文件系統(tǒng)HDFS21-23
- 2.3.2 分布式計(jì)算框架MapReduce23-25
- 第三章 模型數(shù)據(jù)的準(zhǔn)備25-43
- 3.1 商業(yè)理解25-27
- 3.1.1 用戶流失的定義25-26
- 3.1.2 客戶流失原因分析26
- 3.1.3 電信的三戶模型26-27
- 3.2 數(shù)據(jù)理解27-31
- 3.2.1 確定數(shù)據(jù)分析窗口27-28
- 3.2.2 相關(guān)數(shù)據(jù)的選擇28-31
- 3.3 數(shù)據(jù)準(zhǔn)備31-43
- 3.3.1 數(shù)據(jù)集成31-32
- 3.3.2 數(shù)據(jù)清理32-35
- 3.3.3 數(shù)據(jù)規(guī)約35-36
- 3.3.4 數(shù)據(jù)變換36-37
- 3.3.5 數(shù)據(jù)的平衡問(wèn)題37-38
- 3.3.6 重要屬性的選擇38-42
- 3.3.7 數(shù)據(jù)集的劃分42-43
- 第四章 模型建立、評(píng)估與應(yīng)用43-53
- 4.1 預(yù)測(cè)模型的建立43-48
- 4.1.1 BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法43-45
- 4.1.2 網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)設(shè)定45-47
- 4.1.4 網(wǎng)絡(luò)的訓(xùn)練過(guò)程47-48
- 4.2 模型的評(píng)估48-51
- 4.3 模型的部署與應(yīng)用51-53
- 第五章 預(yù)測(cè)模型的Hadoop平臺(tái)實(shí)現(xiàn)53-58
- 5.1 實(shí)驗(yàn)平臺(tái)介紹53-54
- 5.2 預(yù)測(cè)模型的并行化54-55
- 5.3 實(shí)驗(yàn)結(jié)果分析55-57
- 5.4 小結(jié)57-58
- 第六章 總結(jié)與展望58-60
- 6.1 本文總結(jié)58-59
- 6.2 未來(lái)工作的展望59-60
- 參考文獻(xiàn)60-63
- 研究生期間參與的項(xiàng)目63-64
- 致謝64
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張賽民;周竹生;陳靈君;;應(yīng)用一種改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)密度曲線[J];物探化探計(jì)算技術(shù);2007年06期
2 李淑慧;;改進(jìn)的進(jìn)化神經(jīng)網(wǎng)絡(luò)算法及其在入侵檢測(cè)中的應(yīng)用[J];現(xiàn)代電子技術(shù);2010年01期
3 王治國(guó);宋考平;張春鶴;劉剛;王愛(ài)明;;BP神經(jīng)網(wǎng)絡(luò)算法在單井流動(dòng)單元識(shí)別中的應(yīng)用[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2011年05期
4 ;BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)[J];電腦開(kāi)發(fā)與應(yīng)用;1995年02期
5 賀興時(shí),劉宇;BP神經(jīng)網(wǎng)絡(luò)算法在數(shù)字識(shí)別中的應(yīng)用[J];西北紡織工學(xué)院學(xué)報(bào);2000年04期
6 李廣瓊,蔣加伏;關(guān)于對(duì)BP神經(jīng)網(wǎng)絡(luò)算法改進(jìn)的研究[J];常德師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年02期
7 孫修東,李宗斌,陳富民;基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法的多指標(biāo)綜合評(píng)價(jià)方法的應(yīng)用研究[J];河南機(jī)電高等專(zhuān)科學(xué)校學(xué)報(bào);2003年01期
8 王青海;BP神經(jīng)網(wǎng)絡(luò)算法的一種改進(jìn)[J];青海大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
9 左付均,蔡自興;基于神經(jīng)網(wǎng)絡(luò)算法的建設(shè)項(xiàng)目風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng)設(shè)計(jì)[J];廣西科學(xué)院學(xué)報(bào);2004年03期
10 李衛(wèi)東;基于神經(jīng)網(wǎng)絡(luò)算法的工程技術(shù)人員綜合評(píng)價(jià)方法的應(yīng)用研究[J];太原科技大學(xué)學(xué)報(bào);2005年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 呂慶U,
本文編號(hào):344648
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/344648.html