基于深度學(xué)習(xí)的電信客戶流失預(yù)測研究
發(fā)布時間:2022-01-14 23:31
隨著網(wǎng)絡(luò)的普及,通信市場的用戶已經(jīng)趨于飽和,開發(fā)一個新客戶的成本相對于挽留一個老客戶要高得多,企業(yè)正在從用產(chǎn)品吸引新客戶到挽留老客戶的轉(zhuǎn)變。與此同時,數(shù)據(jù)挖掘技術(shù)、深度學(xué)習(xí)的發(fā)展,企業(yè)越來越重視利用技術(shù)來進行客戶的流失預(yù)測。本文的根據(jù)真實的企業(yè)數(shù)據(jù),建立基于深度置信網(wǎng)絡(luò)的電信寬帶客戶流失預(yù)測模型。結(jié)合了機器學(xué)習(xí)以及深度學(xué)習(xí)的優(yōu)點,使用極限梯度樹創(chuàng)造特征,深度置信網(wǎng)絡(luò)進行建模。深度置信網(wǎng)絡(luò)相比于反向傳播神經(jīng)網(wǎng)絡(luò),有著更好的全局搜索能力,使得模型能夠更快,更好的收斂到全局最優(yōu)解。本文首先分析了國內(nèi)外對于客戶流失預(yù)測使用的方法,其次,闡述了本文建立電信客戶流失預(yù)測模型所涉及到算法、知識點。受限玻爾茲曼機、BP神經(jīng)網(wǎng)絡(luò)、極限梯度提升樹。接著從XX省電信公司的系統(tǒng)中提取了XX市的客戶基本信息表、客戶活躍度信息表、客戶投訴表、光貓功率表。對這些表進行數(shù)據(jù)集成、數(shù)據(jù)清洗、數(shù)據(jù)規(guī)約、數(shù)據(jù)轉(zhuǎn)換。使用極限梯度提升樹創(chuàng)造新特征,接著使用深度置信網(wǎng)絡(luò)建立了電信客戶流失預(yù)測模型。使用八月份的電信數(shù)據(jù)進行測試,得到模型在測試集面的精確率達到了90.45%,召回率達到了88.11%,F1分數(shù)達到了89.27%。同時...
【文章來源】:云南財經(jīng)大學(xué)云南省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【圖文】:
RBM網(wǎng)絡(luò)結(jié)構(gòu)示意圖
第二章相關(guān)知識介紹12(,)1()(,)EvhvvPhPvheZ==.(2-10)要知道P(h)或者P(v)的分布,都需要計算,但是根據(jù)的定義,v,h中包含2vhn+n個項,由此可知,若直接進行計算,它的計算復(fù)雜度太大。訓(xùn)練RBM的目的是為了獲得輸入樣本,也就是訓(xùn)練數(shù)據(jù)的分布。訓(xùn)練RBM的過程就是不斷調(diào)整學(xué)習(xí)參數(shù)的過程。假設(shè)輸入樣本為S={v(1),v2,...,v(T)},T為訓(xùn)練樣本總數(shù),對于任意一個(t)v,()12(,,,),1,2,...,vttttTnv=vvvt=T,我們知道RBM的可見層是獨立同分布的,因此(t)v里的數(shù)據(jù)也一樣。圖2.3表示的是含有多個訓(xùn)練數(shù)據(jù)的RBM模型,我們的目標就是使得訓(xùn)練數(shù)據(jù)的概率乘積最大化:(),1()TtstLPv==.(2-11)可以看到,連乘式1(v)snttP=比較難處理,由lnx的函數(shù)性質(zhì)可知,求,sL的最大值與求,lnsL的最大值是等價的,因此訓(xùn)練RBM的目標就變成了如下的式子。()(),11loglog()log()TTttsttLPvPv====.(2-12)為了方便,下文推導(dǎo)中我們省略下標,將,sL簡記為()sL。圖2.2含有多個訓(xùn)練樣本的RBM模型
第二章相關(guān)知識介紹23BP神經(jīng)網(wǎng)絡(luò)的進程首要分為兩個階段,第一階段是數(shù)據(jù)的前向傳播,從輸入層輸入數(shù)據(jù),通過隱藏層的線性、非線性變換,最后到達輸出層;第二階段是有監(jiān)督學(xué)習(xí)的反向傳播。圖2.3BP神經(jīng)網(wǎng)絡(luò)下面分別介紹這兩個過程的原理和推導(dǎo)。一、BP神經(jīng)網(wǎng)絡(luò)的正向傳播設(shè)兩個節(jié)點之間的連接權(quán)值為i,jw,節(jié)點的偏置為jb,每一個節(jié)點的輸出值為jx,節(jié)點的輸出值是由上一層所有的節(jié)點和當前層的偏置項計算的出來的。計算公式如下1,0mjijijiSwxb==+(2-43)()jjx=fS(2-44)其中f為激活函數(shù),如果是二分類的話可以是sigmoid函數(shù),也可以是softmax函數(shù)。正向傳播比較簡單,初始化權(quán)值的方法有很多,一般是正態(tài)分布初始化,偏置項一般初始化為0。二、誤差反向傳播BP神經(jīng)網(wǎng)絡(luò)作為有監(jiān)督學(xué)習(xí),目的就是不斷優(yōu)化損失函數(shù),基于減小損失函數(shù)來對參數(shù)進行更新。定義jy為BP神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果,當損失函數(shù)為均方誤差時,有:
【參考文獻】:
期刊論文
[1]基于改進GA-BP的移動通信用戶流失預(yù)測算法[J]. 于瑞云,薛林,安軒邈,夏興有. 東北大學(xué)學(xué)報(自然科學(xué)版). 2019(02)
[2]基于特征降維和DBN的廣告點擊率預(yù)測[J]. 楊長春,梅佳俊,吳云,顧寰. 計算機工程與設(shè)計. 2018(12)
[3]基于深度置信網(wǎng)絡(luò)的總有機碳含量預(yù)測方法[J]. 葉紹澤,曹俊興,吳施楷,譚峰. 地球物理學(xué)進展. 2018(06)
[4]基于C5.0算法的航空客戶流失分析[J]. 崔亞奇. 西安航空學(xué)院學(xué)報. 2018(01)
[5]基于logistic模型的證券公司客戶流失預(yù)警分析[J]. 鄭宇晨,呂王勇. 鄭州航空工業(yè)管理學(xué)院學(xué)報. 2016(05)
[6]基于深度置信網(wǎng)絡(luò)的語義相關(guān)度計算模型[J]. 翟繼友. 科學(xué)技術(shù)與工程. 2014(32)
[7]基于深度學(xué)習(xí)的作曲家分類問題[J]. 胡振,傅昆,張長水. 計算機研究與發(fā)展. 2014(09)
[8]深度置信網(wǎng)絡(luò)在垃圾郵件過濾中的應(yīng)用[J]. 孫勁光,蔣金葉,孟祥福,李秀娟. 計算機應(yīng)用. 2014(04)
[9]基于AdaBoost的電信客戶流失預(yù)測模型[J]. 王純麟,何建敏. 價值工程. 2007(02)
[10]神經(jīng)網(wǎng)絡(luò)在客戶流失模型中的應(yīng)用研究[J]. 梁禮明,翁發(fā)祿,丁元春. 商業(yè)研究. 2007(02)
博士論文
[1]基于MMOI方法的電信客戶流失預(yù)測與挽留研究[D]. 羅彬.電子科技大學(xué) 2010
碩士論文
[1]基于隨機森林的電信客戶流失預(yù)測應(yīng)用研究[D]. 邱偉.華南理工大學(xué) 2018
[2]電商企業(yè)客戶流失預(yù)警模型研究[D]. 董航.東華大學(xué) 2017
[3]基于數(shù)據(jù)挖掘技術(shù)的電信流失客戶預(yù)測系統(tǒng)研究[D]. 黃勝男.南昌大學(xué) 2016
[4]基于BP神經(jīng)網(wǎng)絡(luò)的移動用戶流失預(yù)測算法的研究[D]. 安軒邈.東北大學(xué) 2016
[5]FM公司客戶流失分析及對策研究[D]. 王善勇.電子科技大學(xué) 2016
[6]基于BP神經(jīng)網(wǎng)絡(luò)對保險公司客戶流失進行分析和預(yù)測研究[D]. 邵帥鋒.蘭州大學(xué) 2016
[7]基于受限玻爾茲曼機的深度學(xué)習(xí)模型及其應(yīng)用[D]. 張艷霞.電子科技大學(xué) 2016
[8]基于深度學(xué)習(xí)的癌癥分類模型研究[D]. 葉永盛.華中科技大學(xué) 2015
本文編號:3589433
【文章來源】:云南財經(jīng)大學(xué)云南省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【圖文】:
RBM網(wǎng)絡(luò)結(jié)構(gòu)示意圖
第二章相關(guān)知識介紹12(,)1()(,)EvhvvPhPvheZ==.(2-10)要知道P(h)或者P(v)的分布,都需要計算,但是根據(jù)的定義,v,h中包含2vhn+n個項,由此可知,若直接進行計算,它的計算復(fù)雜度太大。訓(xùn)練RBM的目的是為了獲得輸入樣本,也就是訓(xùn)練數(shù)據(jù)的分布。訓(xùn)練RBM的過程就是不斷調(diào)整學(xué)習(xí)參數(shù)的過程。假設(shè)輸入樣本為S={v(1),v2,...,v(T)},T為訓(xùn)練樣本總數(shù),對于任意一個(t)v,()12(,,,),1,2,...,vttttTnv=vvvt=T,我們知道RBM的可見層是獨立同分布的,因此(t)v里的數(shù)據(jù)也一樣。圖2.3表示的是含有多個訓(xùn)練數(shù)據(jù)的RBM模型,我們的目標就是使得訓(xùn)練數(shù)據(jù)的概率乘積最大化:(),1()TtstLPv==.(2-11)可以看到,連乘式1(v)snttP=比較難處理,由lnx的函數(shù)性質(zhì)可知,求,sL的最大值與求,lnsL的最大值是等價的,因此訓(xùn)練RBM的目標就變成了如下的式子。()(),11loglog()log()TTttsttLPvPv====.(2-12)為了方便,下文推導(dǎo)中我們省略下標,將,sL簡記為()sL。圖2.2含有多個訓(xùn)練樣本的RBM模型
第二章相關(guān)知識介紹23BP神經(jīng)網(wǎng)絡(luò)的進程首要分為兩個階段,第一階段是數(shù)據(jù)的前向傳播,從輸入層輸入數(shù)據(jù),通過隱藏層的線性、非線性變換,最后到達輸出層;第二階段是有監(jiān)督學(xué)習(xí)的反向傳播。圖2.3BP神經(jīng)網(wǎng)絡(luò)下面分別介紹這兩個過程的原理和推導(dǎo)。一、BP神經(jīng)網(wǎng)絡(luò)的正向傳播設(shè)兩個節(jié)點之間的連接權(quán)值為i,jw,節(jié)點的偏置為jb,每一個節(jié)點的輸出值為jx,節(jié)點的輸出值是由上一層所有的節(jié)點和當前層的偏置項計算的出來的。計算公式如下1,0mjijijiSwxb==+(2-43)()jjx=fS(2-44)其中f為激活函數(shù),如果是二分類的話可以是sigmoid函數(shù),也可以是softmax函數(shù)。正向傳播比較簡單,初始化權(quán)值的方法有很多,一般是正態(tài)分布初始化,偏置項一般初始化為0。二、誤差反向傳播BP神經(jīng)網(wǎng)絡(luò)作為有監(jiān)督學(xué)習(xí),目的就是不斷優(yōu)化損失函數(shù),基于減小損失函數(shù)來對參數(shù)進行更新。定義jy為BP神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果,當損失函數(shù)為均方誤差時,有:
【參考文獻】:
期刊論文
[1]基于改進GA-BP的移動通信用戶流失預(yù)測算法[J]. 于瑞云,薛林,安軒邈,夏興有. 東北大學(xué)學(xué)報(自然科學(xué)版). 2019(02)
[2]基于特征降維和DBN的廣告點擊率預(yù)測[J]. 楊長春,梅佳俊,吳云,顧寰. 計算機工程與設(shè)計. 2018(12)
[3]基于深度置信網(wǎng)絡(luò)的總有機碳含量預(yù)測方法[J]. 葉紹澤,曹俊興,吳施楷,譚峰. 地球物理學(xué)進展. 2018(06)
[4]基于C5.0算法的航空客戶流失分析[J]. 崔亞奇. 西安航空學(xué)院學(xué)報. 2018(01)
[5]基于logistic模型的證券公司客戶流失預(yù)警分析[J]. 鄭宇晨,呂王勇. 鄭州航空工業(yè)管理學(xué)院學(xué)報. 2016(05)
[6]基于深度置信網(wǎng)絡(luò)的語義相關(guān)度計算模型[J]. 翟繼友. 科學(xué)技術(shù)與工程. 2014(32)
[7]基于深度學(xué)習(xí)的作曲家分類問題[J]. 胡振,傅昆,張長水. 計算機研究與發(fā)展. 2014(09)
[8]深度置信網(wǎng)絡(luò)在垃圾郵件過濾中的應(yīng)用[J]. 孫勁光,蔣金葉,孟祥福,李秀娟. 計算機應(yīng)用. 2014(04)
[9]基于AdaBoost的電信客戶流失預(yù)測模型[J]. 王純麟,何建敏. 價值工程. 2007(02)
[10]神經(jīng)網(wǎng)絡(luò)在客戶流失模型中的應(yīng)用研究[J]. 梁禮明,翁發(fā)祿,丁元春. 商業(yè)研究. 2007(02)
博士論文
[1]基于MMOI方法的電信客戶流失預(yù)測與挽留研究[D]. 羅彬.電子科技大學(xué) 2010
碩士論文
[1]基于隨機森林的電信客戶流失預(yù)測應(yīng)用研究[D]. 邱偉.華南理工大學(xué) 2018
[2]電商企業(yè)客戶流失預(yù)警模型研究[D]. 董航.東華大學(xué) 2017
[3]基于數(shù)據(jù)挖掘技術(shù)的電信流失客戶預(yù)測系統(tǒng)研究[D]. 黃勝男.南昌大學(xué) 2016
[4]基于BP神經(jīng)網(wǎng)絡(luò)的移動用戶流失預(yù)測算法的研究[D]. 安軒邈.東北大學(xué) 2016
[5]FM公司客戶流失分析及對策研究[D]. 王善勇.電子科技大學(xué) 2016
[6]基于BP神經(jīng)網(wǎng)絡(luò)對保險公司客戶流失進行分析和預(yù)測研究[D]. 邵帥鋒.蘭州大學(xué) 2016
[7]基于受限玻爾茲曼機的深度學(xué)習(xí)模型及其應(yīng)用[D]. 張艷霞.電子科技大學(xué) 2016
[8]基于深度學(xué)習(xí)的癌癥分類模型研究[D]. 葉永盛.華中科技大學(xué) 2015
本文編號:3589433
本文鏈接:http://sikaile.net/jingjilunwen/xmjj/3589433.html
最近更新
教材專著