基于XGBoost和BP神經(jīng)網(wǎng)絡(luò)的會(huì)員流失預(yù)測(cè)及內(nèi)容推薦方法的研究
發(fā)布時(shí)間:2021-02-17 01:11
隨著社會(huì)經(jīng)濟(jì)發(fā)展,各類組織或企業(yè)越來(lái)越重視客戶關(guān)系管理,而會(huì)員是對(duì)組織具有高粘度和做出較大利潤(rùn)貢獻(xiàn)的客戶群體,但出于種種原因的會(huì)員客戶流失現(xiàn)象對(duì)組織或企業(yè)的運(yùn)營(yíng)有較大的影響。借助組織存儲(chǔ)的會(huì)員資料和會(huì)員行為數(shù)據(jù),利用數(shù)據(jù)挖掘方法預(yù)測(cè)潛在的流失會(huì)員,并通過(guò)協(xié)同過(guò)濾算法提前向其推薦特定的產(chǎn)品和服務(wù)來(lái)挽留會(huì)員,這對(duì)于組織或企業(yè)長(zhǎng)期穩(wěn)定的發(fā)展至關(guān)重要。本文的主要研究?jī)?nèi)容就是利用一個(gè)在線音樂(lè)網(wǎng)站KKBox的會(huì)員信息,使用XGBoost(Extreme Gradient Boosting)算法和BP(error Backpropagation,簡(jiǎn)稱BP)神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)了一個(gè)組合模型,用組合模型來(lái)對(duì)KKBox會(huì)員流失進(jìn)行預(yù)測(cè)。之后,利用協(xié)同過(guò)濾算法對(duì)預(yù)測(cè)出的潛在流失會(huì)員進(jìn)行內(nèi)容推薦,從而達(dá)到挽留會(huì)員的目的。本文主要的研究?jī)?nèi)容由以下三部分組成:第一部分,首先對(duì)下載的原始數(shù)據(jù)進(jìn)行建模前的各項(xiàng)準(zhǔn)備,包括數(shù)據(jù)清理、數(shù)據(jù)整合、數(shù)據(jù)篩選、數(shù)據(jù)變換以及數(shù)據(jù)歸一化等工作,為接下來(lái)的模型搭建打下基礎(chǔ)。接著在前人關(guān)于客戶流失預(yù)測(cè)方法研究的基礎(chǔ)上,通過(guò)分析與對(duì)比,研究不同算法模型的優(yōu)缺點(diǎn)。第二部分,利用XGBoost算...
【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)內(nèi)會(huì)員流失預(yù)測(cè)現(xiàn)狀
1.2.2 國(guó)外會(huì)員流失預(yù)測(cè)現(xiàn)狀
1.3 研究?jī)?nèi)容與組織結(jié)構(gòu)
1.3.1 研究?jī)?nèi)容
1.3.2 組織結(jié)構(gòu)
第二章 數(shù)據(jù)挖掘及分類算法簡(jiǎn)介
2.1 數(shù)據(jù)挖掘簡(jiǎn)介
2.1.1 數(shù)據(jù)挖掘概念與目標(biāo)
2.1.2 數(shù)據(jù)挖掘項(xiàng)目管理方法論
2.1.3 數(shù)據(jù)挖掘技術(shù)與應(yīng)用
2.2 分類算法簡(jiǎn)介
2.2.1 決策樹(shù)算法
2.2.2 貝葉斯分類器
2.2.3 支持向量機(jī)
2.3 XGBoost算法
2.4 BP神經(jīng)網(wǎng)絡(luò)算法
第三章 數(shù)據(jù)分析及數(shù)據(jù)處理
3.1 數(shù)據(jù)來(lái)源
3.2 數(shù)據(jù)選擇和轉(zhuǎn)換
3.2.1 數(shù)據(jù)選擇
3.2.2 數(shù)據(jù)轉(zhuǎn)換
3.3 特征子集選擇
3.4 訓(xùn)練集和測(cè)試集的選擇
第四章 會(huì)員流失預(yù)測(cè)模型的設(shè)計(jì)和實(shí)證研究
4.1 會(huì)員流失預(yù)測(cè)模型的設(shè)計(jì)
4.1.1 XGBoost模型
4.1.2 BP神經(jīng)網(wǎng)絡(luò)模型
4.1.3 組合模型的設(shè)計(jì)
4.2 組合模型的實(shí)證研究
第五章 內(nèi)容推薦
5.1 推薦思路
5.2 基于協(xié)同過(guò)濾的推薦
5.2.1 User-based CF
5.2.2 Item-based CF
5.2.3 基于模型的協(xié)同過(guò)濾
5.3 協(xié)同過(guò)濾推薦的應(yīng)用
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
附錄
【參考文獻(xiàn)】:
期刊論文
[1]協(xié)同過(guò)濾技術(shù)在電影推薦中的應(yīng)用[J]. 陳俊然. 電腦編程技巧與維護(hù). 2019(01)
[2]基于統(tǒng)計(jì)學(xué)的電信客戶流失分析與運(yùn)用[J]. 吳怡慧,姚洪心. 時(shí)代金融. 2018(03)
[3]電信客戶流失預(yù)測(cè)模型的構(gòu)建及客戶流失因素分析[J]. 李會(huì),吳小蘭,李俠. 內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2017(03)
[4]基于Logistic回歸的通信業(yè)客戶流失預(yù)測(cè)與挽留研究[J]. 付杰,方芳,嚴(yán)克文. 鄂州大學(xué)學(xué)報(bào). 2015(06)
[5]大數(shù)據(jù)環(huán)境下客戶購(gòu)買行為預(yù)測(cè)[J]. 杜剛,黃震宇. 管理現(xiàn)代化. 2015(01)
[6]基于貝葉斯網(wǎng)絡(luò)的客戶流失分析研究[J]. 朱志勇,徐長(zhǎng)梅,劉志兵,胡晨剛. 計(jì)算機(jī)工程與科學(xué). 2013(03)
[7]貝葉斯決策樹(shù)在客戶流失預(yù)測(cè)中的應(yīng)用[J]. 尹婷,馬軍,覃錫忠,賈振紅. 計(jì)算機(jī)工程與應(yīng)用. 2014(07)
[8]電信套餐資費(fèi)預(yù)演中客戶量的預(yù)測(cè)方法研究[J]. 賈丹華,王潤(rùn)潤(rùn),王鵬. 電信科學(xué). 2011(08)
[9]結(jié)合K-means的分類方法在電信客戶流失中的應(yīng)用[J]. 王穎,陳治平. 佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(02)
[10]談客戶忠誠(chéng)及其培養(yǎng)[J]. 李兆吉. 企業(yè)研究. 2010(05)
碩士論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)對(duì)保險(xiǎn)公司客戶流失進(jìn)行分析和預(yù)測(cè)研究[D]. 邵帥鋒.蘭州大學(xué) 2016
[2]個(gè)性化圖書推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 白雪陽(yáng).哈爾濱工程大學(xué) 2012
[3]基于網(wǎng)絡(luò)結(jié)構(gòu)的個(gè)性化推薦系統(tǒng)的研究[D]. 劉友林.東華大學(xué) 2012
本文編號(hào):3037194
【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)內(nèi)會(huì)員流失預(yù)測(cè)現(xiàn)狀
1.2.2 國(guó)外會(huì)員流失預(yù)測(cè)現(xiàn)狀
1.3 研究?jī)?nèi)容與組織結(jié)構(gòu)
1.3.1 研究?jī)?nèi)容
1.3.2 組織結(jié)構(gòu)
第二章 數(shù)據(jù)挖掘及分類算法簡(jiǎn)介
2.1 數(shù)據(jù)挖掘簡(jiǎn)介
2.1.1 數(shù)據(jù)挖掘概念與目標(biāo)
2.1.2 數(shù)據(jù)挖掘項(xiàng)目管理方法論
2.1.3 數(shù)據(jù)挖掘技術(shù)與應(yīng)用
2.2 分類算法簡(jiǎn)介
2.2.1 決策樹(shù)算法
2.2.2 貝葉斯分類器
2.2.3 支持向量機(jī)
2.3 XGBoost算法
2.4 BP神經(jīng)網(wǎng)絡(luò)算法
第三章 數(shù)據(jù)分析及數(shù)據(jù)處理
3.1 數(shù)據(jù)來(lái)源
3.2 數(shù)據(jù)選擇和轉(zhuǎn)換
3.2.1 數(shù)據(jù)選擇
3.2.2 數(shù)據(jù)轉(zhuǎn)換
3.3 特征子集選擇
3.4 訓(xùn)練集和測(cè)試集的選擇
第四章 會(huì)員流失預(yù)測(cè)模型的設(shè)計(jì)和實(shí)證研究
4.1 會(huì)員流失預(yù)測(cè)模型的設(shè)計(jì)
4.1.1 XGBoost模型
4.1.2 BP神經(jīng)網(wǎng)絡(luò)模型
4.1.3 組合模型的設(shè)計(jì)
4.2 組合模型的實(shí)證研究
第五章 內(nèi)容推薦
5.1 推薦思路
5.2 基于協(xié)同過(guò)濾的推薦
5.2.1 User-based CF
5.2.2 Item-based CF
5.2.3 基于模型的協(xié)同過(guò)濾
5.3 協(xié)同過(guò)濾推薦的應(yīng)用
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
附錄
【參考文獻(xiàn)】:
期刊論文
[1]協(xié)同過(guò)濾技術(shù)在電影推薦中的應(yīng)用[J]. 陳俊然. 電腦編程技巧與維護(hù). 2019(01)
[2]基于統(tǒng)計(jì)學(xué)的電信客戶流失分析與運(yùn)用[J]. 吳怡慧,姚洪心. 時(shí)代金融. 2018(03)
[3]電信客戶流失預(yù)測(cè)模型的構(gòu)建及客戶流失因素分析[J]. 李會(huì),吳小蘭,李俠. 內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2017(03)
[4]基于Logistic回歸的通信業(yè)客戶流失預(yù)測(cè)與挽留研究[J]. 付杰,方芳,嚴(yán)克文. 鄂州大學(xué)學(xué)報(bào). 2015(06)
[5]大數(shù)據(jù)環(huán)境下客戶購(gòu)買行為預(yù)測(cè)[J]. 杜剛,黃震宇. 管理現(xiàn)代化. 2015(01)
[6]基于貝葉斯網(wǎng)絡(luò)的客戶流失分析研究[J]. 朱志勇,徐長(zhǎng)梅,劉志兵,胡晨剛. 計(jì)算機(jī)工程與科學(xué). 2013(03)
[7]貝葉斯決策樹(shù)在客戶流失預(yù)測(cè)中的應(yīng)用[J]. 尹婷,馬軍,覃錫忠,賈振紅. 計(jì)算機(jī)工程與應(yīng)用. 2014(07)
[8]電信套餐資費(fèi)預(yù)演中客戶量的預(yù)測(cè)方法研究[J]. 賈丹華,王潤(rùn)潤(rùn),王鵬. 電信科學(xué). 2011(08)
[9]結(jié)合K-means的分類方法在電信客戶流失中的應(yīng)用[J]. 王穎,陳治平. 佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(02)
[10]談客戶忠誠(chéng)及其培養(yǎng)[J]. 李兆吉. 企業(yè)研究. 2010(05)
碩士論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)對(duì)保險(xiǎn)公司客戶流失進(jìn)行分析和預(yù)測(cè)研究[D]. 邵帥鋒.蘭州大學(xué) 2016
[2]個(gè)性化圖書推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 白雪陽(yáng).哈爾濱工程大學(xué) 2012
[3]基于網(wǎng)絡(luò)結(jié)構(gòu)的個(gè)性化推薦系統(tǒng)的研究[D]. 劉友林.東華大學(xué) 2012
本文編號(hào):3037194
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3037194.html
最近更新
教材專著