基于組合模型的電信用戶離網(wǎng)預(yù)測(cè)
發(fā)布時(shí)間:2021-07-13 07:36
在當(dāng)今大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)越來(lái)越受到人們的認(rèn)可,利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的規(guī)律已成為一種趨勢(shì)。與此同時(shí),數(shù)據(jù)挖掘技術(shù)也逐漸受到電信行業(yè)的青睞,運(yùn)用數(shù)據(jù)挖掘技術(shù)預(yù)測(cè)將要離網(wǎng)的用戶是該行業(yè)研究的熱點(diǎn)之一。當(dāng)前的電信用戶離網(wǎng)預(yù)測(cè)模型主要以傳統(tǒng)的單一模型為主,在建模過(guò)程中它們常常面臨眾多的函數(shù)選擇或參數(shù)選擇的問(wèn)題,由于缺乏先驗(yàn)知識(shí),往往很難找到函數(shù)或參數(shù)的最佳配置,因此模型的預(yù)測(cè)精度和泛化性能難以得到提高。查看前人的研究成果發(fā)現(xiàn),組合預(yù)測(cè)模型不僅在預(yù)測(cè)性能上比單一模型表現(xiàn)要好,而且避開(kāi)了單一模型存在的參數(shù)或函數(shù)的優(yōu)化配置問(wèn)題,這為提高建模效率和模型性能提供了一條新思路。除此之外,由于電信用戶離網(wǎng)預(yù)測(cè)數(shù)據(jù)集的維度較高,本文還對(duì)比研究了不同的變量選擇方法對(duì)模型預(yù)測(cè)性能的影響,這對(duì)提高建模效率和模型性能具有重要意義。本文以電信行業(yè)用戶離網(wǎng)預(yù)測(cè)為研究背景,目的是構(gòu)建一個(gè)準(zhǔn)確、高效的用戶離網(wǎng)預(yù)測(cè)模型。首先明確研究目的。其次從數(shù)據(jù)庫(kù)中提取相關(guān)的用戶數(shù)據(jù),包括用戶屬性信息、通話信息、流量信息、短信信息和消費(fèi)信息。然后經(jīng)過(guò)數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索等步驟,分別基于不同變量選擇方法建立了兩個(gè)組合預(yù)測(cè)模型...
【文章來(lái)源】:云南大學(xué)云南省 211工程院校
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究綜述
1.3 研究目的和內(nèi)容
1.4 本文的創(chuàng)新點(diǎn)
第二章 電信用戶離網(wǎng)和數(shù)據(jù)挖掘技術(shù)
2.1 用戶離網(wǎng)的定義和原因
2.2 數(shù)據(jù)挖掘的流程
2.3 單一算法介紹
2.3.1 決策樹(shù)
2.3.2 邏輯回歸
2.4 組合算法介紹
2.4.1 Bagging組合算法
2.4.2 Boosting組合算法與Adaboost
2.5 變量選擇方法介紹
2.6 模型的評(píng)估方法介紹
第三章 電信用戶數(shù)據(jù)獲取和預(yù)處理
3.1 數(shù)據(jù)獲取
3.2 數(shù)據(jù)理解
3.3 數(shù)據(jù)預(yù)處理
3.4 數(shù)據(jù)探索
3.5 數(shù)據(jù)分割和抽樣
第四章 組合模型在電信用戶離網(wǎng)預(yù)測(cè)中的應(yīng)用
4.1 決策樹(shù)模型
4.2 邏輯回歸模型
4.3 Bagging-CART組合模型
4.4 Adaboost-CART組合模型
4.5 不同變量選擇方法對(duì)模型預(yù)測(cè)性能的影響
4.6 組合模型和單一模型的性能評(píng)估與比較
4.7 本章總結(jié)
第五章 總結(jié)和展望
5.1 本文的主要工作
5.2 工作展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于混合數(shù)據(jù)挖掘模型預(yù)測(cè)用戶流失[J]. 董博,王雪. 火力與指揮控制. 2017(03)
[2]深度隨機(jī)森林在離網(wǎng)預(yù)測(cè)中的應(yīng)用[J]. 楊曉峰,嚴(yán)建峰,劉曉升,楊璐. 計(jì)算機(jī)科學(xué). 2016(06)
[3]改進(jìn)的貝葉斯分類方法在電信客戶流失中的研究與應(yīng)用[J]. 楊婷,滕少華. 廣東工業(yè)大學(xué)學(xué)報(bào). 2015(03)
[4]基于Group Lasso的多源電信數(shù)據(jù)離網(wǎng)用戶分析[J]. 孫良君,范劍鋒,楊琬琪,史穎歡,高陽(yáng),周新民. 南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版). 2014(04)
[5]基于CART和自適應(yīng)Boosting算法的移動(dòng)通信企業(yè)客戶流失預(yù)測(cè)模型[J]. 張瑋,楊善林,劉婷婷. 中國(guó)管理科學(xué). 2014(10)
[6]客戶流失問(wèn)題研究綜述[J]. 于小兵,曹杰,鞏在武. 計(jì)算機(jī)集成制造系統(tǒng). 2012(10)
[7]基于聚類和LOF算法的異常數(shù)據(jù)檢測(cè)方法[J]. 張曉. 伊犁師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2011(02)
[8]基于粗糙集理論-神經(jīng)網(wǎng)絡(luò)-蜂群算法集成的客戶流失研究[J]. 羅彬,邵培基,羅盡堯,劉獨(dú)玉,夏國(guó)恩. 管理學(xué)報(bào). 2011(02)
[9]連續(xù)型Adaboost算法研究[J]. 嚴(yán)超,王元慶. 計(jì)算機(jī)科學(xué). 2010(09)
[10]電信客戶流失預(yù)測(cè)模型研究[J]. 路美秀,李鋒,向仍濤. 電腦與電信. 2010(06)
碩士論文
[1]Boosting分類算法的應(yīng)用與研究[D]. 李想.蘭州交通大學(xué) 2012
本文編號(hào):3281654
【文章來(lái)源】:云南大學(xué)云南省 211工程院校
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究綜述
1.3 研究目的和內(nèi)容
1.4 本文的創(chuàng)新點(diǎn)
第二章 電信用戶離網(wǎng)和數(shù)據(jù)挖掘技術(shù)
2.1 用戶離網(wǎng)的定義和原因
2.2 數(shù)據(jù)挖掘的流程
2.3 單一算法介紹
2.3.1 決策樹(shù)
2.3.2 邏輯回歸
2.4 組合算法介紹
2.4.1 Bagging組合算法
2.4.2 Boosting組合算法與Adaboost
2.5 變量選擇方法介紹
2.6 模型的評(píng)估方法介紹
第三章 電信用戶數(shù)據(jù)獲取和預(yù)處理
3.1 數(shù)據(jù)獲取
3.2 數(shù)據(jù)理解
3.3 數(shù)據(jù)預(yù)處理
3.4 數(shù)據(jù)探索
3.5 數(shù)據(jù)分割和抽樣
第四章 組合模型在電信用戶離網(wǎng)預(yù)測(cè)中的應(yīng)用
4.1 決策樹(shù)模型
4.2 邏輯回歸模型
4.3 Bagging-CART組合模型
4.4 Adaboost-CART組合模型
4.5 不同變量選擇方法對(duì)模型預(yù)測(cè)性能的影響
4.6 組合模型和單一模型的性能評(píng)估與比較
4.7 本章總結(jié)
第五章 總結(jié)和展望
5.1 本文的主要工作
5.2 工作展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于混合數(shù)據(jù)挖掘模型預(yù)測(cè)用戶流失[J]. 董博,王雪. 火力與指揮控制. 2017(03)
[2]深度隨機(jī)森林在離網(wǎng)預(yù)測(cè)中的應(yīng)用[J]. 楊曉峰,嚴(yán)建峰,劉曉升,楊璐. 計(jì)算機(jī)科學(xué). 2016(06)
[3]改進(jìn)的貝葉斯分類方法在電信客戶流失中的研究與應(yīng)用[J]. 楊婷,滕少華. 廣東工業(yè)大學(xué)學(xué)報(bào). 2015(03)
[4]基于Group Lasso的多源電信數(shù)據(jù)離網(wǎng)用戶分析[J]. 孫良君,范劍鋒,楊琬琪,史穎歡,高陽(yáng),周新民. 南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版). 2014(04)
[5]基于CART和自適應(yīng)Boosting算法的移動(dòng)通信企業(yè)客戶流失預(yù)測(cè)模型[J]. 張瑋,楊善林,劉婷婷. 中國(guó)管理科學(xué). 2014(10)
[6]客戶流失問(wèn)題研究綜述[J]. 于小兵,曹杰,鞏在武. 計(jì)算機(jī)集成制造系統(tǒng). 2012(10)
[7]基于聚類和LOF算法的異常數(shù)據(jù)檢測(cè)方法[J]. 張曉. 伊犁師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2011(02)
[8]基于粗糙集理論-神經(jīng)網(wǎng)絡(luò)-蜂群算法集成的客戶流失研究[J]. 羅彬,邵培基,羅盡堯,劉獨(dú)玉,夏國(guó)恩. 管理學(xué)報(bào). 2011(02)
[9]連續(xù)型Adaboost算法研究[J]. 嚴(yán)超,王元慶. 計(jì)算機(jī)科學(xué). 2010(09)
[10]電信客戶流失預(yù)測(cè)模型研究[J]. 路美秀,李鋒,向仍濤. 電腦與電信. 2010(06)
碩士論文
[1]Boosting分類算法的應(yīng)用與研究[D]. 李想.蘭州交通大學(xué) 2012
本文編號(hào):3281654
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/3281654.html
最近更新
教材專著