基于數(shù)據(jù)挖掘的潛在用戶行為分析
發(fā)布時間:2020-09-19 20:27
隨著我國通信行業(yè)的不斷發(fā)展,一直以來,移動、聯(lián)通、電信三家運營商用盡一切手段爭奪現(xiàn)有市場的用戶資源,競爭相當(dāng)激烈。隨著互聯(lián)網(wǎng)的迅速發(fā)展,海量用戶通信信息、流量消費信息、業(yè)務(wù)消費信息等行為數(shù)據(jù)變得可得,這為數(shù)據(jù)挖掘技術(shù)的展開提供了更廣闊的平臺,哪個運營商能夠更快、更準(zhǔn)確、更有效地獲取用戶需求,哪個運營商就能贏得商機,就能在市場中處于優(yōu)勢地位;谙M者行為數(shù)據(jù)的挖掘有助于運營商更好地開展精準(zhǔn)營銷、客戶流失預(yù)警、潛在客戶識別和黑名單用戶識別等業(yè)務(wù),從而提高客戶滿意度,加強運營商的競爭力,從而制定針對性的營銷策略實現(xiàn)企業(yè)的精確營銷,為不同的用戶需求制定個性化方案提供依據(jù),最終實現(xiàn)節(jié)約用戶營銷成本、提升企業(yè)利潤的目的。但客戶的行為數(shù)據(jù)挖掘面臨如數(shù)據(jù)量巨大、數(shù)據(jù)類型多樣等問題的困擾,傳統(tǒng)的數(shù)據(jù)挖掘手段很難取得滿意的效果。本文根據(jù)運行商用戶消費行為特點,對聯(lián)通大王卡業(yè)務(wù)的實證數(shù)據(jù)進行了數(shù)據(jù)預(yù)處理、描述性分析,主成分分析優(yōu)化特征工程,并采用方差分析進行特征選取,再使用隨機森林和Xgboost算法來訓(xùn)練用戶數(shù)據(jù),并確定模型的優(yōu)化方案,進行了參數(shù)優(yōu)化,最終對兩種算法的模型表現(xiàn)進行了評價與對比,發(fā)現(xiàn)Xgboost算法的分類效果更好,最后對Xgboost算法的結(jié)果進行了分析展示。
【學(xué)位單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:C81
【部分圖文】:
第五章實例數(shù)據(jù)分析過程逡逑§5.2.2單變量特征分析逡逑繪制年齡的核密度圖5.3,從核密度圖可以更清晰地看出,年齡在10至24之間的人群更逡逑傾\乎辦理王卡業(yè)務(wù)(1代表辦理王卡業(yè)務(wù),0代表非辦理王,卡業(yè)務(wù))。逡逑lM邐年齡的賽密度圖逡逑A;邐邐邋0逡逑/\邐|邐!邋I逡逑ft邋05邐;邐1——1-\邐t邐邐邐!邐!邐逡逑n邋\逡逑11邋\/\逡逑ft邋00邋邐邐逡逑o邐io邐so邐an邐■?邐aa邐eo逡逑年齡逡逑圖5.3:年齡分布的核密度ffl逡逑繪制當(dāng)月騰訊APP使用次數(shù)的核密度圖5.4,辦理芏卡業(yè)務(wù)的人群3月騰訊克?^使用逡逑次數(shù)是普遍偏高于非辦理S卡業(yè)務(wù)的人群的。逡逑繪制前三月平均OPfiS總流鷥的核密度圖5.5,可以看出,辦理王卡業(yè)務(wù)的人群前三個逡逑月的平均GPi?S總瑰_普遍偏高于非辦理王卡業(yè)務(wù)的人群。逡逑§5.2.3特征相關(guān)性的可視化逡逑對篩選出的20個意要特征進行分析,繪制兩兩相關(guān)系數(shù)的熱度圖5.6,該圖中小方格逡逑的顏色深淺表示相關(guān)系數(shù)的大小,顏色越淺表示對應(yīng)的兩個特征間的相關(guān)性越強。逡逑分別繪制前三月平均GPES總浠量和前蘭p喉本牽校?S计费总流量的相关关蠝祀腾辶x涎妒悠凳褂昧鞲偷痹綠諮叮粒校桌粲昧髁肯喙毓叵檔納⒌隳穡罰約敖雀鱸縷驕簦鰨椋礤義現(xiàn)島停嘲伲幔潁?謾n南喙毓叵滌臚ㄐ爬嗪臀⑿攀褂昧髁康南喙毓叵檔納⒌閫跡擔(dān),可诣闖鼉咤義嫌幸歡ǖ南咝怨叵
本文編號:2822955
【學(xué)位單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:C81
【部分圖文】:
第五章實例數(shù)據(jù)分析過程逡逑§5.2.2單變量特征分析逡逑繪制年齡的核密度圖5.3,從核密度圖可以更清晰地看出,年齡在10至24之間的人群更逡逑傾\乎辦理王卡業(yè)務(wù)(1代表辦理王卡業(yè)務(wù),0代表非辦理王,卡業(yè)務(wù))。逡逑lM邐年齡的賽密度圖逡逑A;邐邐邋0逡逑/\邐|邐!邋I逡逑ft邋05邐;邐1——1-\邐t邐邐邐!邐!邐逡逑n邋\逡逑11邋\/\逡逑ft邋00邋邐邐逡逑o邐io邐so邐an邐■?邐aa邐eo逡逑年齡逡逑圖5.3:年齡分布的核密度ffl逡逑繪制當(dāng)月騰訊APP使用次數(shù)的核密度圖5.4,辦理芏卡業(yè)務(wù)的人群3月騰訊克?^使用逡逑次數(shù)是普遍偏高于非辦理S卡業(yè)務(wù)的人群的。逡逑繪制前三月平均OPfiS總流鷥的核密度圖5.5,可以看出,辦理王卡業(yè)務(wù)的人群前三個逡逑月的平均GPi?S總瑰_普遍偏高于非辦理王卡業(yè)務(wù)的人群。逡逑§5.2.3特征相關(guān)性的可視化逡逑對篩選出的20個意要特征進行分析,繪制兩兩相關(guān)系數(shù)的熱度圖5.6,該圖中小方格逡逑的顏色深淺表示相關(guān)系數(shù)的大小,顏色越淺表示對應(yīng)的兩個特征間的相關(guān)性越強。逡逑分別繪制前三月平均GPES總浠量和前蘭p喉本牽校?S计费总流量的相关关蠝祀腾辶x涎妒悠凳褂昧鞲偷痹綠諮叮粒校桌粲昧髁肯喙毓叵檔納⒌隳穡罰約敖雀鱸縷驕簦鰨椋礤義現(xiàn)島停嘲伲幔潁?謾n南喙毓叵滌臚ㄐ爬嗪臀⑿攀褂昧髁康南喙毓叵檔納⒌閫跡擔(dān),可诣闖鼉咤義嫌幸歡ǖ南咝怨叵
本文編號:2822955
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2822955.html
最近更新
教材專著