基于數(shù)據(jù)挖掘的潛在用戶行為分析
發(fā)布時(shí)間:2020-09-19 20:27
隨著我國(guó)通信行業(yè)的不斷發(fā)展,一直以來(lái),移動(dòng)、聯(lián)通、電信三家運(yùn)營(yíng)商用盡一切手段爭(zhēng)奪現(xiàn)有市場(chǎng)的用戶資源,競(jìng)爭(zhēng)相當(dāng)激烈。隨著互聯(lián)網(wǎng)的迅速發(fā)展,海量用戶通信信息、流量消費(fèi)信息、業(yè)務(wù)消費(fèi)信息等行為數(shù)據(jù)變得可得,這為數(shù)據(jù)挖掘技術(shù)的展開(kāi)提供了更廣闊的平臺(tái),哪個(gè)運(yùn)營(yíng)商能夠更快、更準(zhǔn)確、更有效地獲取用戶需求,哪個(gè)運(yùn)營(yíng)商就能贏得商機(jī),就能在市場(chǎng)中處于優(yōu)勢(shì)地位;谙M(fèi)者行為數(shù)據(jù)的挖掘有助于運(yùn)營(yíng)商更好地開(kāi)展精準(zhǔn)營(yíng)銷(xiāo)、客戶流失預(yù)警、潛在客戶識(shí)別和黑名單用戶識(shí)別等業(yè)務(wù),從而提高客戶滿意度,加強(qiáng)運(yùn)營(yíng)商的競(jìng)爭(zhēng)力,從而制定針對(duì)性的營(yíng)銷(xiāo)策略實(shí)現(xiàn)企業(yè)的精確營(yíng)銷(xiāo),為不同的用戶需求制定個(gè)性化方案提供依據(jù),最終實(shí)現(xiàn)節(jié)約用戶營(yíng)銷(xiāo)成本、提升企業(yè)利潤(rùn)的目的。但客戶的行為數(shù)據(jù)挖掘面臨如數(shù)據(jù)量巨大、數(shù)據(jù)類(lèi)型多樣等問(wèn)題的困擾,傳統(tǒng)的數(shù)據(jù)挖掘手段很難取得滿意的效果。本文根據(jù)運(yùn)行商用戶消費(fèi)行為特點(diǎn),對(duì)聯(lián)通大王卡業(yè)務(wù)的實(shí)證數(shù)據(jù)進(jìn)行了數(shù)據(jù)預(yù)處理、描述性分析,主成分分析優(yōu)化特征工程,并采用方差分析進(jìn)行特征選取,再使用隨機(jī)森林和Xgboost算法來(lái)訓(xùn)練用戶數(shù)據(jù),并確定模型的優(yōu)化方案,進(jìn)行了參數(shù)優(yōu)化,最終對(duì)兩種算法的模型表現(xiàn)進(jìn)行了評(píng)價(jià)與對(duì)比,發(fā)現(xiàn)Xgboost算法的分類(lèi)效果更好,最后對(duì)Xgboost算法的結(jié)果進(jìn)行了分析展示。
【學(xué)位單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:C81
【部分圖文】:
第五章實(shí)例數(shù)據(jù)分析過(guò)程逡逑§5.2.2單變量特征分析逡逑繪制年齡的核密度圖5.3,從核密度圖可以更清晰地看出,年齡在10至24之間的人群更逡逑傾\乎辦理王卡業(yè)務(wù)(1代表辦理王卡業(yè)務(wù),0代表非辦理王,卡業(yè)務(wù))。逡逑lM邐年齡的賽密度圖逡逑A;邐邐邋0逡逑/\邐|邐!邋I逡逑ft邋05邐;邐1——1-\邐t邐邐邐!邐!邐逡逑n邋\逡逑11邋\/\逡逑ft邋00邋邐邐逡逑o邐io邐so邐an邐■?邐aa邐eo逡逑年齡逡逑圖5.3:年齡分布的核密度ffl逡逑繪制當(dāng)月騰訊APP使用次數(shù)的核密度圖5.4,辦理芏卡業(yè)務(wù)的人群3月騰訊克?^使用逡逑次數(shù)是普遍偏高于非辦理S卡業(yè)務(wù)的人群的。逡逑繪制前三月平均OPfiS總流鷥的核密度圖5.5,可以看出,辦理王卡業(yè)務(wù)的人群前三個(gè)逡逑月的平均GPi?S總瑰_普遍偏高于非辦理王卡業(yè)務(wù)的人群。逡逑§5.2.3特征相關(guān)性的可視化逡逑對(duì)篩選出的20個(gè)意要特征進(jìn)行分析,繪制兩兩相關(guān)系數(shù)的熱度圖5.6,該圖中小方格逡逑的顏色深淺表示相關(guān)系數(shù)的大小,顏色越淺表示對(duì)應(yīng)的兩個(gè)特征間的相關(guān)性越強(qiáng)。逡逑分別繪制前三月平均GPES總浠量和前蘭p喉本牽校?S计费总流量的相关关蠝祀腾辶x涎妒悠凳褂昧鞲偷痹綠諮叮粒校桌粲昧髁肯喙毓叵檔納⒌隳穡罰約敖雀鱸縷驕簦鰨椋礤義現(xiàn)島停嘲伲幔潁?謾n南喙毓叵滌臚ㄐ爬嗪臀⑿攀褂昧髁康南喙毓叵檔納⒌閫跡擔(dān),可诣闖鼉咤義嫌幸歡ǖ南咝怨叵
本文編號(hào):2822955
【學(xué)位單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:C81
【部分圖文】:
第五章實(shí)例數(shù)據(jù)分析過(guò)程逡逑§5.2.2單變量特征分析逡逑繪制年齡的核密度圖5.3,從核密度圖可以更清晰地看出,年齡在10至24之間的人群更逡逑傾\乎辦理王卡業(yè)務(wù)(1代表辦理王卡業(yè)務(wù),0代表非辦理王,卡業(yè)務(wù))。逡逑lM邐年齡的賽密度圖逡逑A;邐邐邋0逡逑/\邐|邐!邋I逡逑ft邋05邐;邐1——1-\邐t邐邐邐!邐!邐逡逑n邋\逡逑11邋\/\逡逑ft邋00邋邐邐逡逑o邐io邐so邐an邐■?邐aa邐eo逡逑年齡逡逑圖5.3:年齡分布的核密度ffl逡逑繪制當(dāng)月騰訊APP使用次數(shù)的核密度圖5.4,辦理芏卡業(yè)務(wù)的人群3月騰訊克?^使用逡逑次數(shù)是普遍偏高于非辦理S卡業(yè)務(wù)的人群的。逡逑繪制前三月平均OPfiS總流鷥的核密度圖5.5,可以看出,辦理王卡業(yè)務(wù)的人群前三個(gè)逡逑月的平均GPi?S總瑰_普遍偏高于非辦理王卡業(yè)務(wù)的人群。逡逑§5.2.3特征相關(guān)性的可視化逡逑對(duì)篩選出的20個(gè)意要特征進(jìn)行分析,繪制兩兩相關(guān)系數(shù)的熱度圖5.6,該圖中小方格逡逑的顏色深淺表示相關(guān)系數(shù)的大小,顏色越淺表示對(duì)應(yīng)的兩個(gè)特征間的相關(guān)性越強(qiáng)。逡逑分別繪制前三月平均GPES總浠量和前蘭p喉本牽校?S计费总流量的相关关蠝祀腾辶x涎妒悠凳褂昧鞲偷痹綠諮叮粒校桌粲昧髁肯喙毓叵檔納⒌隳穡罰約敖雀鱸縷驕簦鰨椋礤義現(xiàn)島停嘲伲幔潁?謾n南喙毓叵滌臚ㄐ爬嗪臀⑿攀褂昧髁康南喙毓叵檔納⒌閫跡擔(dān),可诣闖鼉咤義嫌幸歡ǖ南咝怨叵
本文編號(hào):2822955
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2822955.html
最近更新
教材專(zhuān)著