基于數(shù)據(jù)挖掘的網(wǎng)購用戶流失預(yù)測研究
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的網(wǎng)購用戶流失預(yù)測研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:在日新月異的互聯(lián)網(wǎng)時代,電子商務(wù)相對于傳統(tǒng)的購物模式的優(yōu)勢愈發(fā)明顯,方便、快捷的網(wǎng)絡(luò)購物模式正吸引著越來越多的用戶。與此同時,大規(guī)模的交易與需求令電商之間的競爭日趨激烈,企業(yè)間的競爭一方面促進(jìn)了電子商務(wù)的發(fā)展,同時,也加速了電商的優(yōu)勝劣汰。企業(yè)競爭加劇了,客戶對企業(yè)而言,就成了最重要的資源,如何吸引客戶并留住客戶就成了企業(yè)的工作重點(diǎn),這也使得客戶流失成為眾多企業(yè)的關(guān)注問題。電商們?yōu)榱舜_保自己在激烈的競爭市場的良性發(fā)展,不僅要令自身產(chǎn)品具備吸引力,還要深入了解用戶的偏好和滿意度,對用戶的行為特征進(jìn)行深度發(fā)掘。電商用戶行為的不穩(wěn)定性較大,流失率較高,那么,能否在客戶流失之前及時發(fā)現(xiàn)他們,同時幫助營銷部門鎖定目標(biāo)流失客戶群并制定合適的營銷方案是企業(yè)市場部門的重要工作。能比較準(zhǔn)確地預(yù)測用戶的流失,對流失風(fēng)險較大的用戶實(shí)施有針對性地挽留策略,降低流失率是電子商務(wù)企業(yè)日常運(yùn)營管理中的重要工作。在這些方面,數(shù)據(jù)挖掘可以幫助企業(yè)。本文將數(shù)據(jù)挖掘技術(shù)運(yùn)用到商業(yè)分析中,預(yù)測天貓用戶在特定時間內(nèi)的流失情況,從而實(shí)施挽留策略,降低流失率。本文主要進(jìn)行了如下三方面的工作:1、介紹了客戶流失的研究背景和研究現(xiàn)狀,重點(diǎn)介紹了采用數(shù)據(jù)挖掘方法預(yù)測客戶流失的三種模型,包括:決策樹模型、迭代決策樹(Gradient Boosting Decision Tree)模型,簡稱GBDT、邏輯斯蒂回歸模型。2、運(yùn)用迭代決策樹模型處理特征并得到特征集合,建立邏輯斯蒂回歸預(yù)測模型對樣本進(jìn)行分類預(yù)測。3、獲取淘寶天貓網(wǎng)站用戶2014年四個月的真實(shí)數(shù)據(jù)集,用來預(yù)測天貓用戶第五個月的購買行為,然后對所提模型的預(yù)測能力進(jìn)行實(shí)證分析。本文在實(shí)證分析中得到了良好的預(yù)測結(jié)果,實(shí)驗(yàn)最終得到的準(zhǔn)確率是86%,召回率是79%。該模型已經(jīng)具備了較好的預(yù)測能力,可以應(yīng)用到電子商務(wù)企業(yè)實(shí)施日?蛻袅魇ьA(yù)測,幫助電子商務(wù)企業(yè)加強(qiáng)客戶管理,提高客戶的保持率。
【關(guān)鍵詞】:電子商務(wù) 數(shù)據(jù)挖掘 用戶行為 用戶流失 邏輯斯蒂回歸模型 迭代決策樹模型
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F724.6;TP311.13
【目錄】:
- 摘要4-6
- Abstract6-11
- 第1章 緒論11-14
- 1.1 研究背景和意義11-12
- 1.2 本文的主要工作12-14
- 1.2.1 研究思路12
- 1.2.2 研究內(nèi)容12-14
- 第2章 客戶流失研究現(xiàn)狀分析14-19
- 2.1 客戶流失預(yù)測方法介紹14-17
- 2.1.1 基于決策樹算法的客戶流失預(yù)測14-15
- 2.1.2 基于邏輯回歸的客戶流失預(yù)測15-16
- 2.1.3 基于貝葉斯網(wǎng)絡(luò)的流失預(yù)測研究16
- 2.1.4 基于支持向量機(jī)的客戶流失預(yù)測模型16-17
- 2.2 本文的研究動機(jī)17-19
- 2.2.1 當(dāng)前研究存在的不足17
- 2.2.2 本文的研究特色與創(chuàng)新17-19
- 第3章 基本理論方法與技術(shù)19-30
- 3.1 客戶關(guān)系管理19-20
- 3.1.1 客戶關(guān)系管理理論介紹19-20
- 3.2 用于預(yù)測的數(shù)據(jù)挖掘技術(shù)20-26
- 3.2.1 決策樹模型20-21
- 3.2.2 迭代決策樹算法21-23
- 3.2.3 邏輯斯蒂回歸算法23-25
- 3.2.4 正則化25-26
- 3.3 離群點(diǎn)檢測26-27
- 3.4 特征標(biāo)準(zhǔn)化27
- 3.5 特征的正態(tài)變換27-28
- 3.6 特征再處理28-30
- 第4章 電子商務(wù)網(wǎng)站用戶購買行為預(yù)測模型30-38
- 4.1 用戶網(wǎng)購行為的基本分析30-32
- 4.1.1 網(wǎng)購用戶的含義30-32
- 4.2 網(wǎng)購用戶購物流程32
- 4.3 網(wǎng)購用戶行為數(shù)據(jù)的來源32-34
- 4.4 特征選擇34-35
- 4.5 用迭代決策樹模型來處理連續(xù)特征35-37
- 4.6 邏輯斯蒂回歸預(yù)測模型37-38
- 第5章 天貓用戶在線購買行為實(shí)證分析預(yù)測38-47
- 5.1 數(shù)據(jù)來源與描述38-39
- 5.2 數(shù)據(jù)集劃分39
- 5.3 數(shù)據(jù)預(yù)處理39-41
- 5.4 特征選擇41-44
- 5.4.1 時間維度劃分41-42
- 5.4.2 特征維度劃分42-44
- 5.5 模型訓(xùn)練和結(jié)果評估44-47
- 5.5.1 模型訓(xùn)練44
- 5.5.2 模型評價44-47
- 第6章 全文工作總結(jié)與展望47-51
- 參考文獻(xiàn)51-54
- 作者簡介及在學(xué)期間科研成果54-55
- 致謝55
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專學(xué)報;2001年02期
2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語言[J];計算機(jī)時代;2001年11期
3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期
4 張偉;劉勇國;彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計算機(jī)科學(xué);2001年07期
5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識別與人工智能;2001年01期
6 朱建平,張潤楚;數(shù)據(jù)挖掘的發(fā)展及其特點(diǎn)[J];統(tǒng)計與決策;2002年07期
7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場;2002年11期
8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國計算機(jī)用戶;2002年48期
9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計算機(jī)工程與應(yīng)用;2002年14期
10 ;2002數(shù)據(jù)挖掘研討班[J];計算機(jī)工程;2002年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年
2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國農(nóng)業(yè)工程學(xué)會成立30周年暨中國農(nóng)業(yè)工程學(xué)會2009年學(xué)術(shù)年會(CSAE 2009)論文集[C];2009年
3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機(jī)模擬與信息技術(shù)學(xué)術(shù)會議論文集[C];2011年
4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學(xué)術(shù)年會論文集[C];2004年
5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年
6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動化學(xué)會第24屆學(xué)術(shù)年會會議論文集[C];2006年
7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年
8 肖陽;李啟賢;;數(shù)據(jù)挖掘在中國鋼鐵行業(yè)中的應(yīng)用[A];中國計量協(xié)會冶金分會2012年會暨能源計量與節(jié)能降耗經(jīng)驗(yàn)交流會論文集[C];2012年
9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日報;2002年
2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計算機(jī)世界;2004年
3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年
5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
6 本報記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國電子報;2002年
7 本報記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報;2003年
8 本報記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報;2002年
9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報;2005年
10 本報記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時報;2002年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年
2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 彭計紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年
4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評估與應(yīng)用[D];電子科技大學(xué);2015年
6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年
7 李榮;生物信息數(shù)據(jù)挖掘若干關(guān)鍵問題研究與應(yīng)用[D];復(fù)旦大學(xué);2004年
8 李玉華;面向服務(wù)的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年
9 吳少智;時間序列數(shù)據(jù)挖掘在生物醫(yī)學(xué)中的應(yīng)用研究[D];電子科技大學(xué);2010年
10 王珊珊;知識指導(dǎo)下的數(shù)據(jù)挖掘在新聞和金融工具之間因果關(guān)系上的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識別與評價研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年
2 張彥俊;游戲運(yùn)營中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年
4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺設(shè)計[D];江南大學(xué);2015年
5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年
6 戴陽陽;基于數(shù)據(jù)挖掘的金融時間序列預(yù)測研究與應(yīng)用[D];江南大學(xué);2015年
7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年
8 陳丹;移動互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營銷的設(shè)計與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年
9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識別模型的研究[D];昆明理工大學(xué);2015年
10 位長帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的網(wǎng)購用戶流失預(yù)測研究,由筆耕文化傳播整理發(fā)布。
本文編號:395072
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/395072.html