基于Hadoop的企業(yè)營銷系統(tǒng)銷售預(yù)測的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于Hadoop的企業(yè)營銷系統(tǒng)銷售預(yù)測的研究與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著近年來互聯(lián)網(wǎng)的發(fā)展與其在企業(yè)中的應(yīng)用,不僅加速了各個新興產(chǎn)業(yè)的發(fā)展,也為各個企業(yè)帶來了機(jī)遇與挑戰(zhàn)。企業(yè)擁有大量的營銷數(shù)據(jù)和客戶信息,這些信息的累積并對其挖掘?yàn)槠髽I(yè)提供了有效的營銷途徑。隨著時間的推移,企業(yè)的營銷數(shù)據(jù)日益龐大,已經(jīng)達(dá)到TB級別。企業(yè)最初搭建的硬件設(shè)備和軟件并不具有存儲和處理海量數(shù)據(jù)的能力,這樣會就導(dǎo)致有價(jià)值的信息無法提取出來。利用這些營銷數(shù)據(jù)建立模型可以挖掘出企業(yè)經(jīng)營關(guān)心的有用信息,企業(yè)再根據(jù)這些信息來制定營銷策略。銷售預(yù)測是根據(jù)歷史銷售情況推測未來,是企業(yè)確定生產(chǎn)量,保證商品供銷平衡的工具,可以幫助企業(yè)做出正確的經(jīng)營決策使其實(shí)現(xiàn)利潤最大化。本文構(gòu)建了基于Hadoop的企業(yè)營銷系統(tǒng),實(shí)現(xiàn)海量數(shù)據(jù)的存儲、清洗和處理,并且研究了企業(yè)銷售預(yù)測模型,在ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上建立了組合預(yù)測模型,將其應(yīng)用到企業(yè)營銷系統(tǒng)中,為企業(yè)提供營銷策略支持。具體研究內(nèi)容如下:1)針對企業(yè)營銷數(shù)據(jù)具有數(shù)據(jù)結(jié)構(gòu)復(fù)雜,數(shù)據(jù)規(guī)模龐大,數(shù)據(jù)間關(guān)聯(lián)性大等特點(diǎn),提出了構(gòu)建企業(yè)Hadoop數(shù)據(jù)處理平臺,設(shè)計(jì)并實(shí)現(xiàn)了Map Reduce計(jì)算模型對關(guān)系型數(shù)據(jù)的并行計(jì)算,解決了企業(yè)對海量數(shù)據(jù)的分布式存儲和處理的問題。2)由于企業(yè)營銷數(shù)據(jù)來源多樣,海量數(shù)據(jù)中存在很多缺失,錯誤,不一致和冗余數(shù)據(jù),本文分析其產(chǎn)生原因和存在形式,設(shè)計(jì)了針對系統(tǒng)中“臟數(shù)據(jù)”的清洗方法,并對Bloom Filter算法進(jìn)行改進(jìn),提出并實(shí)現(xiàn)了基于樹形結(jié)構(gòu)的Bloom Filter算法對重復(fù)數(shù)據(jù)進(jìn)行清洗。3)為了進(jìn)一步提高銷售預(yù)測的精度,本系統(tǒng)集成了多個銷售分析模型,并提出了基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型的組合預(yù)測模型,并用MAE、RMSE和MAPE預(yù)測評價(jià)標(biāo)準(zhǔn)對組合預(yù)測模型與單一的ARIMA預(yù)測模型和BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果進(jìn)行對比分析,證明組合預(yù)測模型優(yōu)于單一模型。4)根據(jù)企業(yè)營銷的實(shí)際情況,結(jié)合本文研究的銷售預(yù)測模型,設(shè)計(jì)、實(shí)現(xiàn)并部署了基于Hadoop的企業(yè)營銷系統(tǒng),使企業(yè)銷售分析不再依托于SAP或ERP系統(tǒng),擁有專業(yè)的營銷系統(tǒng)進(jìn)行銷售分析,為企業(yè)決策提供有效的信息支持。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 數(shù)據(jù)清洗 Hadoop MapReduce HDFS ARIMA預(yù)測模型 BP神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.52
【目錄】:
- 摘要4-6
- Abstract6-11
- 第一章 緒論11-16
- 1.1 研究背景、意義11-12
- 1.2 研究現(xiàn)狀12-14
- 1.2.1 Hadoop的研究現(xiàn)狀12-13
- 1.2.2 海量數(shù)據(jù)存儲的研究現(xiàn)狀13
- 1.2.3 銷售預(yù)測組合模型研究現(xiàn)狀13-14
- 1.3 研究內(nèi)容14-15
- 1.4 本文組織結(jié)構(gòu)15-16
- 第二章 Hadoop技術(shù)架構(gòu)研究16-26
- 2.1 Hadoop的組件和基本功能16-17
- 2.2 Hadoop分布式文件系統(tǒng)17-20
- 2.2.1 HDFS體系結(jié)構(gòu)17-19
- 2.2.2 數(shù)據(jù)可靠性保證策略19-20
- 2.3 MapReduce并行計(jì)算框架20-24
- 2.3.1 MapReduce作業(yè)運(yùn)行機(jī)制21-24
- 2.3.2 MapReduce容錯機(jī)制24
- 2.4 Hadoop與關(guān)系型數(shù)據(jù)庫協(xié)同工作的可行性分析24-25
- 2.5 本章小結(jié)25-26
- 第三章 海量數(shù)據(jù)的清洗與處理26-38
- 3.1 數(shù)據(jù)采集26
- 3.2 數(shù)據(jù)清洗26-33
- 3.2.1 數(shù)據(jù)清洗概述26-28
- 3.2.2 屬性清洗方法28-29
- 3.2.3 基于樹形結(jié)構(gòu)的Bloom Filter的重復(fù)記錄清洗29-33
- 3.3 Hadoop與關(guān)系數(shù)據(jù)庫協(xié)作33-34
- 3.4 基于MapReduce編程模型的數(shù)據(jù)加工34-37
- 3.4.1 數(shù)據(jù)準(zhǔn)備34-35
- 3.4.2 Map階段數(shù)據(jù)處理過程35-36
- 3.4.3 Reduce階段數(shù)據(jù)處理過程36-37
- 3.5 本章小結(jié)37-38
- 第四章 企業(yè)銷售預(yù)測模型的研究與建立38-54
- 4.1 數(shù)據(jù)分析與模型選取38
- 4.2 ARIMA銷售預(yù)測模型38-44
- 4.2.1 時間序列分析38-39
- 4.2.2 ARIMA模型概述39
- 4.2.3 建立基于ARIMA的銷售預(yù)測模型39-44
- 4.3 基于人工神經(jīng)網(wǎng)絡(luò)的銷售預(yù)測模型44-49
- 4.3.1 BP神經(jīng)網(wǎng)絡(luò)模型概述44-45
- 4.3.2 建立BP神經(jīng)網(wǎng)絡(luò)的銷售預(yù)測模型45-49
- 4.4 組合預(yù)測模型49-51
- 4.4.1 單一模型在銷售預(yù)測上的局限性49
- 4.4.2 基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)的組合模型原理49-50
- 4.4.3 建立基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型50-51
- 4.5 預(yù)測結(jié)果對比及模型評價(jià)51-53
- 4.6 本章小結(jié)53-54
- 第五章 基于Hadoop的企業(yè)營銷系統(tǒng)設(shè)計(jì)54-61
- 5.1 系統(tǒng)總體設(shè)計(jì)方案54-56
- 5.1.1 系統(tǒng)體系結(jié)構(gòu)54-55
- 5.1.2 系統(tǒng)技術(shù)架構(gòu)55-56
- 5.2 基于Hadoop的數(shù)據(jù)處理平臺搭建56-58
- 5.2.1 拓?fù)浣Y(jié)構(gòu)56-57
- 5.2.2 環(huán)境搭建57-58
- 5.3 銷售預(yù)測在系統(tǒng)中的實(shí)現(xiàn)58-60
- 5.4 本章總結(jié)60-61
- 第六章 總結(jié)與展望61-63
- 6.1 全文總結(jié)61-62
- 6.2 研究展望62-63
- 參考文獻(xiàn)63-66
- 致謝66-67
- 攻讀學(xué)位期間的研究成果67
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李霞;;基于神經(jīng)網(wǎng)絡(luò)的銷售預(yù)測研究[J];中國高新技術(shù)企業(yè);2010年34期
2 劉德玲;;大區(qū)域內(nèi)藥品銷售預(yù)測方法研究與仿真[J];計(jì)算機(jī)仿真;2012年07期
3 邰麗君;胡如夫;趙韓;陳曹維;;改進(jìn)遺傳神經(jīng)網(wǎng)絡(luò)算法在銷售預(yù)測中的應(yīng)用研究[J];現(xiàn)代圖書情報(bào)技術(shù);2012年01期
4 朱衛(wèi)華,唐向宏,張福洪;小波分析在短期銷售預(yù)測中的應(yīng)用[J];杭州電子科技大學(xué)學(xué)報(bào);2005年01期
5 王平,明哲,王艷紅;汽車行業(yè)銷售預(yù)測系統(tǒng)的分析、設(shè)計(jì)與實(shí)施[J];情報(bào)科學(xué);2001年02期
6 鳳德偉,張忠能,凌君逸;基于神經(jīng)網(wǎng)絡(luò)的短期銷售預(yù)測[J];計(jì)算機(jī)工程;2004年S1期
7 閆博;李國和;黎旭;;基于ARMA的銷售預(yù)測方法與系統(tǒng)實(shí)現(xiàn)[J];計(jì)算機(jī)與現(xiàn)代化;2014年05期
8 盛魁;;RBF神經(jīng)網(wǎng)絡(luò)在藥品銷售預(yù)測中的應(yīng)用[J];長江大學(xué)學(xué)報(bào)(自科版);2013年19期
9 徐曦;遭遇無“沸點(diǎn)”的CRM市場[J];電子商務(wù)世界;2003年07期
10 木易;1994年美國多媒體出版物銷售預(yù)測[J];出版參考;1994年18期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 李弘;婁青;;銷售預(yù)測審計(jì)量表開發(fā)和應(yīng)用研究[A];中國市場學(xué)會2006年年會暨第四次全國會員代表大會論文集[C];2006年
中國重要報(bào)紙全文數(shù)據(jù)庫 前6條
1 謝天武 編譯;英國出版商嘗試開發(fā)銷售預(yù)測系統(tǒng)[N];中國圖書商報(bào);2006年
2 錦紅;零售規(guī)劃系統(tǒng)顯威[N];中國商報(bào);2001年
3 ;零售規(guī)劃系統(tǒng)顯威[N];中華工商時報(bào);2000年
4 通訊員 胡芳;東航河北分公司各單位降本增效在行動[N];中國民航報(bào);2009年
5 傅安國;新產(chǎn)品短命6個原因[N];市場報(bào);2001年
6 本報(bào)記者 趙曦;“雙11”臨近 傳統(tǒng)企業(yè)“觸電”渠道融合[N];消費(fèi)日報(bào);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李巍巍;無偏灰色馬爾科夫優(yōu)化模型及其在商品銷售預(yù)測中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2015年
2 石鶴群;面向產(chǎn)品生命周期的ARMA銷售預(yù)測模型設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2014年
3 高文蘭;ISP亞太北區(qū)銷售預(yù)測管理優(yōu)化研究[D];華南理工大學(xué);2015年
4 徐玨;基于Hadoop的企業(yè)營銷系統(tǒng)銷售預(yù)測的研究與實(shí)現(xiàn)[D];浙江理工大學(xué);2016年
5 孫利輝;基于灰色理論的服裝銷售預(yù)測及庫存優(yōu)化研究[D];浙江理工大學(xué);2016年
6 婁青;銷售預(yù)測審計(jì)量表開發(fā)和應(yīng)用研究[D];大連理工大學(xué);2006年
7 奚偉;電磁閥及天然氣控制系統(tǒng)的銷售預(yù)測[D];上海交通大學(xué);2013年
8 王剛;支持向量回歸機(jī)在藥品銷售預(yù)測中的分析及應(yīng)用[D];云南財(cái)經(jīng)大學(xué);2010年
9 宋英超;基于數(shù)據(jù)挖掘的銷售預(yù)測決策支持系統(tǒng)研究[D];中國海洋大學(xué);2005年
10 胡立磊;基于供應(yīng)鏈的銷售預(yù)測研究[D];江蘇大學(xué);2008年
本文關(guān)鍵詞:基于Hadoop的企業(yè)營銷系統(tǒng)銷售預(yù)測的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:363510
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/363510.html