序列模式挖掘算法在超市O2O營銷中的應用及優(yōu)化研究
發(fā)布時間:2023-04-04 21:21
隨著互聯(lián)網(wǎng)技術的發(fā)展,互聯(lián)網(wǎng)信息呈爆炸式的增長,超市作為典型的傳統(tǒng)零售企業(yè),其發(fā)展從開始的人工數(shù)據(jù)管理模式,已逐漸演變?yōu)槔矛F(xiàn)代信息技術進行O2O營銷管理。而如何運用現(xiàn)有的技術和手段,對超市內(nèi)部的海量數(shù)據(jù)進行深度分析,挖掘出有價值的信息和規(guī)律,并以此作出正確及時的決策,現(xiàn)已成為超市生存和發(fā)展的重要環(huán)節(jié)。數(shù)據(jù)挖掘技術中,序列模式挖掘的目標是從交易數(shù)據(jù)庫中發(fā)現(xiàn)客戶購買行為的序列模式,因此成為了超市O2O營銷的重要抓手。利用序列模式挖掘技術對大量的交易數(shù)據(jù)進行研究和挖掘,可以加速線上與線下資源整合,使商家能以更低的成本高效率地服務客戶、贏得客戶,另外,將挖掘出的知識應用于超市日常的經(jīng)營和管理,可以促進超市的發(fā)展。本文首先利用Python語言對超市O2O營銷產(chǎn)生的數(shù)據(jù)集進行了初步的統(tǒng)計分析,通過年齡、性別、等級、注冊時間等七個維度的分析,了解了超市數(shù)據(jù)的分布情況,其中,會員表所包含的用戶中,大部分為年輕用戶,結合用戶等級與他們的注冊時長可以得出,大體上用戶注冊時間越長,等級就越高;之后基于Hadoop平臺,結合AprioriSome算法的思想,在Hive中利用HiveQL語句對超市的交易數(shù)據(jù)集...
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 O2O模式發(fā)展現(xiàn)狀
1.2.2 序列模式挖掘發(fā)展現(xiàn)狀
1.3 論文的研究內(nèi)容及創(chuàng)新點
1.4 論文的組織結構
2 課題理論基礎及相關技術
2.1 序列模式挖掘
2.1.1 序列模式挖掘簡介
2.1.2 序列模式挖掘算法分類
2.1.3 相關定義
2.1.4 主要性質(zhì)
2.1.5 AprioriSome算法
2.2 Hadoop大數(shù)據(jù)平臺
2.2.1 Hadoop平臺簡介
2.2.2 HDFS分布式文件系統(tǒng)
2.2.3 MapReduce分布式計算框架
2.2.4 Yarn通用資源管理器
2.2.5 Hive工具簡介
2.3 本章小結
3 數(shù)據(jù)預處理及初步統(tǒng)計分析
3.1 數(shù)據(jù)來源及特點分析
3.2 數(shù)據(jù)預處理
3.3 超市數(shù)據(jù)的統(tǒng)計分析
3.3.1 用戶基本信息統(tǒng)計分析
3.3.2 銷售數(shù)據(jù)統(tǒng)計分析
3.4 本章小結
4 基于Hadoop的序列模式挖掘算法的實現(xiàn)
4.1 數(shù)據(jù)來源及數(shù)據(jù)清洗
4.2 Hadoop集群環(huán)境的搭建
4.2.1 硬件環(huán)境
4.2.2 軟件環(huán)境
4.3 實驗過程
4.4 實驗結果分析
4.5 在超市O2O營銷領域的應用
4.6 本章小結
5 序列模式挖掘中AprioriSome算法的改進
5.1 改進算法的基本思想
5.2 實驗過程
5.2.1 實驗環(huán)境
5.2.2 數(shù)據(jù)集
5.2.3 讀取數(shù)據(jù)庫交易數(shù)據(jù)
5.2.4 利用改進算法挖掘序列模式
5.3 實驗結果分析
5.4 算法對比實驗
5.4.1 算法挖掘出的頻繁序列的數(shù)量
5.4.2 算法的運行時間
5.5 本章小結
結論
參考文獻
附錄1 統(tǒng)計類代碼參照表
附錄2 基于Hadoop平臺的實驗結果
攻讀學位期間發(fā)表的學術論文
致謝
本文編號:3782065
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 O2O模式發(fā)展現(xiàn)狀
1.2.2 序列模式挖掘發(fā)展現(xiàn)狀
1.3 論文的研究內(nèi)容及創(chuàng)新點
1.4 論文的組織結構
2 課題理論基礎及相關技術
2.1 序列模式挖掘
2.1.1 序列模式挖掘簡介
2.1.2 序列模式挖掘算法分類
2.1.3 相關定義
2.1.4 主要性質(zhì)
2.1.5 AprioriSome算法
2.2 Hadoop大數(shù)據(jù)平臺
2.2.1 Hadoop平臺簡介
2.2.2 HDFS分布式文件系統(tǒng)
2.2.3 MapReduce分布式計算框架
2.2.4 Yarn通用資源管理器
2.2.5 Hive工具簡介
2.3 本章小結
3 數(shù)據(jù)預處理及初步統(tǒng)計分析
3.1 數(shù)據(jù)來源及特點分析
3.2 數(shù)據(jù)預處理
3.3 超市數(shù)據(jù)的統(tǒng)計分析
3.3.1 用戶基本信息統(tǒng)計分析
3.3.2 銷售數(shù)據(jù)統(tǒng)計分析
3.4 本章小結
4 基于Hadoop的序列模式挖掘算法的實現(xiàn)
4.1 數(shù)據(jù)來源及數(shù)據(jù)清洗
4.2 Hadoop集群環(huán)境的搭建
4.2.1 硬件環(huán)境
4.2.2 軟件環(huán)境
4.3 實驗過程
4.4 實驗結果分析
4.5 在超市O2O營銷領域的應用
4.6 本章小結
5 序列模式挖掘中AprioriSome算法的改進
5.1 改進算法的基本思想
5.2 實驗過程
5.2.1 實驗環(huán)境
5.2.2 數(shù)據(jù)集
5.2.3 讀取數(shù)據(jù)庫交易數(shù)據(jù)
5.2.4 利用改進算法挖掘序列模式
5.3 實驗結果分析
5.4 算法對比實驗
5.4.1 算法挖掘出的頻繁序列的數(shù)量
5.4.2 算法的運行時間
5.5 本章小結
結論
參考文獻
附錄1 統(tǒng)計類代碼參照表
附錄2 基于Hadoop平臺的實驗結果
攻讀學位期間發(fā)表的學術論文
致謝
本文編號:3782065
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3782065.html
最近更新
教材專著