基于異源集成算法的用戶購買行為預測研究
發(fā)布時間:2020-12-18 18:59
隨著電子商務(wù)的飛速發(fā)展和互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的普及,互聯(lián)網(wǎng)用戶信息量與日俱增,F(xiàn)階段,我們已進入信息爆炸的大數(shù)據(jù)時代,“大數(shù)據(jù)”已成為現(xiàn)代社會的重要標志之一。電商大數(shù)據(jù)中用戶對商品的操作行為可以體現(xiàn)用戶偏好,如何從海量真實數(shù)據(jù)中挖掘出用戶的潛在偏好成為學術(shù)界和工業(yè)界的研究重點,而且現(xiàn)今已取得眾多的研究成果。在現(xiàn)有的用戶購買行為預測問題的研究中,未全面考慮多類用戶行為特征及不同行為間的關(guān)系,且集成算法的應(yīng)用以同源集成為主。鑒于此,本文在真實數(shù)據(jù)集上,從五方面構(gòu)建整體用戶行為特征,綜合考慮深度學習的表征學習能力和集成學習的訓練效率,引入多層異源集成算法,將隨機森林(Random Forest,RF)、LightGBM和XGBoost等多種算法進行組合,搭建了基于深度森林和Stacking學習法的多層算法框架,對用戶復購行為和購買日期進行預測。本文主要工作如下:1.在用戶購買預測基礎(chǔ)預備方面,詳細介紹了國內(nèi)外研究現(xiàn)狀及研究成果,對該領(lǐng)域應(yīng)用廣泛的算法模型進行描述,如傳統(tǒng)機器學習算法:邏輯回歸(Logistic Regression,LR)、支持向量機(Support Vector Machine,...
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 推薦算法的發(fā)展
1.2.2 購買行為預測研究現(xiàn)狀
1.3 研究的目的及意義
1.4 研究內(nèi)容與組織結(jié)構(gòu)
第2章 機器學習算法理論基礎(chǔ)
2.1 邏輯回歸
2.2 支持向量機
2.3 隨機森林
2.3.1 決策樹理論基礎(chǔ)
2.3.2 劃分屬性
2.3.3 隨機森林構(gòu)建過程
2.4 梯度提升決策樹
2.4.1 GBDT算法原理
2.4.2 XGBoost & LightGBM提升
2.4.3 LightGBM優(yōu)化
2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.6 深度森林
2.7 Stacking技術(shù)
2.8 本章小結(jié)
第3章 基于時間滑窗的特征構(gòu)建
3.1 數(shù)據(jù)介紹
3.1.1 數(shù)據(jù)來源
3.1.2 數(shù)據(jù)集變量描述
3.2 數(shù)據(jù)分析及特征提取
3.2.1 數(shù)據(jù)可視化描述
3.2.2 特征提取
3.3 數(shù)據(jù)處理
3.4 本章小結(jié)
第4章 基于深度森林的復購預測模型
4.1 模型搭建前的準備工作
4.1.1 模型評估指標
4.1.2 訓練集和測試集構(gòu)建
4.2 深度森林模型
4.2.1 多粒度掃描
4.2.2 級聯(lián)森林
4.3 復購預測模型設(shè)計
4.3.1 深度森林模型介紹
4.3.2 模型選擇及調(diào)參
4.3.3 深度森林算法描述
4.4 實驗分析
4.4.1 實驗環(huán)境
4.4.2 模型超參數(shù)設(shè)置
4.4.3 實驗結(jié)果分析
4.5 本章小結(jié)
第5章 基于Stacking的日期預測模型
5.1 日期預測模型設(shè)計
5.1.1 Stacking結(jié)構(gòu)介紹
5.1.2 模型選擇
5.1.3 算法描述
5.2 實驗設(shè)計
5.2.1 用戶下單日期評價函數(shù)
5.2.2 實驗對比
5.3 本章小節(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)成果和參加的科研項目
學位論文評閱及答辯情況表
【參考文獻】:
期刊論文
[1]基于數(shù)據(jù)稀疏性的協(xié)同過濾推薦算法改進研究[J]. 岳希,唐聃,舒紅平,安義文. 工程科學與技術(shù). 2020(01)
[2]大數(shù)據(jù)個性化推薦分析[J]. 任敏. 物聯(lián)網(wǎng)技術(shù). 2019(11)
[3]基于XGBoost的三分類優(yōu)惠券預測方法[J]. 張微薇,劉盾,賈修一. 南京航空航天大學學報. 2019(05)
[4]1997-2019:電商22周年發(fā)展歷程及未來[J]. 蘇鳴立. 計算機與網(wǎng)絡(luò). 2019(19)
[5]基于深度森林的用戶購買行為預測模型[J]. 葛紹林,葉劍,何明祥. 計算機科學. 2019(09)
[6]基于Xgboost和LightGBM算法預測住房月租金的應(yīng)用分析[J]. 謝勇,項薇,季孟忠,彭俊,黃益槐. 計算機應(yīng)用與軟件. 2019(09)
[7]基于深度LightGBM集成學習模型的谷歌商店顧客購買力預測[J]. 葉志宇,馮愛民,高航. 計算機應(yīng)用. 2019(12)
[8]基于數(shù)據(jù)挖掘的風電功率預測特征選擇方法[J]. 李俊卿,李秋佳,石天宇,郭晉才. 電測與儀表. 2019(10)
[9]基于用戶隱式行為特征的最大熵推薦算法[J]. 胡敏,陳元會,黃宏程. 計算機工程與設(shè)計. 2019(02)
[10]Deep forest[J]. Zhi-Hua Zhou,Ji Feng. National Science Review. 2019(01)
碩士論文
[1]B2B電子商務(wù)平臺系統(tǒng)的設(shè)計與研發(fā)[D]. 李麗君.山東大學 2019
[2]基于用戶聚類和特征選擇的在線購買行為預測研究[D]. 蔡一凡.華中科技大學 2019
[3]基于特征選擇與改進stacking算法的股價預測研究[D]. 陳宇韶.南華大學 2018
[4]基于大數(shù)據(jù)的電子商務(wù)個性化信息推薦服務(wù)模式研究[D]. 胡一.吉林大學 2015
本文編號:2924442
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 推薦算法的發(fā)展
1.2.2 購買行為預測研究現(xiàn)狀
1.3 研究的目的及意義
1.4 研究內(nèi)容與組織結(jié)構(gòu)
第2章 機器學習算法理論基礎(chǔ)
2.1 邏輯回歸
2.2 支持向量機
2.3 隨機森林
2.3.1 決策樹理論基礎(chǔ)
2.3.2 劃分屬性
2.3.3 隨機森林構(gòu)建過程
2.4 梯度提升決策樹
2.4.1 GBDT算法原理
2.4.2 XGBoost & LightGBM提升
2.4.3 LightGBM優(yōu)化
2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.6 深度森林
2.7 Stacking技術(shù)
2.8 本章小結(jié)
第3章 基于時間滑窗的特征構(gòu)建
3.1 數(shù)據(jù)介紹
3.1.1 數(shù)據(jù)來源
3.1.2 數(shù)據(jù)集變量描述
3.2 數(shù)據(jù)分析及特征提取
3.2.1 數(shù)據(jù)可視化描述
3.2.2 特征提取
3.3 數(shù)據(jù)處理
3.4 本章小結(jié)
第4章 基于深度森林的復購預測模型
4.1 模型搭建前的準備工作
4.1.1 模型評估指標
4.1.2 訓練集和測試集構(gòu)建
4.2 深度森林模型
4.2.1 多粒度掃描
4.2.2 級聯(lián)森林
4.3 復購預測模型設(shè)計
4.3.1 深度森林模型介紹
4.3.2 模型選擇及調(diào)參
4.3.3 深度森林算法描述
4.4 實驗分析
4.4.1 實驗環(huán)境
4.4.2 模型超參數(shù)設(shè)置
4.4.3 實驗結(jié)果分析
4.5 本章小結(jié)
第5章 基于Stacking的日期預測模型
5.1 日期預測模型設(shè)計
5.1.1 Stacking結(jié)構(gòu)介紹
5.1.2 模型選擇
5.1.3 算法描述
5.2 實驗設(shè)計
5.2.1 用戶下單日期評價函數(shù)
5.2.2 實驗對比
5.3 本章小節(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)成果和參加的科研項目
學位論文評閱及答辯情況表
【參考文獻】:
期刊論文
[1]基于數(shù)據(jù)稀疏性的協(xié)同過濾推薦算法改進研究[J]. 岳希,唐聃,舒紅平,安義文. 工程科學與技術(shù). 2020(01)
[2]大數(shù)據(jù)個性化推薦分析[J]. 任敏. 物聯(lián)網(wǎng)技術(shù). 2019(11)
[3]基于XGBoost的三分類優(yōu)惠券預測方法[J]. 張微薇,劉盾,賈修一. 南京航空航天大學學報. 2019(05)
[4]1997-2019:電商22周年發(fā)展歷程及未來[J]. 蘇鳴立. 計算機與網(wǎng)絡(luò). 2019(19)
[5]基于深度森林的用戶購買行為預測模型[J]. 葛紹林,葉劍,何明祥. 計算機科學. 2019(09)
[6]基于Xgboost和LightGBM算法預測住房月租金的應(yīng)用分析[J]. 謝勇,項薇,季孟忠,彭俊,黃益槐. 計算機應(yīng)用與軟件. 2019(09)
[7]基于深度LightGBM集成學習模型的谷歌商店顧客購買力預測[J]. 葉志宇,馮愛民,高航. 計算機應(yīng)用. 2019(12)
[8]基于數(shù)據(jù)挖掘的風電功率預測特征選擇方法[J]. 李俊卿,李秋佳,石天宇,郭晉才. 電測與儀表. 2019(10)
[9]基于用戶隱式行為特征的最大熵推薦算法[J]. 胡敏,陳元會,黃宏程. 計算機工程與設(shè)計. 2019(02)
[10]Deep forest[J]. Zhi-Hua Zhou,Ji Feng. National Science Review. 2019(01)
碩士論文
[1]B2B電子商務(wù)平臺系統(tǒng)的設(shè)計與研發(fā)[D]. 李麗君.山東大學 2019
[2]基于用戶聚類和特征選擇的在線購買行為預測研究[D]. 蔡一凡.華中科技大學 2019
[3]基于特征選擇與改進stacking算法的股價預測研究[D]. 陳宇韶.南華大學 2018
[4]基于大數(shù)據(jù)的電子商務(wù)個性化信息推薦服務(wù)模式研究[D]. 胡一.吉林大學 2015
本文編號:2924442
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2924442.html
最近更新
教材專著