基于數(shù)據(jù)挖掘的某電商商品銷售研究
發(fā)布時間:2021-08-23 10:17
在電子商務(wù)環(huán)境下,企業(yè)競爭日趨激烈,要想在市場占據(jù)有利地位,需要對商品競爭力進行準確的預(yù)測與判斷,合理的預(yù)測不僅將帶來巨大的經(jīng)濟效益,也會保持市場的穩(wěn)定發(fā)展。商品組合與銷量預(yù)測問題是電子商務(wù)的核心內(nèi)容。如基于用戶已購買商品向其推薦可能購買的商品,從而促進商品銷售;商品銷售預(yù)測使公司能夠做出明智的業(yè)務(wù)決策并預(yù)測短期和長期業(yè)績。本文以電商店鋪銷售數(shù)據(jù)、訂單數(shù)據(jù)為研究對象,探究店鋪商品組合與未來銷量,主要研究內(nèi)容如下:(1)復(fù)購率體現(xiàn)商品或服務(wù)的用戶黏性,對于企業(yè)而言尤其重要,探究商品復(fù)購率的強影響因素,對于促進商品銷售、銷量預(yù)測都存在關(guān)鍵意義。首先對數(shù)值進行聚類,對聚類后的各類別使用逐步回歸篩選最優(yōu)變量并擬合泊松回歸模型,探討案例中不同商品的復(fù)購率與對復(fù)購率起強影響作用因素關(guān)系。(2)商品組合搭配具有廣泛應(yīng)用,如基于用戶已購買商品向其推薦可能購買的商品,從而促進商品銷售。使用關(guān)聯(lián)規(guī)則、基于關(guān)聯(lián)規(guī)則與遺傳算法的商品組合方法以及引入復(fù)購情況作為商品組合模式評分改進的協(xié)同過濾算法以探究商品組合搭配。(3)為了預(yù)測商品銷量,結(jié)合BP神經(jīng)網(wǎng)絡(luò)、LSTM神經(jīng)網(wǎng)絡(luò)、Verhulst灰色模型三種算法的優(yōu)點...
【文章來源】:青島大學山東省
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
自變量相關(guān)系數(shù)圖
青島大學碩士學士論文10應(yīng)注意變量之間的相關(guān)關(guān)系。圖2.1自變量相關(guān)系數(shù)圖2、泊松回歸特征分析前文已提到不同商品間復(fù)購頻數(shù)特異性極強,無法擬合一個統(tǒng)一的泊松回歸模型,因此使用聚類分析分類,對聚類后結(jié)果擬合泊松回歸模型,更有利于響應(yīng)變量月復(fù)購頻數(shù)的預(yù)測。使用肘部法則確定最佳聚類數(shù)目,由圖2.2看出,當k取到3時,平均畸變程度的改善效果不斷減弱。因此最終將數(shù)據(jù)劃分為3類。圖2.2肘部法則圖
青島大學碩士學士論文12泊松回歸擬合方式如下:對于收集到的響應(yīng)變量-自變量數(shù)據(jù),首先根據(jù)數(shù)據(jù)集進行K-means聚類,得到各類別數(shù)據(jù)集;將各類數(shù)據(jù)集中分類變量轉(zhuǎn)換為虛擬變量,對變量進行逐步回歸,篩選出最優(yōu)變量集合;將數(shù)值按0.85:0.15的比例選取訓練集與測試集,采用各類別特有的最優(yōu)變量擬合泊松回歸模型,使用十折交叉驗證和統(tǒng)計量RMSE測試模型精確度;最終利用各類模型進行復(fù)購頻數(shù)預(yù)測。(1)聚類一結(jié)果經(jīng)過逐步回歸,聚類一最終篩選出的預(yù)測變量為:月購買數(shù)量、是否活動、活動次數(shù)、直徑、著色內(nèi)徑、著色外徑、季度與花色。利用月復(fù)購頻數(shù)與最終篩選出的預(yù)測變量擬合泊松回歸模型,按0.85:0.15的比例抽取出訓練集與測試集,并對訓練集進行十折交叉驗證探究模型精確度,十折平均RMSE結(jié)果為6.150821,證明該泊松回歸模型精確度較好。利用該泊松回歸模型對測試集進行預(yù)測,預(yù)測值及其與真值的絕對誤差見圖2.3,預(yù)測的RMSE與MAE結(jié)果見表2.9,從表2.9看出,該回歸模型對應(yīng)的RMSE、MAE較小,由圖2.3可以看出,該回歸模型對于極值點預(yù)測能力一般,絕對誤差較大,但整體而言該回歸模型預(yù)測結(jié)果表現(xiàn)較好。表2.9聚類一回歸模型預(yù)測能力指標統(tǒng)計類別RMSE結(jié)果MAE結(jié)果16.1691832.411765圖2.3聚類一泊松回歸預(yù)測絕對誤差結(jié)果圖
【參考文獻】:
期刊論文
[1]卷煙銷量組合預(yù)測模型研究[J]. 吳明山,王冰,起亞寧,鄭飄. 中國煙草學報. 2019(03)
[2]基于時間序列的商店商品連續(xù)時期的銷量預(yù)測及分析[J]. 趙伊婷. 科技經(jīng)濟導(dǎo)刊. 2018(33)
[3]基于ARMA模型的農(nóng)產(chǎn)品電商銷售額分析與預(yù)測——來自隴南市數(shù)據(jù)的Eviews8.0實證[J]. 王勝青. 甘肅高師學報. 2017(09)
[4]基于關(guān)聯(lián)規(guī)則的電商產(chǎn)品組合銷售熱點研究[J]. 劉玉林. 浙江理工大學學報(社會科學版). 2016(06)
[5]基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)店銷售預(yù)測模型研究[J]. 翁瑩晶,馮慧斌. 閩江學院學報. 2016(05)
[6]基于深度學習的線上農(nóng)產(chǎn)品銷量預(yù)測模型研究[J]. 劉晶,和述群,朱清香,安雅程,許楠,劉凱. 計算機應(yīng)用研究. 2017(08)
[7]基于灰色理論與RBF算法的電子商務(wù)交易額預(yù)測研究[J]. 李洪磊,王德闖. 物流科技. 2016(06)
[8]基于用戶特征和商品特征的組合協(xié)同過濾算法[J]. 孟慶慶,張勝男,盧楚雍. 軟件導(dǎo)刊. 2015(03)
[9]基于R語言的Apriori算法在挖掘商品交易數(shù)據(jù)中的應(yīng)用[J]. 趙北庚. 電腦編程技巧與維護. 2015(02)
[10]基于關(guān)聯(lián)分析的多目標商品組合選擇方法[J]. 張志宏,寇紀淞,陳富贊,李敏強. 系統(tǒng)工程學報. 2011(01)
碩士論文
[1]基于LSTM神經(jīng)網(wǎng)絡(luò)的電商需求預(yù)測的研究[D]. 王淵明.山東大學 2018
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的電商數(shù)據(jù)深度挖掘[D]. 釗魁.浙江大學 2017
本文編號:3357675
【文章來源】:青島大學山東省
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
自變量相關(guān)系數(shù)圖
青島大學碩士學士論文10應(yīng)注意變量之間的相關(guān)關(guān)系。圖2.1自變量相關(guān)系數(shù)圖2、泊松回歸特征分析前文已提到不同商品間復(fù)購頻數(shù)特異性極強,無法擬合一個統(tǒng)一的泊松回歸模型,因此使用聚類分析分類,對聚類后結(jié)果擬合泊松回歸模型,更有利于響應(yīng)變量月復(fù)購頻數(shù)的預(yù)測。使用肘部法則確定最佳聚類數(shù)目,由圖2.2看出,當k取到3時,平均畸變程度的改善效果不斷減弱。因此最終將數(shù)據(jù)劃分為3類。圖2.2肘部法則圖
青島大學碩士學士論文12泊松回歸擬合方式如下:對于收集到的響應(yīng)變量-自變量數(shù)據(jù),首先根據(jù)數(shù)據(jù)集進行K-means聚類,得到各類別數(shù)據(jù)集;將各類數(shù)據(jù)集中分類變量轉(zhuǎn)換為虛擬變量,對變量進行逐步回歸,篩選出最優(yōu)變量集合;將數(shù)值按0.85:0.15的比例選取訓練集與測試集,采用各類別特有的最優(yōu)變量擬合泊松回歸模型,使用十折交叉驗證和統(tǒng)計量RMSE測試模型精確度;最終利用各類模型進行復(fù)購頻數(shù)預(yù)測。(1)聚類一結(jié)果經(jīng)過逐步回歸,聚類一最終篩選出的預(yù)測變量為:月購買數(shù)量、是否活動、活動次數(shù)、直徑、著色內(nèi)徑、著色外徑、季度與花色。利用月復(fù)購頻數(shù)與最終篩選出的預(yù)測變量擬合泊松回歸模型,按0.85:0.15的比例抽取出訓練集與測試集,并對訓練集進行十折交叉驗證探究模型精確度,十折平均RMSE結(jié)果為6.150821,證明該泊松回歸模型精確度較好。利用該泊松回歸模型對測試集進行預(yù)測,預(yù)測值及其與真值的絕對誤差見圖2.3,預(yù)測的RMSE與MAE結(jié)果見表2.9,從表2.9看出,該回歸模型對應(yīng)的RMSE、MAE較小,由圖2.3可以看出,該回歸模型對于極值點預(yù)測能力一般,絕對誤差較大,但整體而言該回歸模型預(yù)測結(jié)果表現(xiàn)較好。表2.9聚類一回歸模型預(yù)測能力指標統(tǒng)計類別RMSE結(jié)果MAE結(jié)果16.1691832.411765圖2.3聚類一泊松回歸預(yù)測絕對誤差結(jié)果圖
【參考文獻】:
期刊論文
[1]卷煙銷量組合預(yù)測模型研究[J]. 吳明山,王冰,起亞寧,鄭飄. 中國煙草學報. 2019(03)
[2]基于時間序列的商店商品連續(xù)時期的銷量預(yù)測及分析[J]. 趙伊婷. 科技經(jīng)濟導(dǎo)刊. 2018(33)
[3]基于ARMA模型的農(nóng)產(chǎn)品電商銷售額分析與預(yù)測——來自隴南市數(shù)據(jù)的Eviews8.0實證[J]. 王勝青. 甘肅高師學報. 2017(09)
[4]基于關(guān)聯(lián)規(guī)則的電商產(chǎn)品組合銷售熱點研究[J]. 劉玉林. 浙江理工大學學報(社會科學版). 2016(06)
[5]基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)店銷售預(yù)測模型研究[J]. 翁瑩晶,馮慧斌. 閩江學院學報. 2016(05)
[6]基于深度學習的線上農(nóng)產(chǎn)品銷量預(yù)測模型研究[J]. 劉晶,和述群,朱清香,安雅程,許楠,劉凱. 計算機應(yīng)用研究. 2017(08)
[7]基于灰色理論與RBF算法的電子商務(wù)交易額預(yù)測研究[J]. 李洪磊,王德闖. 物流科技. 2016(06)
[8]基于用戶特征和商品特征的組合協(xié)同過濾算法[J]. 孟慶慶,張勝男,盧楚雍. 軟件導(dǎo)刊. 2015(03)
[9]基于R語言的Apriori算法在挖掘商品交易數(shù)據(jù)中的應(yīng)用[J]. 趙北庚. 電腦編程技巧與維護. 2015(02)
[10]基于關(guān)聯(lián)分析的多目標商品組合選擇方法[J]. 張志宏,寇紀淞,陳富贊,李敏強. 系統(tǒng)工程學報. 2011(01)
碩士論文
[1]基于LSTM神經(jīng)網(wǎng)絡(luò)的電商需求預(yù)測的研究[D]. 王淵明.山東大學 2018
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的電商數(shù)據(jù)深度挖掘[D]. 釗魁.浙江大學 2017
本文編號:3357675
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/3357675.html
最近更新
教材專著