線(xiàn)下零售業(yè)數(shù)據(jù)挖掘研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-12-28 13:29
線(xiàn)下零售業(yè)是數(shù)據(jù)挖掘重點(diǎn)關(guān)注的行業(yè),在線(xiàn)下零售業(yè)中有效應(yīng)用大數(shù)據(jù),有利于提升數(shù)據(jù)競(jìng)爭(zhēng)力、精準(zhǔn)洞察顧客需求。線(xiàn)下零售業(yè)一直探索結(jié)合移動(dòng)互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)的道路,但是存在針對(duì)性比較低、缺乏個(gè)性化等問(wèn)題。電商領(lǐng)域中發(fā)展成熟的推薦算法成為電商行業(yè)的主要營(yíng)銷(xiāo)渠道,但是線(xiàn)下零售業(yè)還沒(méi)有成熟的推薦算法來(lái)為客戶(hù)進(jìn)行個(gè)性化推薦。其次,線(xiàn)下零售業(yè)中存在的很多噪聲數(shù)據(jù),也為數(shù)據(jù)挖掘帶來(lái)很大的不便。基于以上問(wèn)題,本課題研究線(xiàn)下零售業(yè)中數(shù)據(jù)挖掘的應(yīng)用,主要包括基于神經(jīng)網(wǎng)絡(luò)的異常檢測(cè)和基于深度自編碼器的推薦算法。異常檢測(cè)部分中,本文研究可處理異構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)異常檢測(cè)模型在線(xiàn)下零售業(yè)異常檢測(cè)中的應(yīng)用。該模型是基于數(shù)據(jù)密度概率統(tǒng)計(jì)方法,根據(jù)自由能作為異常指標(biāo),來(lái)判斷低密度區(qū)域的異常數(shù)據(jù)。它能夠適應(yīng)線(xiàn)下零售中的異構(gòu)數(shù)據(jù),可將用戶(hù)的消費(fèi)次數(shù)、消費(fèi)品牌品類(lèi)數(shù)量、用戶(hù)性別等異構(gòu)類(lèi)型的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)單元的輸入,通過(guò)非監(jiān)督學(xué)習(xí)的方式發(fā)現(xiàn)異常用戶(hù)行為。在線(xiàn)下零售業(yè)數(shù)據(jù)中,用戶(hù)的偏好數(shù)據(jù)和購(gòu)買(mǎi)數(shù)據(jù)矩陣會(huì)非常稀疏,而且線(xiàn)下零售中同樣也存在冷啟動(dòng)的問(wèn)題,這都會(huì)影響推薦的準(zhǔn)確率。為了解決這個(gè)問(wèn)題,本文主要圍繞RFM模型、附加輔助數(shù)據(jù)與...
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
用戶(hù)特征數(shù)據(jù)的2維映射分布圖
?100?200?300?400?500?600??圖3-3?K-mean方法進(jìn)行異常檢測(cè)的聚類(lèi)結(jié)果圖(聚2類(lèi))??圖3-3為根據(jù)K-means聚類(lèi)方法檢測(cè)的結(jié)果,不用通過(guò)數(shù)據(jù)進(jìn)行對(duì)比也能夠??清楚的看出,它將一半左右的正常數(shù)據(jù)歸類(lèi)為異常數(shù)據(jù),顯然準(zhǔn)確度會(huì)很低。???表3-2異常檢測(cè)模型OCSVM和Mv.RBM的結(jié)果對(duì)比???Precision?Recall?F-score??2015?OCSVM?0.2482?1.0?0.3977??Mv.RBM?0.7143?0.7692?0.7407??2016?OCSVM?0.2456?1.0?0.3943??Mv.RBM?0.7175?0.7657?0.7408??表3-2為兩種模型的檢測(cè)準(zhǔn)確度指標(biāo)對(duì)比。從表3-2可以看出,OCSVM模??型的召回率比較高,能夠準(zhǔn)確的找到更多異常數(shù)據(jù),但是準(zhǔn)確率極低,也就是同??時(shí)會(huì)將很多正常數(shù)據(jù)判斷為異常。Mv.RBM的召回率沒(méi)有OCSVM的召回率高,??但是準(zhǔn)確率比較高。Mv.RBM的F值比OCSVM的高很多,由于F-值是準(zhǔn)確率??和召回率的加權(quán)調(diào)和平均,所以在整體表現(xiàn)上來(lái)看,在線(xiàn)下零售業(yè)中的混合型數(shù)??據(jù)中,Mv.RBM模型的異常檢測(cè)能力更強(qiáng)一些。??3.3本章小結(jié)??本章首先介紹了混合變量受限玻爾茲曼機(jī)的相關(guān)研宄工作
為了深入了解aSDAE的性能增益,本階段分析了在不同用戶(hù)分段的性能。??具體來(lái)說(shuō),本實(shí)驗(yàn)構(gòu)建了?8?jìng)(gè)用戶(hù)分段,顯示測(cè)試數(shù)據(jù)中的不同偏好數(shù)量下的表??現(xiàn),如圖4-8。訓(xùn)練數(shù)據(jù)的用戶(hù)分段分布和測(cè)試數(shù)據(jù)是相似的。從中得知對(duì)活躍??用戶(hù)進(jìn)行偏好預(yù)測(cè)的結(jié)果比非活躍用戶(hù)的要好。在所有用戶(hù)分段上,aSDAE優(yōu)??于SDAE,這再次清楚地顯示了輔助數(shù)據(jù)的優(yōu)勢(shì)。??0,?&6?1?>?I?I?I?1?s?1???0?94?.?I?.??Of?I?_??!〇::?I?|?11.??’?_?|?_?|丨?_?_?_?_?‘??|ii?|ii?|:i:?|ii?|i?|ii?|ii?■??DJ?lil?lil?IS?1^1?11?lil?lil?Bij?1??1?2?3?4?5?6?7?8??用戶(hù)活K度<?分組>??圖4-8?aSDAE和SDAE預(yù)測(cè)不同用戶(hù)分段的性能??圖4-7和4-8清楚地表明本文使用的aSDAE模型能夠平滑收斂,并且性能??明顯優(yōu)于對(duì)比的其他方法,包括對(duì)具有不同稀疏級(jí)別的數(shù)據(jù)的不同用戶(hù)分段。這??說(shuō)明本文提出的將RFM模型與aSDAE模型相結(jié)合進(jìn)行偏好預(yù)測(cè)的方法,在線(xiàn)??下零售業(yè)中有較好的表現(xiàn)。??4.3_3?TopN推薦實(shí)驗(yàn)??在向用戶(hù)進(jìn)行粗粒度推薦時(shí)需要用到TopN推薦模型。因此,在這個(gè)實(shí)驗(yàn)中,??將從T〇P-N推薦問(wèn)題出發(fā)
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J]. 戴菲. 電腦知識(shí)與技術(shù). 2011(21)
[2]基于最大頻繁模式挖掘算法進(jìn)行書(shū)目推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 趙麟. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2010(05)
[3]零售業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J]. 張艷輝,李宗偉. 江蘇商論. 2006(03)
碩士論文
[1]蘇寧云商模式發(fā)展戰(zhàn)略研究[D]. 曲笑緣.東北農(nóng)業(yè)大學(xué) 2015
[2]CRM在零售連鎖企業(yè)中的應(yīng)用研究[D]. 于志國(guó).東南大學(xué) 2015
[3]零售企業(yè)會(huì)員消費(fèi)數(shù)據(jù)分析與研究[D]. 謝飛.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2010
本文編號(hào):2943835
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
用戶(hù)特征數(shù)據(jù)的2維映射分布圖
?100?200?300?400?500?600??圖3-3?K-mean方法進(jìn)行異常檢測(cè)的聚類(lèi)結(jié)果圖(聚2類(lèi))??圖3-3為根據(jù)K-means聚類(lèi)方法檢測(cè)的結(jié)果,不用通過(guò)數(shù)據(jù)進(jìn)行對(duì)比也能夠??清楚的看出,它將一半左右的正常數(shù)據(jù)歸類(lèi)為異常數(shù)據(jù),顯然準(zhǔn)確度會(huì)很低。???表3-2異常檢測(cè)模型OCSVM和Mv.RBM的結(jié)果對(duì)比???Precision?Recall?F-score??2015?OCSVM?0.2482?1.0?0.3977??Mv.RBM?0.7143?0.7692?0.7407??2016?OCSVM?0.2456?1.0?0.3943??Mv.RBM?0.7175?0.7657?0.7408??表3-2為兩種模型的檢測(cè)準(zhǔn)確度指標(biāo)對(duì)比。從表3-2可以看出,OCSVM模??型的召回率比較高,能夠準(zhǔn)確的找到更多異常數(shù)據(jù),但是準(zhǔn)確率極低,也就是同??時(shí)會(huì)將很多正常數(shù)據(jù)判斷為異常。Mv.RBM的召回率沒(méi)有OCSVM的召回率高,??但是準(zhǔn)確率比較高。Mv.RBM的F值比OCSVM的高很多,由于F-值是準(zhǔn)確率??和召回率的加權(quán)調(diào)和平均,所以在整體表現(xiàn)上來(lái)看,在線(xiàn)下零售業(yè)中的混合型數(shù)??據(jù)中,Mv.RBM模型的異常檢測(cè)能力更強(qiáng)一些。??3.3本章小結(jié)??本章首先介紹了混合變量受限玻爾茲曼機(jī)的相關(guān)研宄工作
為了深入了解aSDAE的性能增益,本階段分析了在不同用戶(hù)分段的性能。??具體來(lái)說(shuō),本實(shí)驗(yàn)構(gòu)建了?8?jìng)(gè)用戶(hù)分段,顯示測(cè)試數(shù)據(jù)中的不同偏好數(shù)量下的表??現(xiàn),如圖4-8。訓(xùn)練數(shù)據(jù)的用戶(hù)分段分布和測(cè)試數(shù)據(jù)是相似的。從中得知對(duì)活躍??用戶(hù)進(jìn)行偏好預(yù)測(cè)的結(jié)果比非活躍用戶(hù)的要好。在所有用戶(hù)分段上,aSDAE優(yōu)??于SDAE,這再次清楚地顯示了輔助數(shù)據(jù)的優(yōu)勢(shì)。??0,?&6?1?>?I?I?I?1?s?1???0?94?.?I?.??Of?I?_??!〇::?I?|?11.??’?_?|?_?|丨?_?_?_?_?‘??|ii?|ii?|:i:?|ii?|i?|ii?|ii?■??DJ?lil?lil?IS?1^1?11?lil?lil?Bij?1??1?2?3?4?5?6?7?8??用戶(hù)活K度<?分組>??圖4-8?aSDAE和SDAE預(yù)測(cè)不同用戶(hù)分段的性能??圖4-7和4-8清楚地表明本文使用的aSDAE模型能夠平滑收斂,并且性能??明顯優(yōu)于對(duì)比的其他方法,包括對(duì)具有不同稀疏級(jí)別的數(shù)據(jù)的不同用戶(hù)分段。這??說(shuō)明本文提出的將RFM模型與aSDAE模型相結(jié)合進(jìn)行偏好預(yù)測(cè)的方法,在線(xiàn)??下零售業(yè)中有較好的表現(xiàn)。??4.3_3?TopN推薦實(shí)驗(yàn)??在向用戶(hù)進(jìn)行粗粒度推薦時(shí)需要用到TopN推薦模型。因此,在這個(gè)實(shí)驗(yàn)中,??將從T〇P-N推薦問(wèn)題出發(fā)
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J]. 戴菲. 電腦知識(shí)與技術(shù). 2011(21)
[2]基于最大頻繁模式挖掘算法進(jìn)行書(shū)目推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 趙麟. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2010(05)
[3]零售業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J]. 張艷輝,李宗偉. 江蘇商論. 2006(03)
碩士論文
[1]蘇寧云商模式發(fā)展戰(zhàn)略研究[D]. 曲笑緣.東北農(nóng)業(yè)大學(xué) 2015
[2]CRM在零售連鎖企業(yè)中的應(yīng)用研究[D]. 于志國(guó).東南大學(xué) 2015
[3]零售企業(yè)會(huì)員消費(fèi)數(shù)據(jù)分析與研究[D]. 謝飛.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2010
本文編號(hào):2943835
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2943835.html
最近更新
教材專(zhuān)著