基于聚類的社區(qū)新零售電商用戶精準(zhǔn)營銷研究
發(fā)布時(shí)間:2021-02-25 05:29
收集某社區(qū)新零售電商平臺(tái)用戶消費(fèi)數(shù)據(jù),并對(duì)K-means聚類算法進(jìn)行優(yōu)化。通過運(yùn)用優(yōu)化的K-means++算法對(duì)消費(fèi)數(shù)據(jù)進(jìn)行聚類分析,根據(jù)分析結(jié)果探討客戶細(xì)分方法,構(gòu)成不同種類消費(fèi)者的用戶畫像,從而針對(duì)性地制定精準(zhǔn)營銷策略,為該社區(qū)新零售電商平臺(tái)的營銷發(fā)展提供建議。
【文章來源】:山西科技. 2020,35(06)
【文章頁數(shù)】:5 頁
【部分圖文】:
肘部法則
圖2 肘部法則(3)第2類:高訂單頻率、高消費(fèi)總額——高單筆消費(fèi)金額。根據(jù)聚類結(jié)果結(jié)合樣本數(shù)據(jù)得知,此類消費(fèi)者的畫像特征為:31歲左右的高學(xué)歷、高收入群體。消費(fèi)特征為購買頻率高且消費(fèi)金額多、購買力強(qiáng)、偏愛進(jìn)口商品。此類消費(fèi)者職業(yè)多為企業(yè)或單位管理人員、白領(lǐng)以及個(gè)別個(gè)體商戶。大多數(shù)工作穩(wěn)定,收入較高,且多已婚育。消費(fèi)商品維度較廣,從日用家居、廚衛(wèi)電器到家政服務(wù)、母嬰用品都有較高的消費(fèi)需求。此類消費(fèi)者雖然數(shù)量較少,但消費(fèi)頻率高、消費(fèi)金額大,且忠誠度高。相比于折扣,此類消費(fèi)者更注重產(chǎn)品和服務(wù)的品質(zhì)。
在K-means聚類算法中,數(shù)據(jù)集的細(xì)分程度會(huì)隨著k值的增大而更加明顯,同時(shí),每個(gè)簇內(nèi)的誤差平方和(SSE)將隨之減小。當(dāng)k值小于最佳聚類數(shù)時(shí),其值每次增加都會(huì)導(dǎo)致簇間聚合程度大幅增長,數(shù)據(jù)集的平均誤差平方和隨之大幅下降。當(dāng)k到達(dá)最佳聚類數(shù)時(shí),k值的增加所得到的聚合程度回報(bào)會(huì)迅速變小,SSE的下降幅度驟減并隨著k值的繼續(xù)增大而趨于平緩。將肘部法則的特性用圖像表示。在sklearn中調(diào)用SSE.append函數(shù)計(jì)算每個(gè)k值對(duì)應(yīng)的SSE值,以k值為橫坐標(biāo),SSE值為縱坐標(biāo)構(gòu)建直角坐標(biāo)系(如圖2所示)。在圖2中,圖像畸變效果改善最大的位置為k=4,即肘部,也就是本研究中所需要的最優(yōu)k值。因此認(rèn)定上文計(jì)算輪廓系數(shù)后得到k=4為最優(yōu)值的結(jié)果合理。針對(duì)初始聚類中心隨機(jī)設(shè)定的劣勢,本文使用Scikit-learn環(huán)境中的sklearn.cluster_KMeans函數(shù),并init調(diào)用此函數(shù)中的“K-means++”參數(shù)。
【參考文獻(xiàn)】:
碩士論文
[1]基于機(jī)器學(xué)習(xí)的高速鐵路無線信道多徑分量聚簇研究[D]. 楊之峰.北京交通大學(xué) 2019
[2]基于輪廓系數(shù)的層次聚類算法研究[D]. 張冬梅.燕山大學(xué) 2010
本文編號(hào):3050516
【文章來源】:山西科技. 2020,35(06)
【文章頁數(shù)】:5 頁
【部分圖文】:
肘部法則
圖2 肘部法則(3)第2類:高訂單頻率、高消費(fèi)總額——高單筆消費(fèi)金額。根據(jù)聚類結(jié)果結(jié)合樣本數(shù)據(jù)得知,此類消費(fèi)者的畫像特征為:31歲左右的高學(xué)歷、高收入群體。消費(fèi)特征為購買頻率高且消費(fèi)金額多、購買力強(qiáng)、偏愛進(jìn)口商品。此類消費(fèi)者職業(yè)多為企業(yè)或單位管理人員、白領(lǐng)以及個(gè)別個(gè)體商戶。大多數(shù)工作穩(wěn)定,收入較高,且多已婚育。消費(fèi)商品維度較廣,從日用家居、廚衛(wèi)電器到家政服務(wù)、母嬰用品都有較高的消費(fèi)需求。此類消費(fèi)者雖然數(shù)量較少,但消費(fèi)頻率高、消費(fèi)金額大,且忠誠度高。相比于折扣,此類消費(fèi)者更注重產(chǎn)品和服務(wù)的品質(zhì)。
在K-means聚類算法中,數(shù)據(jù)集的細(xì)分程度會(huì)隨著k值的增大而更加明顯,同時(shí),每個(gè)簇內(nèi)的誤差平方和(SSE)將隨之減小。當(dāng)k值小于最佳聚類數(shù)時(shí),其值每次增加都會(huì)導(dǎo)致簇間聚合程度大幅增長,數(shù)據(jù)集的平均誤差平方和隨之大幅下降。當(dāng)k到達(dá)最佳聚類數(shù)時(shí),k值的增加所得到的聚合程度回報(bào)會(huì)迅速變小,SSE的下降幅度驟減并隨著k值的繼續(xù)增大而趨于平緩。將肘部法則的特性用圖像表示。在sklearn中調(diào)用SSE.append函數(shù)計(jì)算每個(gè)k值對(duì)應(yīng)的SSE值,以k值為橫坐標(biāo),SSE值為縱坐標(biāo)構(gòu)建直角坐標(biāo)系(如圖2所示)。在圖2中,圖像畸變效果改善最大的位置為k=4,即肘部,也就是本研究中所需要的最優(yōu)k值。因此認(rèn)定上文計(jì)算輪廓系數(shù)后得到k=4為最優(yōu)值的結(jié)果合理。針對(duì)初始聚類中心隨機(jī)設(shè)定的劣勢,本文使用Scikit-learn環(huán)境中的sklearn.cluster_KMeans函數(shù),并init調(diào)用此函數(shù)中的“K-means++”參數(shù)。
【參考文獻(xiàn)】:
碩士論文
[1]基于機(jī)器學(xué)習(xí)的高速鐵路無線信道多徑分量聚簇研究[D]. 楊之峰.北京交通大學(xué) 2019
[2]基于輪廓系數(shù)的層次聚類算法研究[D]. 張冬梅.燕山大學(xué) 2010
本文編號(hào):3050516
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/3050516.html
最近更新
教材專著