基于改進(jìn)ML-KNN算法的網(wǎng)絡(luò)零售用戶細(xì)分問(wèn)題研究
發(fā)布時(shí)間:2019-09-28 04:56
【摘要】:隨著網(wǎng)絡(luò)零售的不斷發(fā)展,網(wǎng)絡(luò)零售市場(chǎng)從賣家導(dǎo)向市場(chǎng),正逐漸轉(zhuǎn)向買家導(dǎo)向市場(chǎng)。以往網(wǎng)絡(luò)零售商家更多地依賴價(jià)格優(yōu)惠和流量紅利實(shí)現(xiàn)銷量增長(zhǎng)和利潤(rùn)的增加,然而,一方面,網(wǎng)絡(luò)零售賣家競(jìng)爭(zhēng)加劇,吸引新顧客的成本不斷上升;另一方面,消費(fèi)者獲取價(jià)格比對(duì)信息更加容易,更容易受到價(jià)格的優(yōu)惠誘惑,也更加容易流失,留住老顧客更加困難。所以,如何對(duì)用戶進(jìn)行進(jìn)一步的用戶細(xì)分,有針對(duì)性的識(shí)別用戶特征,對(duì)用戶提出更加精準(zhǔn)的營(yíng)銷策略,是網(wǎng)絡(luò)零售賣家關(guān)注的一個(gè)重點(diǎn)。本文從某網(wǎng)絡(luò)零售商家的實(shí)際歷史訂單數(shù)據(jù)出發(fā),對(duì)10000多萬(wàn)條訂單數(shù)據(jù),進(jìn)行了隨機(jī)取樣,對(duì)取樣后的10萬(wàn)條訂單數(shù)據(jù)進(jìn)行標(biāo)記學(xué)習(xí)。首先,通過(guò)用戶是否發(fā)生了二次購(gòu)買記錄,從而對(duì)買家是否在該商家進(jìn)行重復(fù)購(gòu)買進(jìn)行標(biāo)記;其次,基于用戶享受折扣的金額、享受折扣的次數(shù)、累計(jì)消費(fèi)的金額、累計(jì)消費(fèi)的次數(shù)、以及金額和次數(shù)的占比等指標(biāo),結(jié)合K-means對(duì)用戶進(jìn)行聚類,進(jìn)而識(shí)別價(jià)格敏感用戶;最后,基于文獻(xiàn)回顧,使用經(jīng)典的RFM模型,從消費(fèi)者最近一次購(gòu)買距今時(shí)間R,累計(jì)購(gòu)買次數(shù)F,累計(jì)消費(fèi)購(gòu)買金額M,采用K-means聚類,對(duì)忠誠(chéng)用戶進(jìn)行標(biāo)記。在用戶標(biāo)記的基礎(chǔ)上,由于三個(gè)標(biāo)記之間具有一定的相關(guān)性。忠誠(chéng)用戶往往更容易發(fā)生二次購(gòu)買,而價(jià)格敏感的用戶的忠誠(chéng)度會(huì)相對(duì)較低,但是價(jià)格的波動(dòng)會(huì)影響二次購(gòu)買的決策。所以,本文對(duì)多標(biāo)記學(xué)習(xí)進(jìn)行了系統(tǒng)的文獻(xiàn)回顧,并對(duì)原有的多標(biāo)記學(xué)習(xí)一階算法ML-KNN算法進(jìn)行了學(xué)習(xí)和應(yīng)用,基于此,提出了兩點(diǎn)改進(jìn),主要包括第一,由于實(shí)際數(shù)據(jù)往往會(huì)存在一定的類別不平衡(class imbalance),本文以標(biāo)記中大類樣本和小類樣本的樣本數(shù)據(jù)比例得到權(quán)重,從而通過(guò)對(duì)數(shù)據(jù)樣本加權(quán)的方式,提高小類樣本的權(quán)重,減少小類樣本數(shù)據(jù)的多標(biāo)記學(xué)習(xí)錯(cuò)誤率,實(shí)現(xiàn)樣本的均勻抽樣,有效的降低類別不平衡問(wèn)題。第二,由于ML-KNN算法是一階算法,沒(méi)有考慮到標(biāo)記之間的相關(guān)性信息,而標(biāo)記之間的相關(guān)性信息可以有效利用,從而提升學(xué)習(xí)效果,所以本文ML-KNN算法,對(duì)分類器函數(shù)進(jìn)行了一定的修改。最終,將改進(jìn)后的ML-KNN算法和現(xiàn)有多標(biāo)記學(xué)習(xí)算法進(jìn)行了對(duì)比,論證了改進(jìn)的有效性。在結(jié)論部分,基于本文對(duì)用戶的多標(biāo)記學(xué)習(xí),對(duì)網(wǎng)絡(luò)零售賣家的營(yíng)銷策略提出了一些切實(shí)可行的建議,并且結(jié)合文獻(xiàn)回顧,提出了兩點(diǎn)不足和三點(diǎn)可供借鑒的未來(lái)研究方向。
【圖文】:
圖1-1本文研究框架逡逑本文研究采用數(shù)據(jù)挖掘方法作為主要的研究方法,對(duì)數(shù)據(jù)的處理和操作使用逡逑的是MySQLS.邋7軟件,并采用Matlab邋2017a進(jìn)行算法的應(yīng)用和改進(jìn)。逡逑數(shù)據(jù)挖掘化ata邋mining)這個(gè)概念最早巧1995年的美國(guó)計(jì)算機(jī)年會(huì)上,被提逡逑
具有"經(jīng)濟(jì)學(xué)","股票相關(guān)","國(guó)外學(xué)者著作"等多個(gè)標(biāo)記,如在生物信息逡逑學(xué)中,每個(gè)基金可能與一組功能相關(guān)聯(lián),包括代謝、轉(zhuǎn)錄和蛋白質(zhì)合成。如一個(gè)逡逑圖片的標(biāo)記是如圖2-1所示的一張圖片,那么標(biāo)記可W是"沙灘"、"海景房"、逡逑"旅游",而"沙灘"往往和"海景房"存在一定的相關(guān)性,"沙灘"和"旅游"逡逑也會(huì)存在一定相關(guān)性。所W多標(biāo)記學(xué)習(xí)的標(biāo)記之間的相關(guān)性,可W如下圖2-2逡逑所示,標(biāo)記往往不是單一存在的個(gè)體。逡逑和—二—逡逑.:娭-'1逡逑K:邐1邋三V邋‘逡逑圖2-1多標(biāo)記學(xué)習(xí)圖片示例1逡逑(資料來(lái)源:百度圖片)逡逑(一)問(wèn)題定義逡逑多標(biāo)記學(xué)習(xí)主要思想是:定義X=Rd為示例空間,Y=U,…,Q}為標(biāo)記集合,逡逑X,為示例(l<i<m),Yi邋為對(duì)應(yīng)義的標(biāo)記,那么邋D邋二((X,,Y,),(X2,Y2)"‘(Xm,Ym)}逡逑訓(xùn)練集,所W在多標(biāo)記學(xué)習(xí)問(wèn)題中,每個(gè)示例與一組標(biāo)記集有關(guān)聯(lián)性,,因此,多逡逑1百度圖片逡逑httvr.//imaae.邋baidu.邋com/search/d(n-ail?cT;-50
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:F724.6;F274
本文編號(hào):2543114
【圖文】:
圖1-1本文研究框架逡逑本文研究采用數(shù)據(jù)挖掘方法作為主要的研究方法,對(duì)數(shù)據(jù)的處理和操作使用逡逑的是MySQLS.邋7軟件,并采用Matlab邋2017a進(jìn)行算法的應(yīng)用和改進(jìn)。逡逑數(shù)據(jù)挖掘化ata邋mining)這個(gè)概念最早巧1995年的美國(guó)計(jì)算機(jī)年會(huì)上,被提逡逑
具有"經(jīng)濟(jì)學(xué)","股票相關(guān)","國(guó)外學(xué)者著作"等多個(gè)標(biāo)記,如在生物信息逡逑學(xué)中,每個(gè)基金可能與一組功能相關(guān)聯(lián),包括代謝、轉(zhuǎn)錄和蛋白質(zhì)合成。如一個(gè)逡逑圖片的標(biāo)記是如圖2-1所示的一張圖片,那么標(biāo)記可W是"沙灘"、"海景房"、逡逑"旅游",而"沙灘"往往和"海景房"存在一定的相關(guān)性,"沙灘"和"旅游"逡逑也會(huì)存在一定相關(guān)性。所W多標(biāo)記學(xué)習(xí)的標(biāo)記之間的相關(guān)性,可W如下圖2-2逡逑所示,標(biāo)記往往不是單一存在的個(gè)體。逡逑和—二—逡逑.:娭-'1逡逑K:邐1邋三V邋‘逡逑圖2-1多標(biāo)記學(xué)習(xí)圖片示例1逡逑(資料來(lái)源:百度圖片)逡逑(一)問(wèn)題定義逡逑多標(biāo)記學(xué)習(xí)主要思想是:定義X=Rd為示例空間,Y=U,…,Q}為標(biāo)記集合,逡逑X,為示例(l<i<m),Yi邋為對(duì)應(yīng)義的標(biāo)記,那么邋D邋二((X,,Y,),(X2,Y2)"‘(Xm,Ym)}逡逑訓(xùn)練集,所W在多標(biāo)記學(xué)習(xí)問(wèn)題中,每個(gè)示例與一組標(biāo)記集有關(guān)聯(lián)性,,因此,多逡逑1百度圖片逡逑httvr.//imaae.邋baidu.邋com/search/d(n-ail?cT;-50
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:F724.6;F274
本文編號(hào):2543114
本文鏈接:http://sikaile.net/jingjilunwen/xmjj/2543114.html
最近更新
教材專著