天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于機(jī)器學(xué)習(xí)算法的重復(fù)購買行為預(yù)測研究

發(fā)布時(shí)間:2020-08-28 15:43
   重復(fù)購買行為是營銷學(xué)領(lǐng)域的研究熱點(diǎn)。隨著電子商務(wù)的快速發(fā)展,參與網(wǎng)購的用戶越來越多,如何基于大數(shù)據(jù)預(yù)測用戶的重復(fù)購買行為成為電商平臺非常關(guān)心并想解決的問題。重復(fù)購買行為預(yù)測技術(shù)可應(yīng)用于電商平臺推薦系統(tǒng)中,幫助商家識別具有重復(fù)購買意向的用戶,從而實(shí)現(xiàn)營銷信息的精準(zhǔn)投放。準(zhǔn)確預(yù)測重復(fù)購買行為的關(guān)鍵在于通過模型算法挖掘出數(shù)據(jù)中所隱含的用戶行為規(guī)律。然而,由于網(wǎng)購用戶群體規(guī)模巨大且不同用戶群體的購買行為規(guī)律具有很大的差異性,這使得數(shù)據(jù)挖掘工作變得異常困難。傳統(tǒng)的機(jī)器學(xué)習(xí)算法在預(yù)測時(shí)忽略了用戶購買行為規(guī)律的差異性,難以取得好的預(yù)測效果。因此,本文著重研究如何提高機(jī)器學(xué)習(xí)模型在重復(fù)購行為預(yù)測問題中的泛化性能,使其克服用戶行為規(guī)律的差異性對預(yù)測性能造成的影響。本文在對現(xiàn)有機(jī)器學(xué)習(xí)算法進(jìn)行研究的基礎(chǔ)上,提出了細(xì)分化集成學(xué)習(xí)方法。該方法可以從數(shù)據(jù)集中學(xué)習(xí)到多種用戶購買行為規(guī)律,提高了模型的預(yù)測性能。論文的主要研究工作如下。(1)重復(fù)購買行為影響因素研究。通過對電商平臺用戶購買行為數(shù)據(jù)的分析,從用戶、商家以及商家和用戶的關(guān)系三個(gè)方面挖掘影響重復(fù)購買行為的重要因素,并構(gòu)建了52種與重復(fù)購買行為相關(guān)的特征。(2)現(xiàn)有機(jī)器學(xué)習(xí)模型的對比研究。論文對常用的機(jī)器學(xué)習(xí)方法進(jìn)行了研究。實(shí)驗(yàn)結(jié)果表明,現(xiàn)有的機(jī)器學(xué)習(xí)模型預(yù)測精度普遍不高。Logistic回歸、神經(jīng)網(wǎng)絡(luò)、決策樹等單一模型在解決樣本類別不均衡問題時(shí)存在局限性。集成學(xué)習(xí)方法雖然可以通過欠采樣的方式解決類別不均衡問題,但無法有效的學(xué)習(xí)到具有差異性的用戶購買行為規(guī)律,預(yù)測效果同樣不理想。(3)細(xì)分化集成學(xué)習(xí)策略研究?紤]到目前的機(jī)器學(xué)習(xí)方法在預(yù)測重復(fù)購買行為時(shí)存在的局限性,論文對Bagging集成學(xué)習(xí)方法進(jìn)行改進(jìn),提出了細(xì)分化集成學(xué)習(xí)。細(xì)分化集成學(xué)習(xí)通過在Bagging中設(shè)置強(qiáng)規(guī)則結(jié)合策略,使其能逐層過濾樣本數(shù)據(jù),從而實(shí)現(xiàn)對用戶購買行為數(shù)據(jù)的細(xì)分。這種新的集成學(xué)習(xí)方法可根據(jù)細(xì)分后的數(shù)據(jù)集學(xué)到多種購買行為規(guī)律。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的機(jī)器學(xué)習(xí)方法相比,細(xì)分化集成學(xué)習(xí)具有更好的預(yù)測效果。(4)預(yù)測模型的泛化性能研究。從泛化誤差的角度對細(xì)分化集成學(xué)習(xí)模型的泛化性能進(jìn)行了研究。通過對模型的泛化誤差進(jìn)行分解發(fā)現(xiàn),細(xì)分化集成學(xué)習(xí)的樣本過濾機(jī)制可以降低方差,因此具有更好的預(yù)測性能。
【學(xué)位單位】:重慶工商大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP181;F274
【部分圖文】:

示意圖,工程,示意圖,多樣性


圖 2.1 特征工程示意圖.2.1 基于用戶的特征用戶自身的需求偏好以及購買行為規(guī)律是影響重復(fù)購買行為最主要的因素此,本文從六個(gè)不同的角度對用戶的特征進(jìn)行全面分析。(1)用戶選購商品的多樣性程度用戶在參與網(wǎng)購時(shí),其產(chǎn)生的行為類型可分為點(diǎn)擊、購買、加入收藏等。,可通過這四種行為統(tǒng)計(jì)每個(gè)用戶關(guān)注過多少種商品。這類特征主要用來衡戶選購商品的多樣性程度。多樣性程度越高,說明該用戶越喜歡購買不一樣品,因此其重復(fù)購買同一個(gè)商家商品的概率可能較低。本文共選取了 12 個(gè)用量多樣性程度的特征,如表 2.5 所示。表 2.5 用戶選購商品的多樣性特征特征序號 特征說明f1 用戶點(diǎn)擊過多少種不同的商品

實(shí)驗(yàn)流程,流程試驗(yàn),迭代步驟,偏導(dǎo)數(shù)


()()(1)'()1()()liljjljiliWfz (計(jì)算偏導(dǎo)數(shù),方法如下:(1)()()(-1)()()(,;,)(,;,) lilililjljlijJWbxybJWbxyaaW (3得的導(dǎo)數(shù)帶入到梯度下降算法中,通過迭代步驟來減小代價(jià)函數(shù) J(而求解神經(jīng)網(wǎng)絡(luò)模型。驗(yàn)設(shè)計(jì)驗(yàn)流程試驗(yàn)的具體流程如圖 3.1 所示。

模型預(yù)測,神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)模型,欠采樣


圖 3.2 模型預(yù)測效果對比圖由圖 3.2 可以發(fā)現(xiàn),三種模型的 AUC 值和準(zhǔn)確率均比較低,但 Logistic 回 AUC 值和準(zhǔn)確率要高于 CART 樹和神經(jīng)網(wǎng)絡(luò)。CART 樹與神經(jīng)網(wǎng)絡(luò)的預(yù)測相似。上述實(shí)驗(yàn)結(jié)果表明,神經(jīng)網(wǎng)絡(luò)和 CART 樹等非線性模型在預(yù)測重復(fù)購買行容易對訓(xùn)練集產(chǎn)生過擬合。由于數(shù)據(jù)集存在類別不均衡現(xiàn)象,在采用單一的學(xué)習(xí)模型進(jìn)行訓(xùn)練時(shí),首先會(huì)對訓(xùn)練集中的負(fù)樣本進(jìn)行欠采樣操作。欠采樣雖然平衡了兩種樣本的數(shù)量,但由于丟失了大量負(fù)樣本信息。也容易造成模度擬合正樣本,而對負(fù)樣本學(xué)習(xí)能力不足。由此造成了單一的學(xué)習(xí)模型的預(yù)果不理想。.4 本章小結(jié)本章通過實(shí)驗(yàn)研究的方法對比了 Logistic 回歸、決策樹以及神經(jīng)網(wǎng)絡(luò)等模

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳海濤;李同強(qiáng);宋姍姍;;在線外賣平臺用戶重復(fù)購買行為的建模與實(shí)證研究[J];軟科學(xué);2015年11期

2 邢文祥;韓華;;電子商務(wù)消費(fèi)者重復(fù)購買行為影響因素研究[J];學(xué)術(shù)論壇;2014年11期

3 尹華;胡玉平;;基于隨機(jī)森林的不平衡特征選擇算法[J];中山大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年05期

4 陳渝;毛姍姍;潘曉月;許云紅;;信息系統(tǒng)采納后習(xí)慣對用戶持續(xù)使用行為的影響[J];管理學(xué)報(bào);2014年03期

5 薛君;趙青;衛(wèi)林英;;網(wǎng)絡(luò)購物粘性行為前置因素研究[J];財(cái)貿(mào)研究;2012年04期

6 賀愛忠;龔?fù)耔?;購物網(wǎng)站顧客體驗(yàn)對品牌忠誠影響的實(shí)證研究[J];東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2011年04期

7 彭凱;秦永彬;許道云;;基于邏輯回歸的客戶穩(wěn)定度建模[J];計(jì)算機(jī)工程;2011年09期

8 黃聰;王東;;基于RFM分析模式與馬爾可夫鏈的客戶行為預(yù)測模型研究[J];情報(bào)雜志;2009年S2期

9 李斌;章衛(wèi)國;寧東方;尹偉;;基于神經(jīng)網(wǎng)絡(luò)信息融合的智能故障診斷方法[J];計(jì)算機(jī)仿真;2008年06期

10 史有春,劉春林;顧客重復(fù)購買行為的實(shí)證研究[J];南開管理評論;2005年01期



本文編號:2807778

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2807778.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dcf44***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com