基于LightGBM算法的O2O優(yōu)惠券精準(zhǔn)投放研究
發(fā)布時間:2020-07-07 10:40
【摘要】:O2O(Online To Offline)是一種將線上活動與線下體驗緊密結(jié)合的電子商務(wù)模式。在移動互聯(lián)網(wǎng)背景下,發(fā)放O2O優(yōu)惠券是一種主要的營銷手段。O2O平臺都在不斷思考如何挖掘用戶的行為特征和消費偏好,并根據(jù)用戶需求精準(zhǔn)投放優(yōu)惠券,從而使用較低的營銷成本去盤活老用戶、吸引更多的新用戶。由于O2O電子商務(wù)與傳統(tǒng)電子商務(wù)存在差異,擁有其特有的線下體驗環(huán)節(jié),如果直接把傳統(tǒng)電子商務(wù)的研究運用到O2O電子商務(wù)模式中會出現(xiàn)準(zhǔn)確率低、效果差的狀況,達(dá)不到精準(zhǔn)營銷的目的。因此,通過分析O2O模式的具體特征,結(jié)合傳統(tǒng)電子商務(wù)的研究方法,構(gòu)建適用于O2O電子商務(wù)的預(yù)測模型,是本文研究的出發(fā)點和落腳點。本文主要研究目的是構(gòu)建O2O優(yōu)惠券精準(zhǔn)投放模型,著眼于O2O優(yōu)惠券的用戶使用預(yù)測,通過預(yù)測結(jié)果將優(yōu)惠券發(fā)放給最有可能使用的人群,以達(dá)到精準(zhǔn)投放的目的。本文主要工作如下:(1)結(jié)合O2O優(yōu)惠券和精準(zhǔn)投放知識,分析用戶使用優(yōu)惠券的影響因素,以此作為特征構(gòu)造的理論依據(jù);(2)在對原始數(shù)據(jù)處理分析后,結(jié)合業(yè)務(wù)邏輯,設(shè)計并構(gòu)造了可直接應(yīng)用于實際業(yè)務(wù)場景的特征,包含5個基礎(chǔ)特征群和4個組合特征群,共78個特征。(3)提出了一種新的特征選擇算法RFPS(Random Forest-Pearson-SBS),并使用RFPS算法篩選特征,最終得到特征影響因子高的52個特征;(4)為處理正負(fù)樣本不平衡問題,將Easy-Ensemble算法與LightGBM算法結(jié)合為E-LightGBM,并用其構(gòu)建O2O優(yōu)惠券精準(zhǔn)投放模型,取得了良好的效果,證明該算法適合在類似的問題中被廣泛推廣和應(yīng)用;(5)結(jié)合O2O行業(yè)發(fā)展?fàn)顩r和實驗分析結(jié)果,為O2O優(yōu)惠券精準(zhǔn)投放提出建議。本文得出的主要結(jié)論有:(1)在O2O模式背景下,建立基于用戶歷史數(shù)據(jù)分析的優(yōu)惠券使用預(yù)測模型,為O2O優(yōu)惠券精準(zhǔn)投放提供理論依據(jù)和數(shù)據(jù)支持;(2)使用RFPS算法進(jìn)行特征篩選之后,模型運行時間減少了16%,公測AUC值提升了0.028,在降低模型復(fù)雜度的同時提高了模型分類效果;(3)使用E-LightGBM算法構(gòu)建O2O優(yōu)惠券精準(zhǔn)投放模型,公測AUC值達(dá)0.798。實驗證明該算法在分類性能上優(yōu)于其他分類集成算法,更適合處理正負(fù)樣本不平衡、數(shù)據(jù)量大、時效性要求高的O2O電子商務(wù)場景數(shù)據(jù)。
【學(xué)位授予單位】:山西財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F724.6;F274
【圖文】:
論文基本框架圖
圖 2.5 隨機(jī)森林算法流程圖用 Bootstraping 方法隨機(jī)有放回采練集。分別訓(xùn)練 n 個決策樹模型。 m,使用第 i 個 bootstrap 樣本訓(xùn)益/信息增益比/基尼指數(shù)選擇最直分裂下去,在決策樹的分裂過程樹按一定的集成策略組合成隨機(jī)定分類結(jié)果;對于回歸問題,求得ng Decision Tree)是 Boosting 框架下
圖 3.1 用戶消費特征圖圖 3.1(上)是優(yōu)惠券發(fā)放量與被使用量的分布圖,圖 3.1(下)展示相應(yīng)優(yōu)惠券的使用率[67]。由圖分析可知 O2O 優(yōu)惠券的使用率大多數(shù)在 20%以內(nèi),從整體分布上看,O2O 優(yōu)惠券使用率很大程度上受到時間的影響。例如在 2016 年 2 月份左右,對應(yīng)的時間段為春節(jié)假期,優(yōu)惠券發(fā)放量是最多的,但優(yōu)惠券的使用率卻是最低的。其次在 3 月 20 日左右,在優(yōu)惠券發(fā)放量正常的情況下,優(yōu)惠券的使用率是最高的。通過對總體用戶消費特征的可視化分析,可以發(fā)現(xiàn)數(shù)據(jù)中的隱藏信息,這些信息為后續(xù)的分析提供基礎(chǔ) 。3.2.2 缺失值處理缺失值是指數(shù)據(jù)集中部分屬性的值是不完全的,存在空缺。數(shù)據(jù)值缺失是數(shù)據(jù)挖掘過程中常遇到的問題之一。缺失值的存在使分類器的不確定性更加顯著,可能
本文編號:2745021
【學(xué)位授予單位】:山西財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F724.6;F274
【圖文】:
論文基本框架圖
圖 2.5 隨機(jī)森林算法流程圖用 Bootstraping 方法隨機(jī)有放回采練集。分別訓(xùn)練 n 個決策樹模型。 m,使用第 i 個 bootstrap 樣本訓(xùn)益/信息增益比/基尼指數(shù)選擇最直分裂下去,在決策樹的分裂過程樹按一定的集成策略組合成隨機(jī)定分類結(jié)果;對于回歸問題,求得ng Decision Tree)是 Boosting 框架下
圖 3.1 用戶消費特征圖圖 3.1(上)是優(yōu)惠券發(fā)放量與被使用量的分布圖,圖 3.1(下)展示相應(yīng)優(yōu)惠券的使用率[67]。由圖分析可知 O2O 優(yōu)惠券的使用率大多數(shù)在 20%以內(nèi),從整體分布上看,O2O 優(yōu)惠券使用率很大程度上受到時間的影響。例如在 2016 年 2 月份左右,對應(yīng)的時間段為春節(jié)假期,優(yōu)惠券發(fā)放量是最多的,但優(yōu)惠券的使用率卻是最低的。其次在 3 月 20 日左右,在優(yōu)惠券發(fā)放量正常的情況下,優(yōu)惠券的使用率是最高的。通過對總體用戶消費特征的可視化分析,可以發(fā)現(xiàn)數(shù)據(jù)中的隱藏信息,這些信息為后續(xù)的分析提供基礎(chǔ) 。3.2.2 缺失值處理缺失值是指數(shù)據(jù)集中部分屬性的值是不完全的,存在空缺。數(shù)據(jù)值缺失是數(shù)據(jù)挖掘過程中常遇到的問題之一。缺失值的存在使分類器的不確定性更加顯著,可能
【相似文獻(xiàn)】
相關(guān)期刊論文 前4條
1 謝勇;項薇;季孟忠;彭俊;黃益槐;;基于Xgboost和LightGBM算法預(yù)測住房月租金的應(yīng)用分析[J];計算機(jī)應(yīng)用與軟件;2019年09期
2 王芳杰;王福建;王雨晨;邊馳;;基于LightGBM算法的公交行程時間預(yù)測[J];交通運輸系統(tǒng)工程與信息;2019年02期
3 周文;王瑜;李長勝;肖洪兵;邢素霞;;LightGBM算法在阿爾茨海默癥結(jié)構(gòu)磁共振成像分類中的應(yīng)用[J];中國醫(yī)學(xué)物理學(xué)雜志;2019年04期
4 熊蘇生;;基于改進(jìn)LightGBM的交通模式識別算法[J];計算機(jī)與現(xiàn)代化;2018年10期
相關(guān)碩士學(xué)位論文 前2條
1 譚晶;基于LightGBM算法的O2O優(yōu)惠券精準(zhǔn)投放研究[D];山西財經(jīng)大學(xué);2019年
2 姜加才;基于LightGBM算法的量化選股策略方案策劃[D];上海師范大學(xué);2019年
本文編號:2745021
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2745021.html
最近更新
教材專著