基于時(shí)序數(shù)據(jù)的音樂流媒體用戶流失預(yù)測(cè)
發(fā)布時(shí)間:2021-08-08 01:16
隨著互聯(lián)網(wǎng)的快速發(fā)展,音樂流媒體市場(chǎng)正在不斷擴(kuò)大。各大音樂流媒體服務(wù)平臺(tái)通過多樣的方式吸引新用戶,搶占市場(chǎng)份額。與此同時(shí),平臺(tái)老用戶根據(jù)自身喜好更換平臺(tái)幾乎不需要任何成本,這對(duì)于音樂流媒體服務(wù)平臺(tái)來說意味著老用戶容易流失。用戶流失會(huì)對(duì)企業(yè)利潤產(chǎn)生很大的影響,所以準(zhǔn)確識(shí)別出高流失傾向的用戶并實(shí)施相應(yīng)的挽留操作顯得尤為重要。目前業(yè)界的主流做法是利用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)來預(yù)測(cè)潛在的流失用戶。針對(duì)音樂流媒體領(lǐng)域用戶流失數(shù)據(jù)的特點(diǎn)以及目前用戶流失預(yù)測(cè)方法存在的問題,本文從模型和特征兩個(gè)層面來改善流失預(yù)測(cè)效果,具體的研究工作如下:(1)考慮到音樂流媒體領(lǐng)域的用戶流失數(shù)據(jù)集通常包含大量的時(shí)序數(shù)據(jù),而LSTM模型常被用來進(jìn)行序列建模,本文提出一種基于集成LSTM的用戶流失預(yù)測(cè)模型,旨在從模型集成的角度出發(fā)提升流失預(yù)測(cè)效果。該集成模型一方面采用LSTM模型作為基學(xué)習(xí)器;另一方面結(jié)合真實(shí)數(shù)據(jù)的特點(diǎn)改進(jìn)Snapshot集成方法,在模型訓(xùn)練過程中引入樣本權(quán)重調(diào)整機(jī)制,同時(shí)利用學(xué)習(xí)法結(jié)合子模型輸出。實(shí)驗(yàn)結(jié)果表明,相比于原始LSTM模型,本文提出的模型在PR-AUC上提升4.21%。(2)由于目前用戶流失預(yù)測(cè)任...
【文章來源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-3?CNN結(jié)構(gòu)圖??
???????」丨??'???',??h樣本U?I?時(shí)騰征?|?!?I??:特征?|?「-?r??處理;?Spark?〉Python?? ̄????、、L?:?L????J?j??f?:?;?r——「一fr…-二二?一:—i?)??HDFS??:數(shù)據(jù)?i?i??v???源?i?!?????日志數(shù)據(jù)??i?i?i?:?????i?i???!丨-???????J?J??圖2-5用戶流失預(yù)測(cè)框架??2.5?本章小結(jié)??本章首先介紹了決策樹模型,并以CART為例給出決策樹的學(xué)習(xí)步驟。其次介??紹了基于決策樹的兩種集成模型,隨機(jī)森林和XGBoost。接著介紹了循環(huán)神經(jīng)網(wǎng)絡(luò)、??長短期記憶網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)的模型特點(diǎn)以及工作原理。然后介紹了集成學(xué)習(xí)的??概念以及集成學(xué)習(xí)中兩種常用的輸出結(jié)合策略。最后介紹了本文設(shè)計(jì)的用戶流失預(yù)測(cè)??框架。??16??
Loshchilov等人提出一種余弦退火與熱重啟相結(jié)合的循環(huán)學(xué)習(xí)率策略,該策略在一??個(gè)學(xué)習(xí)率變化周期內(nèi)使用余弦函數(shù)來降低學(xué)習(xí)率,在下一個(gè)周期開始時(shí),將學(xué)習(xí)率重??置為初始值,并基于當(dāng)前的模型參數(shù)繼續(xù)訓(xùn)練,其變化形式如公式(3-1)所示。??a(t)?=?—?cos??^——^^?+1?(3-1)??l?rr/Mi?j?j??上式中,a。表示初始學(xué)習(xí)率,和原論文中學(xué)習(xí)率在每個(gè)batch訓(xùn)練結(jié)束時(shí)更新不同,??本文實(shí)驗(yàn)中學(xué)習(xí)率會(huì)在每個(gè)epoch訓(xùn)練結(jié)束時(shí)更新,(表示當(dāng)前訓(xùn)練的epoch數(shù),T表??示總epoch數(shù),M表示學(xué)習(xí)率的更新周期數(shù)。圖3-1是循環(huán)學(xué)習(xí)率的一個(gè)示例。?????
【參考文獻(xiàn)】:
期刊論文
[1]電信客戶流失的組合預(yù)測(cè)模型[J]. 余路. 華僑大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[2]在線游戲用戶的流失預(yù)測(cè):基于不平衡數(shù)據(jù)的采樣方法比較和分析[J]. 吳悅昕,趙鑫,過巖巍,閆宏飛. 中文信息學(xué)報(bào). 2016(04)
[3]基于社交網(wǎng)絡(luò)的MMORPG玩家流失分析與預(yù)測(cè)[J]. 丁軍,高大啟,薛程元,陳小紅. 計(jì)算機(jī)應(yīng)用與軟件. 2016(03)
[4]支持向量機(jī)模型在銀行客戶流失預(yù)測(cè)中的應(yīng)用研究[J]. 賀本嵐. 金融論壇. 2014(09)
本文編號(hào):3328914
【文章來源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-3?CNN結(jié)構(gòu)圖??
???????」丨??'???',??h樣本U?I?時(shí)騰征?|?!?I??:特征?|?「-?r??處理;?Spark?〉Python?? ̄????、、L?:?L????J?j??f?:?;?r——「一fr…-二二?一:—i?)??HDFS??:數(shù)據(jù)?i?i??v???源?i?!?????日志數(shù)據(jù)??i?i?i?:?????i?i???!丨-???????J?J??圖2-5用戶流失預(yù)測(cè)框架??2.5?本章小結(jié)??本章首先介紹了決策樹模型,并以CART為例給出決策樹的學(xué)習(xí)步驟。其次介??紹了基于決策樹的兩種集成模型,隨機(jī)森林和XGBoost。接著介紹了循環(huán)神經(jīng)網(wǎng)絡(luò)、??長短期記憶網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)的模型特點(diǎn)以及工作原理。然后介紹了集成學(xué)習(xí)的??概念以及集成學(xué)習(xí)中兩種常用的輸出結(jié)合策略。最后介紹了本文設(shè)計(jì)的用戶流失預(yù)測(cè)??框架。??16??
Loshchilov等人提出一種余弦退火與熱重啟相結(jié)合的循環(huán)學(xué)習(xí)率策略,該策略在一??個(gè)學(xué)習(xí)率變化周期內(nèi)使用余弦函數(shù)來降低學(xué)習(xí)率,在下一個(gè)周期開始時(shí),將學(xué)習(xí)率重??置為初始值,并基于當(dāng)前的模型參數(shù)繼續(xù)訓(xùn)練,其變化形式如公式(3-1)所示。??a(t)?=?—?cos??^——^^?+1?(3-1)??l?rr/Mi?j?j??上式中,a。表示初始學(xué)習(xí)率,和原論文中學(xué)習(xí)率在每個(gè)batch訓(xùn)練結(jié)束時(shí)更新不同,??本文實(shí)驗(yàn)中學(xué)習(xí)率會(huì)在每個(gè)epoch訓(xùn)練結(jié)束時(shí)更新,(表示當(dāng)前訓(xùn)練的epoch數(shù),T表??示總epoch數(shù),M表示學(xué)習(xí)率的更新周期數(shù)。圖3-1是循環(huán)學(xué)習(xí)率的一個(gè)示例。?????
【參考文獻(xiàn)】:
期刊論文
[1]電信客戶流失的組合預(yù)測(cè)模型[J]. 余路. 華僑大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[2]在線游戲用戶的流失預(yù)測(cè):基于不平衡數(shù)據(jù)的采樣方法比較和分析[J]. 吳悅昕,趙鑫,過巖巍,閆宏飛. 中文信息學(xué)報(bào). 2016(04)
[3]基于社交網(wǎng)絡(luò)的MMORPG玩家流失分析與預(yù)測(cè)[J]. 丁軍,高大啟,薛程元,陳小紅. 計(jì)算機(jī)應(yīng)用與軟件. 2016(03)
[4]支持向量機(jī)模型在銀行客戶流失預(yù)測(cè)中的應(yīng)用研究[J]. 賀本嵐. 金融論壇. 2014(09)
本文編號(hào):3328914
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3328914.html
最近更新
教材專著