天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

移動(dòng)環(huán)境下商品推薦算法的研究與應(yīng)用

發(fā)布時(shí)間:2021-01-24 18:58
  隨著時(shí)代的發(fā)展,網(wǎng)絡(luò)購物逐漸成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠。電子商?wù)平臺(tái)在運(yùn)營中積累了大量的歷史數(shù)據(jù),如何充分利用這些數(shù)據(jù)提升用戶的購物體驗(yàn)變得非常重要。傳統(tǒng)的推薦算法無法充分挖掘用戶的行為數(shù)據(jù),預(yù)測用戶購買的準(zhǔn)確率不高。用戶的行為數(shù)據(jù)中包含了許多的重要信息,可以預(yù)測用戶可能喜好的商品并提高購買轉(zhuǎn)換率。本文在上述背景下,為了提升預(yù)測用戶購買的準(zhǔn)確度,在阿里巴巴公開的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。首先對數(shù)據(jù)集進(jìn)行可視化分析,提取用戶行為數(shù)據(jù)的規(guī)律后,通過構(gòu)建特征工程,特征數(shù)據(jù)的清洗處理完成對分類模型進(jìn)行訓(xùn)練。在訓(xùn)練中,本文提出了使用基于k-means聚類下采樣調(diào)節(jié)正負(fù)樣本比提升分類模型的訓(xùn)練速度和精度。最后將邏輯回歸模型、隨機(jī)森林模型和梯度提升決策樹模型調(diào)節(jié)至最佳參數(shù),對比在測試集中的性能,發(fā)現(xiàn)梯度提升決策樹算法在復(fù)雜的數(shù)據(jù)中表現(xiàn)的更佳。在梯度提升決策樹算法的基礎(chǔ)上,提出使用基于用戶的協(xié)同過濾算法進(jìn)行補(bǔ)充。針對在實(shí)際中用戶時(shí)間精力有限,商品的顯示評分較少的問題,提出了使用一種用戶興趣值的計(jì)算。本文提出了一種基于排序的混合方式,將兩種推薦算法的推薦列表在融合時(shí)采用基于興趣值的排序生成推薦列表。... 

【文章來源】:杭州電子科技大學(xué)浙江省

【文章頁數(shù)】:75 頁

【學(xué)位級別】:碩士

【部分圖文】:

移動(dòng)環(huán)境下商品推薦算法的研究與應(yīng)用


歷年天貓雙十一移動(dòng)端交易額和占比推薦系統(tǒng)中的“信息過載”問題,是隨著信息的爆炸式增長而出現(xiàn)[6]

函數(shù)圖


杭州電子科技大學(xué)碩士學(xué)位論文16以及高效,在實(shí)際中有廣泛的應(yīng)用。邏輯回歸也是對數(shù)幾率回歸,是一種線性模型。對于線性回歸模型產(chǎn)生的預(yù)測值是實(shí)值,需要通過sigmoid函數(shù)進(jìn)行轉(zhuǎn)換分類。Sigmod函數(shù)的數(shù)學(xué)形式為:1()1xgxe(2.7)在圖2.2中可以看到sigmoid函數(shù)是一個(gè)S曲線圖,取值位于[0,1]之前,在遠(yuǎn)離0時(shí)會(huì)接近0或1。圖2.8Sigmoid函數(shù)圖將線性函數(shù)方程代入Sigmoid函數(shù)中,可以得到邏輯回歸模型所做的假設(shè):*1(1|;)()1TTxPyxgxe(2.8)對應(yīng)的決策函數(shù)為:*y1,ifP(y1|x)0.5(2.9)在實(shí)際應(yīng)用中可以根據(jù)不同情況選擇不同的閾值。正常情況下分類閾值為0.5,當(dāng)需要對準(zhǔn)確度有較高要求的情況下,可以選擇調(diào)高閾值,而在要求高召回率的情況下,可以選擇閾值小于0.5。在邏輯回歸模型中,可以通過最大似然估計(jì)來尋找最佳參數(shù),其似然度可以表示為:1()(|)(|;)()(1())TyTyLPDPyxgxgx(2.10)取對數(shù)可以得到其對數(shù)似然度:()log()(1)log(1())TTlygxygx(2.11)在邏輯回歸模型中可以使用的損傷函數(shù)包括0-1損失,log損失,hinge損失等。其中,log損失的定義為:

線性可分,線性,決策樹


杭州電子科技大學(xué)碩士學(xué)位論文17L(Y,P(Y|X))(ylogp(y|x)(1y)log(1p(y|x)))(2.12)在數(shù)據(jù)集中,取平均log損失可以得到:1J()l()N(2.13)在邏輯回歸模型中,對于求解最大化似然函數(shù)和最小化log損失函數(shù)在實(shí)際中是等價(jià)的,因此優(yōu)化時(shí)可以采用梯度下降,以及常用的凸方法(共軛梯度下降,牛頓法等)用于求解該問題。邏輯回歸本質(zhì)上是一個(gè)線性模型,但是可以通過特征變換的方式,將低位空間轉(zhuǎn)換到高維空間,使其在高維空間能夠線性可分。下面兩張圖中,左圖線性可分,右圖為線性不可分,在特征轉(zhuǎn)換2212121212[x,x][x,x,x,x,xx]后的空間里為線性可分的,在其原始空間中,其分類曲線是一條橢圓曲線圖。(a)線性可分(b)線性不可分圖2.9線性可分與線性不可分時(shí)邏輯回歸模型分類邊界邏輯回歸模型,可以通過增加正則項(xiàng),防止因?yàn)閰?shù)過多導(dǎo)致的過擬合問題。通過增加正則項(xiàng),加大懲罰過大的參數(shù)來防止模型過擬合。在式(2.14)中,取p=1或p=2對應(yīng)為L1和L2正則化。1()log()(1)log(1())TTpJygxygxwN‖‖(2.14)2.3.3隨機(jī)森林模型隨機(jī)森林的最早是在1995年由貝爾實(shí)驗(yàn)室的TinKamHo[44]提出的隨機(jī)決策森林算法,該算法通過將Bagging思想[45]與隨機(jī)特征思想結(jié)合在一起,利用多顆決策樹進(jìn)行構(gòu)建訓(xùn)練。通過匯總多顆決策樹的結(jié)果,來提高模型的預(yù)測能力與精度,是一種集成模型。隨機(jī)森林是一種優(yōu)秀的分類器,在數(shù)據(jù)集上表現(xiàn)良好,能夠處理高維度特征,并且可以給出較為重要的特征。隨機(jī)森林的定義為:由一組決策樹分類器((X,)k1,2,3....)kh,k組成,k是一組服從獨(dú)立分布的隨機(jī)變量組成的,k是隨機(jī)森林里決策樹的數(shù)量。在給定自變量X的情況下,最佳的分類結(jié)果是由各個(gè)決策樹分類器投票決定的。由于每棵決策樹都是獨(dú)立生成的,在隨機(jī)

【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)學(xué)習(xí)資源個(gè)性化推薦系統(tǒng)的設(shè)計(jì)與開發(fā)[J]. 馮蓓蓓.  中國市場. 2017(13)
[2]混合用戶和項(xiàng)目協(xié)同過濾的電子商務(wù)個(gè)性化推薦算法[J]. 李清霞,魏文紅,蔡昭權(quán).  中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[3]購物網(wǎng)站個(gè)性化推薦系統(tǒng)應(yīng)用分析[J]. 李海霞.  現(xiàn)代經(jīng)濟(jì)信息. 2012(15)
[4]個(gè)性化推薦系統(tǒng)綜述[J]. 王國霞,劉賀平.  計(jì)算機(jī)工程與應(yīng)用. 2012(07)
[5]數(shù)據(jù)挖掘中決策樹算法的探討[J]. 唐華松,姚耀文.  計(jì)算機(jī)應(yīng)用研究. 2001(08)
[6]基于多Agent混合智能實(shí)現(xiàn)個(gè)性化信息推薦[J]. 路海明,盧增祥,李衍達(dá).  高技術(shù)通訊. 2001(04)
[7]Open Bookmark——基于Agent的信息過濾系統(tǒng)[J]. 馮翱,劉斌,盧增祥,路海明,王普,李衍達(dá).  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2001(03)

碩士論文
[1]電子商務(wù)使用行為從PC端到移動(dòng)端轉(zhuǎn)移的影響因素研究[D]. 王青.北京郵電大學(xué) 2015



本文編號:2997761

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2997761.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶04fed***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com