面向推薦系統(tǒng)的機(jī)器學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-10-06 22:53
隨著互聯(lián)網(wǎng)信息的爆炸增長(zhǎng),互聯(lián)網(wǎng)平臺(tái)越來越依賴推薦系統(tǒng)對(duì)用戶進(jìn)行商品推薦。推薦系統(tǒng)可以幫助平臺(tái)從海量信息中篩選出合適的內(nèi)容,推送給用戶,一方面幫助商家捕捉用戶興趣,另一方面也能滿足用戶個(gè)性化需求。推薦算法是推薦系統(tǒng)中的核心技術(shù),研究推薦算法研究對(duì)于促進(jìn)推薦系統(tǒng)在互聯(lián)網(wǎng)平臺(tái)中的有效應(yīng)用具有重要意義。本文針對(duì)點(diǎn)擊率預(yù)測(cè)推薦和排序?qū)W習(xí)推薦兩個(gè)推薦場(chǎng)景中存在的問題,分別提出了新的點(diǎn)擊率預(yù)測(cè)推薦模型和排序?qū)W習(xí)推薦算法。具體研究?jī)?nèi)容如下:(1)針對(duì)點(diǎn)擊率預(yù)測(cè)推薦場(chǎng)景中已有推薦模型難以同時(shí)滿足記憶與泛化功能、不能充分挖掘和組合低階特征以及深度學(xué)習(xí)模型在推薦系統(tǒng)的高維稀疏數(shù)據(jù)集下模型參數(shù)難以學(xué)習(xí)且推薦結(jié)果過度泛化的問題,本文提出了一種基于梯度提升樹和因子分解機(jī)的深度點(diǎn)擊率預(yù)測(cè)模型,該模型結(jié)合了梯度提升樹,因子分解機(jī)和深度神經(jīng)網(wǎng)絡(luò),可同時(shí)實(shí)現(xiàn)記憶與泛化功能,可以充分挖掘低階特征信息并自動(dòng)實(shí)現(xiàn)低階特征組合,可以在高維稀疏數(shù)據(jù)集上較好地學(xué)習(xí)模型參數(shù),推薦結(jié)果也不再過度泛化。本文在大型競(jìng)賽平臺(tái)數(shù)據(jù)集上進(jìn)行了仿真實(shí)驗(yàn),并對(duì)比了相關(guān)的點(diǎn)擊率預(yù)測(cè)推薦模型。實(shí)驗(yàn)結(jié)果表明,本文所提模型在AUC(Area under R...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推薦系統(tǒng)應(yīng)用場(chǎng)景分類圖
影響,使得最終的排序結(jié)果精準(zhǔn)度不足。為了充分學(xué)習(xí)各種特征的權(quán)重,研究人員開始將機(jī)器學(xué)習(xí)模型引入到排序?qū)W習(xí)方法中。與傳統(tǒng)排序方法不同的是,基于機(jī)器學(xué)習(xí)模型的排序方法是有監(jiān)督學(xué)習(xí)算法,不依賴于手動(dòng)設(shè)計(jì)的排序規(guī)則,而是通過訓(xùn)練集訓(xùn)練,自動(dòng)學(xué)習(xí)出一種排序模型,使得該模型的預(yù)測(cè)排序與實(shí)際排序表現(xiàn)一致。同時(shí),為了衡量這種排序關(guān)系的一致性,基于機(jī)器學(xué)習(xí)的排序?qū)W習(xí)方法不再使用絕對(duì)誤差當(dāng)作評(píng)價(jià)函數(shù),而是使用一些位置敏感的評(píng)價(jià)函數(shù),如平均準(zhǔn)確率(MRR),平均倒數(shù)排名(MRR),歸一化折損累計(jì)增益(NDCG)等等。圖1-2信息檢索示意圖排序?qū)W習(xí)方法按照可以分為三類:基于單樣本的方法(Point-wise),基于樣本對(duì)的方法(Pair-wise)和基于樣本列表的方法(List-wise)。下面將分別介紹這三種方法:1.基于單樣本的方法只考慮了單樣本的預(yù)測(cè)值,該方法將排序問題簡(jiǎn)化為了回歸問題,將用戶對(duì)商品的評(píng)分作為標(biāo)簽,通過訓(xùn)練使得預(yù)測(cè)評(píng)分與實(shí)際評(píng)分誤差最小化,得到排序模型。如文獻(xiàn)[26]提出的PRank模型;2.基于樣本對(duì)的方法考慮了兩兩樣本間的排序關(guān)系,它將已有的樣本兩兩組合成樣本對(duì),使用樣本對(duì)中兩個(gè)樣本的評(píng)分大小關(guān)系當(dāng)作標(biāo)簽,如果樣本對(duì)(a1,a2),如果用戶對(duì)a1評(píng)分高于a2,那么將樣本對(duì)標(biāo)識(shí)為正例,否則標(biāo)識(shí)為負(fù)例。模型預(yù)測(cè)時(shí)首先比較每?jī)蓚(gè)樣本間的偏序關(guān)系,再通過這種偏序關(guān)系復(fù)原全部樣本的整
電子科技大學(xué)碩士學(xué)位論文12第二章推薦系統(tǒng)中的算法模型與相關(guān)概念推薦系統(tǒng)的本質(zhì)是從海量?jī)?nèi)容中選取用戶感興趣的部分推薦給用戶,工業(yè)界推薦系統(tǒng)框架一般分為召回(Recall)和推薦(Recommend)兩部分,如圖2-1所示。其中,召回是根據(jù)用戶畫像,商品自身特性等簡(jiǎn)單特征,通過規(guī)則匹配等方法為特定用戶生成候選商品集合。推薦階段會(huì)引入更加精細(xì)的特征,包括用戶歷史行為,用戶和商品交互行為,用戶上下文環(huán)境等特征,來決定為用戶推薦哪些商品。由于這些特征較復(fù)雜,數(shù)據(jù)量也較大,難以人工衡量各個(gè)特征的重要性,在不同考慮維度中,各種特征的影響也不一樣,故一般使用各種推薦算法和模型來學(xué)習(xí)特征的重要性,提升推薦的效果。針對(duì)具體的應(yīng)用場(chǎng)景,推薦部分又可以分為點(diǎn)擊率預(yù)測(cè)推薦和排序?qū)W習(xí)推薦。下面,本章將詳細(xì)介紹這兩個(gè)場(chǎng)景的定義及相關(guān)模型算法。圖2-1推薦系統(tǒng)框架2.1點(diǎn)擊率預(yù)測(cè)模型點(diǎn)擊率預(yù)測(cè)推薦是根據(jù)用戶和商品的特征預(yù)測(cè)用戶對(duì)商品的點(diǎn)擊概率,將用
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[2]跨媒體分析與推理:研究進(jìn)展與發(fā)展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]基于用戶日志挖掘的搜索引擎廣告效果分析[J]. 陳磊,劉奕群,茹立云,馬少平. 中文信息學(xué)報(bào). 2008(06)
本文編號(hào):3420895
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推薦系統(tǒng)應(yīng)用場(chǎng)景分類圖
影響,使得最終的排序結(jié)果精準(zhǔn)度不足。為了充分學(xué)習(xí)各種特征的權(quán)重,研究人員開始將機(jī)器學(xué)習(xí)模型引入到排序?qū)W習(xí)方法中。與傳統(tǒng)排序方法不同的是,基于機(jī)器學(xué)習(xí)模型的排序方法是有監(jiān)督學(xué)習(xí)算法,不依賴于手動(dòng)設(shè)計(jì)的排序規(guī)則,而是通過訓(xùn)練集訓(xùn)練,自動(dòng)學(xué)習(xí)出一種排序模型,使得該模型的預(yù)測(cè)排序與實(shí)際排序表現(xiàn)一致。同時(shí),為了衡量這種排序關(guān)系的一致性,基于機(jī)器學(xué)習(xí)的排序?qū)W習(xí)方法不再使用絕對(duì)誤差當(dāng)作評(píng)價(jià)函數(shù),而是使用一些位置敏感的評(píng)價(jià)函數(shù),如平均準(zhǔn)確率(MRR),平均倒數(shù)排名(MRR),歸一化折損累計(jì)增益(NDCG)等等。圖1-2信息檢索示意圖排序?qū)W習(xí)方法按照可以分為三類:基于單樣本的方法(Point-wise),基于樣本對(duì)的方法(Pair-wise)和基于樣本列表的方法(List-wise)。下面將分別介紹這三種方法:1.基于單樣本的方法只考慮了單樣本的預(yù)測(cè)值,該方法將排序問題簡(jiǎn)化為了回歸問題,將用戶對(duì)商品的評(píng)分作為標(biāo)簽,通過訓(xùn)練使得預(yù)測(cè)評(píng)分與實(shí)際評(píng)分誤差最小化,得到排序模型。如文獻(xiàn)[26]提出的PRank模型;2.基于樣本對(duì)的方法考慮了兩兩樣本間的排序關(guān)系,它將已有的樣本兩兩組合成樣本對(duì),使用樣本對(duì)中兩個(gè)樣本的評(píng)分大小關(guān)系當(dāng)作標(biāo)簽,如果樣本對(duì)(a1,a2),如果用戶對(duì)a1評(píng)分高于a2,那么將樣本對(duì)標(biāo)識(shí)為正例,否則標(biāo)識(shí)為負(fù)例。模型預(yù)測(cè)時(shí)首先比較每?jī)蓚(gè)樣本間的偏序關(guān)系,再通過這種偏序關(guān)系復(fù)原全部樣本的整
電子科技大學(xué)碩士學(xué)位論文12第二章推薦系統(tǒng)中的算法模型與相關(guān)概念推薦系統(tǒng)的本質(zhì)是從海量?jī)?nèi)容中選取用戶感興趣的部分推薦給用戶,工業(yè)界推薦系統(tǒng)框架一般分為召回(Recall)和推薦(Recommend)兩部分,如圖2-1所示。其中,召回是根據(jù)用戶畫像,商品自身特性等簡(jiǎn)單特征,通過規(guī)則匹配等方法為特定用戶生成候選商品集合。推薦階段會(huì)引入更加精細(xì)的特征,包括用戶歷史行為,用戶和商品交互行為,用戶上下文環(huán)境等特征,來決定為用戶推薦哪些商品。由于這些特征較復(fù)雜,數(shù)據(jù)量也較大,難以人工衡量各個(gè)特征的重要性,在不同考慮維度中,各種特征的影響也不一樣,故一般使用各種推薦算法和模型來學(xué)習(xí)特征的重要性,提升推薦的效果。針對(duì)具體的應(yīng)用場(chǎng)景,推薦部分又可以分為點(diǎn)擊率預(yù)測(cè)推薦和排序?qū)W習(xí)推薦。下面,本章將詳細(xì)介紹這兩個(gè)場(chǎng)景的定義及相關(guān)模型算法。圖2-1推薦系統(tǒng)框架2.1點(diǎn)擊率預(yù)測(cè)模型點(diǎn)擊率預(yù)測(cè)推薦是根據(jù)用戶和商品的特征預(yù)測(cè)用戶對(duì)商品的點(diǎn)擊概率,將用
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[2]跨媒體分析與推理:研究進(jìn)展與發(fā)展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]基于用戶日志挖掘的搜索引擎廣告效果分析[J]. 陳磊,劉奕群,茹立云,馬少平. 中文信息學(xué)報(bào). 2008(06)
本文編號(hào):3420895
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3420895.html
最近更新
教材專著