基于用戶興趣轉(zhuǎn)移挖掘的流式推薦算法研究
發(fā)布時間:2021-07-26 12:43
推薦系統(tǒng)是當(dāng)下解決信息超載問題的有效方法,在經(jīng)過學(xué)術(shù)界和工業(yè)界多年共同的研究和應(yīng)用后,取得了卓越的研究成果。但是在移動互聯(lián)網(wǎng)的時代中,數(shù)據(jù)量呈現(xiàn)幾何式增長,傳統(tǒng)推薦系統(tǒng)同時面臨著可擴(kuò)展性和數(shù)據(jù)稀疏性的雙重考驗(yàn)。同時,隨著時間的遷移,用戶的興趣偏好也在不斷發(fā)生變化,一個成功的推薦系統(tǒng)應(yīng)能捕捉并適應(yīng)這些變化。為了應(yīng)對上述挑戰(zhàn),本文提出了一種基于用戶興趣轉(zhuǎn)移挖掘的流式推薦算法,主要從矩陣預(yù)填充、流式推薦模型的構(gòu)建和遺忘機(jī)制三個方面展開研究并對其缺點(diǎn)進(jìn)行針對性的改進(jìn)。(1)帶有流行度懲罰項(xiàng)的矩陣預(yù)填充方法。傳統(tǒng)的協(xié)同過濾算法無法適應(yīng)過于稀疏的數(shù)據(jù),而矩陣預(yù)填充方法可以基于先驗(yàn)知識對缺失評分進(jìn)行估計(jì)和填充,能夠在一定程度上緩解數(shù)據(jù)的稀疏性問題。在對Enhanced SVD(ESVD)預(yù)填充方法的評分誤差進(jìn)行分析后,本文提出預(yù)填充評分的誤差與用戶活躍度及資源流行度之間具有正相關(guān)性的假設(shè),并基于ESVD方法設(shè)計(jì)了一種帶有流行度懲罰項(xiàng)的矩陣預(yù)填充方法ESVD-P,提高了預(yù)填充評分的精度,改善了模型后續(xù)的訓(xùn)練質(zhì)量。(2)基于種類信息構(gòu)建的改進(jìn)流式推薦算法。為了能夠及時應(yīng)對外界的變化,流式推薦算法大多采用...
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
MovieLens1M數(shù)據(jù)集中電影評分?jǐn)?shù)量分布
武漢理工大學(xué)碩士學(xué)位論文1圖2-2MovieLens1M數(shù)據(jù)集中用戶評分?jǐn)?shù)量分布將上述挑選出的熱門資源子矩陣與活躍用戶子矩陣相結(jié)合,便得到最終的高密度子矩陣,以MovieLens1M數(shù)據(jù)集為例,如表2-1所示,前5%的活躍用戶與前5%的熱門資源構(gòu)成的子評分矩陣中一共包含41,900個已知評分,缺失評分?jǐn)?shù)量僅為17,702個,子矩陣的整體密度高達(dá)70.30%,要遠(yuǎn)遠(yuǎn)高于原始評分矩陣4.19%的密度。表2-1不同挑選比例下的子矩陣分析挑選比例評分?jǐn)?shù)量缺失評分?jǐn)?shù)量子矩陣密度5%41,90017,70270.30%10%128,813109,99553.94%15%226,243307,72742.37%20%322,887629,86533.89%2.3.2子矩陣缺失評分的預(yù)測由活躍用戶與熱門資源所組成的高密度子矩陣中包含豐富的數(shù)據(jù)信息,因此,使用基本的矩陣分解模型RegularizedSVD(RSVD)便能很好的學(xué)習(xí)到用戶與資源的特征,從而對其中的缺失項(xiàng)進(jìn)行預(yù)測。如式(2-1)所示,子矩陣將被分解成用戶特征矩陣和資源特征矩陣的乘積:
武漢理工大學(xué)碩士學(xué)位論文12.4.3實(shí)驗(yàn)結(jié)果為了評估在矩陣預(yù)填充階段,流行度懲罰項(xiàng)對于預(yù)填充評分精度的影響,本文在不同的活躍用戶和熱門資源的選擇比例下,對比了ESVD方法與本文提出的ESVD-P方法的填充評分精度的實(shí)驗(yàn)結(jié)果。如圖2-4(a)所示,在T8的實(shí)驗(yàn)設(shè)定下,當(dāng)活躍用戶和熱門資源的選擇比例在5%-20%范圍時,本文提出的ESVD-P矩陣預(yù)填充算法(在圖中由藍(lán)色表示)在填充評分的RMSE指標(biāo)上要優(yōu)于ESVD矩陣預(yù)填充算法(在圖中由紅色表示)。圖中可以發(fā)現(xiàn),當(dāng)選擇比例繼續(xù)擴(kuò)大時,對于挑選出的用戶和資源,整體上的用戶活躍度和資源流行度要更加趨于平均,因此流行度所帶來的影響也逐漸消失。如圖2-4(b)所示,本文提出的ESVD-P預(yù)填充算法在填充評分的MAE指標(biāo)上同樣要優(yōu)于ESVD方法,結(jié)合RMSE指標(biāo)進(jìn)行綜合分析,可以發(fā)現(xiàn)流行度懲罰項(xiàng)對于評分的平均誤差影響較小,但顯著降低了填充評分誤差的波動幅度。(a)RMSE(b)MAE圖2-4T8實(shí)驗(yàn)設(shè)定下矩陣預(yù)填充誤差(a)RMSE(b)MAE圖2-5T9實(shí)驗(yàn)設(shè)定下矩陣預(yù)填充誤差如圖2-5所示,在T9的實(shí)驗(yàn)設(shè)定下?lián)碛邢嗨频膶?shí)驗(yàn)結(jié)果。當(dāng)選擇比例降低
【參考文獻(xiàn)】:
期刊論文
[1]語義分析與TF-IDF方法相結(jié)合的新聞推薦技術(shù)[J]. 周由,戴牡紅. 計(jì)算機(jī)科學(xué). 2013(S2)
[2]推薦系統(tǒng)評價指標(biāo)綜述[J]. 朱郁筱,呂琳媛. 電子科技大學(xué)學(xué)報(bào). 2012(02)
[3]流數(shù)據(jù)挖掘綜述[J]. 孫玉芬,盧炎生. 計(jì)算機(jī)科學(xué). 2007(01)
本文編號:3303587
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
MovieLens1M數(shù)據(jù)集中電影評分?jǐn)?shù)量分布
武漢理工大學(xué)碩士學(xué)位論文1圖2-2MovieLens1M數(shù)據(jù)集中用戶評分?jǐn)?shù)量分布將上述挑選出的熱門資源子矩陣與活躍用戶子矩陣相結(jié)合,便得到最終的高密度子矩陣,以MovieLens1M數(shù)據(jù)集為例,如表2-1所示,前5%的活躍用戶與前5%的熱門資源構(gòu)成的子評分矩陣中一共包含41,900個已知評分,缺失評分?jǐn)?shù)量僅為17,702個,子矩陣的整體密度高達(dá)70.30%,要遠(yuǎn)遠(yuǎn)高于原始評分矩陣4.19%的密度。表2-1不同挑選比例下的子矩陣分析挑選比例評分?jǐn)?shù)量缺失評分?jǐn)?shù)量子矩陣密度5%41,90017,70270.30%10%128,813109,99553.94%15%226,243307,72742.37%20%322,887629,86533.89%2.3.2子矩陣缺失評分的預(yù)測由活躍用戶與熱門資源所組成的高密度子矩陣中包含豐富的數(shù)據(jù)信息,因此,使用基本的矩陣分解模型RegularizedSVD(RSVD)便能很好的學(xué)習(xí)到用戶與資源的特征,從而對其中的缺失項(xiàng)進(jìn)行預(yù)測。如式(2-1)所示,子矩陣將被分解成用戶特征矩陣和資源特征矩陣的乘積:
武漢理工大學(xué)碩士學(xué)位論文12.4.3實(shí)驗(yàn)結(jié)果為了評估在矩陣預(yù)填充階段,流行度懲罰項(xiàng)對于預(yù)填充評分精度的影響,本文在不同的活躍用戶和熱門資源的選擇比例下,對比了ESVD方法與本文提出的ESVD-P方法的填充評分精度的實(shí)驗(yàn)結(jié)果。如圖2-4(a)所示,在T8的實(shí)驗(yàn)設(shè)定下,當(dāng)活躍用戶和熱門資源的選擇比例在5%-20%范圍時,本文提出的ESVD-P矩陣預(yù)填充算法(在圖中由藍(lán)色表示)在填充評分的RMSE指標(biāo)上要優(yōu)于ESVD矩陣預(yù)填充算法(在圖中由紅色表示)。圖中可以發(fā)現(xiàn),當(dāng)選擇比例繼續(xù)擴(kuò)大時,對于挑選出的用戶和資源,整體上的用戶活躍度和資源流行度要更加趨于平均,因此流行度所帶來的影響也逐漸消失。如圖2-4(b)所示,本文提出的ESVD-P預(yù)填充算法在填充評分的MAE指標(biāo)上同樣要優(yōu)于ESVD方法,結(jié)合RMSE指標(biāo)進(jìn)行綜合分析,可以發(fā)現(xiàn)流行度懲罰項(xiàng)對于評分的平均誤差影響較小,但顯著降低了填充評分誤差的波動幅度。(a)RMSE(b)MAE圖2-4T8實(shí)驗(yàn)設(shè)定下矩陣預(yù)填充誤差(a)RMSE(b)MAE圖2-5T9實(shí)驗(yàn)設(shè)定下矩陣預(yù)填充誤差如圖2-5所示,在T9的實(shí)驗(yàn)設(shè)定下?lián)碛邢嗨频膶?shí)驗(yàn)結(jié)果。當(dāng)選擇比例降低
【參考文獻(xiàn)】:
期刊論文
[1]語義分析與TF-IDF方法相結(jié)合的新聞推薦技術(shù)[J]. 周由,戴牡紅. 計(jì)算機(jī)科學(xué). 2013(S2)
[2]推薦系統(tǒng)評價指標(biāo)綜述[J]. 朱郁筱,呂琳媛. 電子科技大學(xué)學(xué)報(bào). 2012(02)
[3]流數(shù)據(jù)挖掘綜述[J]. 孫玉芬,盧炎生. 計(jì)算機(jī)科學(xué). 2007(01)
本文編號:3303587
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3303587.html
最近更新
教材專著