推薦算法時間動態(tài)特性研究及其分布式實現(xiàn)
本文關鍵詞:推薦算法時間動態(tài)特性研究及其分布式實現(xiàn)
更多相關文章: 推薦系統(tǒng) 動態(tài)特性 矩陣分解 時間信息 MapReduce
【摘要】:近年來,隨著信息行業(yè)的高速發(fā)展,產(chǎn)生數(shù)據(jù)量越來越多,使我們飽受“信息過載”的困擾。推薦系統(tǒng)的誕生即是為了解決信息過載的問題,然而傳統(tǒng)的推薦算法沒有考慮時間信息的動態(tài)特性,使得推薦效果受到影響,同時,推薦算法的實時性還受到大數(shù)據(jù)量的考驗,對此,本文做了如下工作:對推薦系統(tǒng)的用戶興趣變化、用戶評分變化、季節(jié)效應、節(jié)假日效應等時間效應和動態(tài)特性做了研究,總結了國內(nèi)外對推薦系統(tǒng)的時間信息動態(tài)特性的研究進展,并將用戶偏好和產(chǎn)品受歡迎度隨時間變化信息融合到矩陣分解模型中,采用Netflix Probe測試數(shù)據(jù)集和Movielens 1M數(shù)據(jù)集進行了實驗,實驗結果表明,融入時間信息的TemporalBMF算法比BMF的評分預測誤差有所降低,準確度明顯提升。研究用并行化交替最小二乘法(ALS)、隨機梯度下降法(SGD)和分布式隨機梯度下降法(DSGD)來優(yōu)化矩陣分解推薦算法,給出了具體的MapReduce實現(xiàn)步驟,實現(xiàn)了基于Hadoop MapReduce的矩陣分解ALS、SGD、DSGD算法,對比了算法的收斂性能、準確率、迭代時間。最后,基于Spark實現(xiàn)DSGD優(yōu)化的TemporalBMF和MF算法,實驗結果證明了算法并行化的可行性和有效性。
【關鍵詞】:推薦系統(tǒng) 動態(tài)特性 矩陣分解 時間信息 MapReduce
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 致謝5-6
- 摘要6-7
- Abstract7-11
- 第1章 緒論11-17
- 1.1 研究背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-13
- 1.3 推薦系統(tǒng)功能與應用13-16
- 1.3.1 推薦系統(tǒng)的功能13-14
- 1.3.2 推薦系統(tǒng)的應用14-16
- 1.4 本文內(nèi)容與結構16-17
- 第2章 推薦系統(tǒng)概述及數(shù)據(jù)挖掘技術17-37
- 2.1 推薦系統(tǒng)評測方法17-18
- 2.1.1 離線實驗17
- 2.1.2 用戶調(diào)查17-18
- 2.1.3 在線實驗18
- 2.2 推薦系統(tǒng)評測指標18-20
- 2.2.1 準確度18-19
- 2.2.2 覆蓋率19-20
- 2.2.3 多樣性和新穎性20
- 2.2.4 評測指標總結20
- 2.3 推薦系統(tǒng)主要算法20-24
- 2.3.1 基于內(nèi)容過濾推薦20-22
- 2.3.2 協(xié)同過濾推薦22-23
- 2.3.3 基于社交網(wǎng)絡推薦23-24
- 2.4 推薦系統(tǒng)冷啟動問題24
- 2.5 推薦系統(tǒng)中的數(shù)據(jù)挖掘技術24-36
- 2.5.1 數(shù)據(jù)挖掘步驟24-25
- 2.5.2 數(shù)據(jù)預處理25-26
- 2.5.3 分類算法26-35
- 2.5.4 聚類算法35-36
- 2.6 本章小結36-37
- 第3章 推薦系統(tǒng)動態(tài)特性研究37-44
- 3.1 時間效應37-40
- 3.1.1 用戶興趣變化37-39
- 3.1.2 季節(jié)假日效應39-40
- 3.2 時間信息推薦算法研究進展40-42
- 3.3 本章小結42-44
- 第4章 實驗分析44-52
- 4.1 數(shù)據(jù)集44-45
- 4.1.1 Netflix數(shù)據(jù)集44
- 4.1.2 MovieLens數(shù)據(jù)集44-45
- 4.1.3 Alibaba天貓數(shù)據(jù)集45
- 4.1.4 其他數(shù)據(jù)集45
- 4.2 矩陣分解45-48
- 4.2.1 矩陣分解模型45-47
- 4.2.2 融入時間信息的矩陣分解模型47-48
- 4.3 實驗設計48-51
- 4.3.1 實驗數(shù)據(jù)48-49
- 4.3.2 實驗結果49-51
- 4.4 本章小結51-52
- 第5章 矩陣分解算法的分布式實現(xiàn)研究52-66
- 5.1 分布式計算52-56
- 5.1.1 硬件環(huán)境52-53
- 5.1.2 Hadoop53-55
- 5.1.3 Spark55-56
- 5.2 矩陣分解算法的并行化研究56-60
- 5.2.1 交替最小二乘法56-57
- 5.2.2 隨機梯度下降法57-59
- 5.2.3 分布式隨機梯度下降法59-60
- 5.3 TemporalBMF算法的分布式實現(xiàn)60-61
- 5.4 實驗結果與分析61-64
- 5.4.1 矩陣分解三種優(yōu)化方式比較61-63
- 5.4.2 TemporalBMF算法并行化63-64
- 5.5 本章小結64-66
- 第6章 總結與展望66-68
- 6.1 本文總結66
- 6.2 工作展望66-68
- 參考文獻68-72
- 科研成果72
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐義峰;徐云青;劉曉平;;一種基于時間序列性的推薦算法[J];計算機系統(tǒng)應用;2006年10期
2 余小鵬;;一種基于多層關聯(lián)規(guī)則的推薦算法研究[J];計算機應用;2007年06期
3 張海玉;劉志都;楊彩;賈松浩;;基于頁面聚類的推薦算法的改進[J];計算機應用與軟件;2008年09期
4 張立燕;;一種基于用戶事務模式的推薦算法[J];福建電腦;2009年03期
5 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國科技信息;2009年07期
6 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強;;智能博物館環(huán)境下的個性化推薦算法[J];計算機工程與應用;2010年19期
7 王文;;個性化推薦算法研究[J];電腦知識與技術;2010年16期
8 張愷;秦亮曦;寧朝波;李文閣;;改進評價估計的混合推薦算法研究[J];微計算機信息;2010年36期
9 夏秀峰;代沁;叢麗暉;;用戶顯意識下的多重態(tài)度個性化推薦算法[J];計算機工程與應用;2011年16期
10 楊博;趙鵬飛;;推薦算法綜述[J];山西大學學報(自然科學版);2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個性化推薦算法[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個性化推薦算法[A];2008年計算機應用技術交流會論文集[C];2008年
3 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
4 周玉妮;鄭會頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動商務個性化推薦系統(tǒng)[A];社會經(jīng)濟發(fā)展轉型與系統(tǒng)工程——中國系統(tǒng)工程學會第17屆學術年會論文集[C];2012年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡的含時推薦算法[A];第五屆全國復雜網(wǎng)絡學術會議論文(摘要)匯集[C];2009年
6 梁莘q,
本文編號:645866
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/645866.html