電子商務(wù)推薦系統(tǒng)中協(xié)同過濾算法的研究
發(fā)布時(shí)間:2017-05-02 14:01
本文關(guān)鍵詞:電子商務(wù)推薦系統(tǒng)中協(xié)同過濾算法的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:推薦系統(tǒng)在電子商務(wù)空前發(fā)展的情況下顯示了良好的應(yīng)用前景,正逐步走入人們的日常生活,它一方面改善了用戶的網(wǎng)絡(luò)購物體驗(yàn),另一方面成為“虛擬的網(wǎng)絡(luò)促銷員”,幫助賣家將買家的潛在需求變成真正的購買行為,達(dá)到增加銷售額的目的。協(xié)同過濾算法是推薦系統(tǒng)中應(yīng)用最成功、最廣泛的一種。它幫助人們解決信息過載等問題,具有簡單、高效的特點(diǎn)。但也存在稀疏性、冷啟動(dòng)、推薦質(zhì)量與實(shí)時(shí)性平衡等諸多問題。 本文首先研究了傳統(tǒng)的協(xié)同過濾算法:Item-Based協(xié)同過濾算法和User-Based算法。針對協(xié)同過濾算法的核心-計(jì)算用戶(項(xiàng)目)相似度方面,提出利用云模型和K-means算法改進(jìn)相似度的計(jì)算。使用用戶評分特征向量的夾角余弦計(jì)算代替用戶評分的夾角余弦計(jì)算,可以在粗粒度地考慮對象整體的相似性,綜合了對象屬性信息對用戶相似度的影響。 在解決傳統(tǒng)的協(xié)同過濾算法的稀疏性方面,首先給出了稀疏性的問題定義,并在對比已有解決方法的優(yōu)缺點(diǎn)后,給出了基于PCA降維的協(xié)同過濾算法,首先對高維的稀疏矩陣進(jìn)行缺省值填充,然后利用主成分分析(PCA)算法對經(jīng)過填充得到的稠密矩陣進(jìn)行變換,提取主成分因子,再對降維后的主成分向量進(jìn)行遞歸矩陣聚類,得到具有相似興趣的用戶(項(xiàng)目)簇C1,C2,...Cp,找到目標(biāo)用戶Ui所在的簇Ci,根據(jù)用戶Ui的最近鄰對待評分用戶的項(xiàng)目評分預(yù)測用戶Ui對待評分項(xiàng)目的評分。 最后,選用當(dāng)前絕大多數(shù)電子商務(wù)推薦系統(tǒng)研究的所采用的數(shù)據(jù)集MovieLens,設(shè)計(jì)了對比實(shí)驗(yàn)證實(shí)了算法的有效性。
【關(guān)鍵詞】:推薦系統(tǒng) 協(xié)同過濾 Item-Based User-Based 數(shù)據(jù)降維 PCA MovieLens
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP391.41
【目錄】:
- 提要4-5
- 摘要5-7
- Abstract7-13
- 第1章 緒論13-21
- 1.1 研究背景13-14
- 1.2 電子商務(wù)推薦系統(tǒng)研究內(nèi)容及其存在的主要問題14-16
- 1.2.1 推薦系統(tǒng)研究內(nèi)容14-15
- 1.2.2 推薦系統(tǒng)存在的主要問題15-16
- 1.3 協(xié)同過濾技術(shù)研究現(xiàn)狀及面臨的挑戰(zhàn)16-18
- 1.3.1 協(xié)同過濾技術(shù)研究現(xiàn)狀16-17
- 1.3.2 協(xié)同過濾技術(shù)面臨的主要挑戰(zhàn)17-18
- 1.4 本文的主要工作18-19
- 1.5 本文的組織結(jié)構(gòu)19-21
- 第2章 電子商務(wù)推薦技術(shù)概述21-30
- 2.1 個(gè)性化推薦技術(shù)概述21-24
- 2.1.1 基于內(nèi)容的過濾技術(shù)21-22
- 2.1.2 協(xié)同過濾技術(shù)22-24
- 2.2 USER-BASED協(xié)同過濾推薦算法24-27
- 2.2.1 表示階段25
- 2.2.2 用戶相似性計(jì)算25-26
- 2.2.3 最近鄰的生成階段26
- 2.2.4 推薦策略26-27
- 2.3 ITEM-BASED協(xié)同過濾推薦算法27
- 2.4 傳統(tǒng)的協(xié)同過濾算法存在的問題27-29
- 2.5 本章小結(jié)29-30
- 第3章 協(xié)同過濾算法相似度的改進(jìn)研究30-36
- 3.1 云模型概述30
- 3.2 云模型的描述30-33
- 3.2.1 云的可視化方法31-32
- 3.2.2 云發(fā)生器(Cloud Generator)32-33
- 3.3 基于云模型的K-MEANS協(xié)同過濾算法33-35
- 3.3.1 K-Means算法33-34
- 3.3.2 利用云模型改進(jìn)用戶相似度計(jì)算34-35
- 3.4 本章小結(jié)35-36
- 第4章 解決協(xié)同過濾算法輸入稀疏性的研究36-45
- 4.1 稀疏性問題及其常用的解決方案36-37
- 4.2 解決稀疏性問題的算法37-39
- 4.2.1 基于缺省值填充的最近鄰算法37-38
- 4.2.2 基于SVD預(yù)測評分的最近鄰算法38-39
- 4.3 數(shù)據(jù)降維39-41
- 4.3.1 數(shù)據(jù)降維方法概述39
- 4.3.2 主成分分析法介紹39-41
- 4.4 基于PCA的協(xié)同過濾算法41-43
- 4.4.1 標(biāo)準(zhǔn)化用戶-項(xiàng)目評分矩陣41-42
- 4.4.2 皮爾森相關(guān)性矩陣42
- 4.4.3 主成分分析42-43
- 4.4.4 遞歸矩陣聚類43
- 4.4.5 形成推薦的總體步驟43
- 4.5 本章小結(jié)43-45
- 第5章 實(shí)驗(yàn)結(jié)果及分析45-53
- 5.1 實(shí)驗(yàn)基礎(chǔ)45-46
- 5.1.1 數(shù)據(jù)集45-46
- 5.1.2 度量標(biāo)準(zhǔn)46
- 5.1.3 實(shí)驗(yàn)平臺(tái)46
- 5.2 傳統(tǒng)的協(xié)同過濾算法46-49
- 5.2.1 三種標(biāo)準(zhǔn)相似度的影響46-47
- 5.2.2 傳統(tǒng)的Item-Based與User-Based協(xié)同過濾算法比較47-48
- 5.2.3 傳統(tǒng)的協(xié)調(diào)過濾算法受其他因素的影響48-49
- 5.3 云模型49-51
- 5.4 數(shù)據(jù)填充51-52
- 5.5 本章小結(jié)52-53
- 第6章 總結(jié)與展望53-55
- 6.1 本文的總結(jié)53
- 6.2 下一步工作53-55
- 參考文獻(xiàn)55-59
- 作者簡介及在學(xué)校期間所取得的科研成果59-60
- 致謝60
【引證文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李君;基于在線評論的個(gè)性化推薦系統(tǒng)[D];電子科技大學(xué);2013年
本文關(guān)鍵詞:電子商務(wù)推薦系統(tǒng)中協(xié)同過濾算法的研究,,由筆耕文化傳播整理發(fā)布。
本文編號:341056
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/341056.html
最近更新
教材專著