基于多級相似度和信息核的協(xié)同過濾推薦算法研究
發(fā)布時間:2024-02-03 04:14
隨著信息技術(shù)的迅速發(fā)展和普及,數(shù)據(jù)資源以指數(shù)級別的速度增加,這使得用戶在面對眾多的網(wǎng)絡(luò)資源時,反而無法高效選擇出對自己有用的信息,進而出現(xiàn)信息超載問題。于是推薦系統(tǒng)應(yīng)運而生,它依據(jù)用戶的歷史數(shù)據(jù),通過用戶的興趣愛好來進行獨特的個性化分析、計算,從而為用戶提供有用的信息。現(xiàn)今推薦系統(tǒng)已廣泛應(yīng)用到社交網(wǎng)站,電子商務(wù),電子學習,電影推薦和旅游等諸多領(lǐng)域。隨著對推薦系統(tǒng)的深入研究,相應(yīng)的研究難題也顯露出來,例如對于新注冊的用戶,系統(tǒng)為其作推薦時的冷啟動問題;用戶評分矩陣中的數(shù)據(jù)稀疏性問題;隨著用戶和物品數(shù)目激增而帶來的系統(tǒng)可擴展性問題,以及大多數(shù)算法只注重推薦相似物品而缺乏多樣性的問題等等,這都影響了推薦系統(tǒng)的進一步發(fā)展。本文就協(xié)同過濾系統(tǒng)由于數(shù)據(jù)量增多而導致的日益嚴重的可擴展性問題、算法耗時長以及相似度函數(shù)度量準確性等問題,進行了如下內(nèi)容的研究:(1)針對協(xié)同過濾推薦中存在的可擴展性問題,本文使用了提取信息核的方法。即將一個用戶集的所有用戶進行訓練,提取出攜帶信息最具價值的核心用戶組成信息核,這一過程為離線操作,這使得在計算用戶相似度時,會大大節(jié)省內(nèi)存和時間消耗。本文在原有基于頻率(Freq...
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 論文工作內(nèi)容及章節(jié)安排
2 相關(guān)理論知識
2.1 非協(xié)同過濾推薦概述
2.1.1 基于內(nèi)容的推薦
2.1.2 基于知識的推薦
2.1.3 混合集成的推薦
2.2 協(xié)同過濾推薦概述
2.2.1 基于用戶的協(xié)同過濾
2.2.2 基于物品的協(xié)同過濾
2.2.3 基于模型的協(xié)同過濾
2.3 信息核概述
2.4 推薦算法性能評價
2.4.1 用戶相似度
2.4.2 數(shù)據(jù)集
2.4.3 評價標準
2.5 本章小結(jié)
3 基于優(yōu)化信息核的協(xié)同過濾推薦算法
3.1 信息核提取問題描述
3.1.1 基于頻率(FB)的算法模型
3.1.2 基于排名(RB)的算法模型
3.2 優(yōu)化的信息核提取方法
3.2.1 優(yōu)化的基于頻率(IFB)的算法模型
3.2.2 優(yōu)化的基于排名(IRB)的算法模型
3.3 實驗結(jié)果與分析
3.3.1 實驗數(shù)據(jù)集
3.3.2 實驗環(huán)境
3.3.3 實驗方案
3.3.4 實驗結(jié)果及分析
3.4 算法時間復雜度
3.5 本章小結(jié)
4 基于多級相似度的協(xié)同過濾推薦算法
4.1 經(jīng)典皮爾遜相關(guān)系數(shù)問題描述
4.2 多級相似度
4.2.1 基本思想
4.2.2 參數(shù)調(diào)節(jié)
4.3 實驗結(jié)果與分析
4.3.1 實驗方案
4.3.2 實驗結(jié)果及分析
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 工作總結(jié)
5.2 未來展望
致謝
參考文獻
攻讀學位期間的研究成果
本文編號:3893702
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 論文工作內(nèi)容及章節(jié)安排
2 相關(guān)理論知識
2.1 非協(xié)同過濾推薦概述
2.1.1 基于內(nèi)容的推薦
2.1.2 基于知識的推薦
2.1.3 混合集成的推薦
2.2 協(xié)同過濾推薦概述
2.2.1 基于用戶的協(xié)同過濾
2.2.2 基于物品的協(xié)同過濾
2.2.3 基于模型的協(xié)同過濾
2.3 信息核概述
2.4 推薦算法性能評價
2.4.1 用戶相似度
2.4.2 數(shù)據(jù)集
2.4.3 評價標準
2.5 本章小結(jié)
3 基于優(yōu)化信息核的協(xié)同過濾推薦算法
3.1 信息核提取問題描述
3.1.1 基于頻率(FB)的算法模型
3.1.2 基于排名(RB)的算法模型
3.2 優(yōu)化的信息核提取方法
3.2.1 優(yōu)化的基于頻率(IFB)的算法模型
3.2.2 優(yōu)化的基于排名(IRB)的算法模型
3.3 實驗結(jié)果與分析
3.3.1 實驗數(shù)據(jù)集
3.3.2 實驗環(huán)境
3.3.3 實驗方案
3.3.4 實驗結(jié)果及分析
3.4 算法時間復雜度
3.5 本章小結(jié)
4 基于多級相似度的協(xié)同過濾推薦算法
4.1 經(jīng)典皮爾遜相關(guān)系數(shù)問題描述
4.2 多級相似度
4.2.1 基本思想
4.2.2 參數(shù)調(diào)節(jié)
4.3 實驗結(jié)果與分析
4.3.1 實驗方案
4.3.2 實驗結(jié)果及分析
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 工作總結(jié)
5.2 未來展望
致謝
參考文獻
攻讀學位期間的研究成果
本文編號:3893702
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3893702.html
最近更新
教材專著