長尾物品個性化推薦中的協(xié)同過濾
發(fā)布時間:2023-03-29 20:14
互聯(lián)網(wǎng)和科學技術(shù)的發(fā)展不斷地降低物品的生產(chǎn)成本,致使物品空間迅速膨脹,長尾物品越來越多;物質(zhì)世界的日益豐富,使得人們對個性化的要求也越來越高,而不再是從眾地消費熱門物品。但在信息的汪洋大海中,人們很難發(fā)掘自己感興趣的長尾物品,長尾市場也難以定位到合適的用戶群體。為了解決信息過載和不對稱的問題,推薦系統(tǒng)應(yīng)運而生,但目前常見的推薦算法大都傾向于為用戶推薦熱門產(chǎn)品。因此,構(gòu)建長尾物品個性化推薦模型具有十分重要的現(xiàn)實意義。本文在MovieLens數(shù)據(jù)集上進行長尾物品推薦研究。針對用戶物品矩陣數(shù)據(jù)所擁有的稀疏性、物品流行度分布有偏性特點,使用ITCC雙聚類和K-means聚類算法對其進行聚類。實證分析結(jié)果表明,聚類算法能有效地提高子用戶物品矩陣的稠密度和長尾物品的流行度,并且以聚類方法作為基于物品的協(xié)同過濾算法的預(yù)處理步驟,能提升長尾物品的推薦效果。其次,面對隱反饋用戶物品矩陣數(shù)據(jù)缺少明確的正負反饋信息的問題和推薦長尾物品的需求,本文探索改進基于隱語義模型的協(xié)同過濾算法:對于用戶物品矩陣中的每個用戶物品對,根據(jù)有無歷史交互記錄猜測用戶對物品是否感興趣,并根據(jù)物品的流行度給出猜測的置信度。這樣的改...
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文結(jié)構(gòu)與創(chuàng)新點
第二章 數(shù)據(jù)來源及描述性分析
2.1 數(shù)據(jù)來源及預(yù)處理
2.2 變量說明與問題解釋
2.3 描述性分析
第三章 基于聚類和近鄰的協(xié)同過濾
3.1 模型評價準則
3.2 聚類算法
3.2.1 ITCC雙聚類
3.2.2 K-means聚類
3.3 基于近鄰的協(xié)同過濾
3.3.1 基于用戶的協(xié)同過濾
3.3.2 基于物品的協(xié)同過濾
3.4 實證分析
第四章 基于隱語義模型的協(xié)同過濾
4.1 隱語義模型及存在的不足
4.2 改進的隱語義模型
4.2.1 改進的隱語義模型
4.2.2 交替最小二乘算法
4.3 模擬研究
4.3.1 模擬用戶物品矩陣數(shù)據(jù)
4.3.2 參數(shù)選擇
4.3.3 模型比較
4.4 實證分析
4.4.1 參數(shù)選擇
4.4.2 模型比較
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
本文編號:3774399
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文結(jié)構(gòu)與創(chuàng)新點
第二章 數(shù)據(jù)來源及描述性分析
2.1 數(shù)據(jù)來源及預(yù)處理
2.2 變量說明與問題解釋
2.3 描述性分析
第三章 基于聚類和近鄰的協(xié)同過濾
3.1 模型評價準則
3.2 聚類算法
3.2.1 ITCC雙聚類
3.2.2 K-means聚類
3.3 基于近鄰的協(xié)同過濾
3.3.1 基于用戶的協(xié)同過濾
3.3.2 基于物品的協(xié)同過濾
3.4 實證分析
第四章 基于隱語義模型的協(xié)同過濾
4.1 隱語義模型及存在的不足
4.2 改進的隱語義模型
4.2.1 改進的隱語義模型
4.2.2 交替最小二乘算法
4.3 模擬研究
4.3.1 模擬用戶物品矩陣數(shù)據(jù)
4.3.2 參數(shù)選擇
4.3.3 模型比較
4.4 實證分析
4.4.1 參數(shù)選擇
4.4.2 模型比較
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
本文編號:3774399
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3774399.html
最近更新
教材專著