基于用戶(hù)評(píng)分與評(píng)論的推薦系統(tǒng)研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2024-03-08 04:06
互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,極大地降低了人們獲取信息的門(mén)檻,與此同時(shí),全球互聯(lián)網(wǎng)上每時(shí)每刻都在產(chǎn)生龐大的數(shù)據(jù),人類(lèi)社會(huì)已經(jīng)進(jìn)入了信息過(guò)載的時(shí)代;趨f(xié)同過(guò)濾的個(gè)性化推薦技術(shù)作為解決信息過(guò)載問(wèn)題的有效手段,能夠通過(guò)分析用戶(hù)的歷史行為,從海量的數(shù)據(jù)中挖掘出與用戶(hù)興趣相符的信息進(jìn)行推薦。不僅幫助人們提高了信息獲取的效率,而且也讓信息能夠精準(zhǔn)的展現(xiàn)在對(duì)它感興趣的用戶(hù)面前,為企業(yè)帶來(lái)了巨大的經(jīng)濟(jì)效益。在實(shí)際的應(yīng)用中,傳統(tǒng)的協(xié)同過(guò)濾推薦算法面臨數(shù)據(jù)稀疏性和冷啟動(dòng)問(wèn)題,導(dǎo)致算法預(yù)測(cè)的精確度以及運(yùn)行效率偏低。為彌補(bǔ)協(xié)同過(guò)濾推薦算法的不足,本文提出了一種基于用戶(hù)評(píng)分與評(píng)論的推薦系統(tǒng)方案,并在Spark平臺(tái)上進(jìn)行了實(shí)現(xiàn)。本文的主要工作包括以下幾個(gè)方面:(1)提出了一種基于大數(shù)據(jù)預(yù)處理技術(shù)的物品特征提取方法。首先對(duì)用戶(hù)評(píng)論的文本進(jìn)行預(yù)處理,包括物品評(píng)論聚合,缺失評(píng)論填充,重復(fù)數(shù)據(jù)刪除,評(píng)論數(shù)據(jù)格式轉(zhuǎn)換,然后利用Word2Vec模型從預(yù)處理后的評(píng)論文本中提取物品特征,取得了較好的效果。(2)提出了一種基于用戶(hù)評(píng)分與評(píng)論的推薦算法。首先引入用戶(hù)評(píng)論的詞頻、評(píng)分、評(píng)論時(shí)間和評(píng)論幫助度改進(jìn)物品特征,然后根據(jù)物品特征計(jì)算物...
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀與分析
1.2.1 推薦系統(tǒng)研究現(xiàn)狀
1.2.2 詞向量研究現(xiàn)狀
1.2.3 大數(shù)據(jù)處理技術(shù)研究現(xiàn)狀
1.3 論文主要研究工作
1.4 論文章節(jié)安排
第二章 相關(guān)理論與技術(shù)介紹
2.1 引言
2.2 推薦系統(tǒng)
2.2.1 協(xié)同過(guò)濾推薦系統(tǒng)架構(gòu)
2.2.2 基于鄰域的協(xié)同過(guò)濾
2.2.3 基于模型的協(xié)同過(guò)濾
2.3 詞向量Word2Vec
2.4 分布式大數(shù)據(jù)計(jì)算框架
2.4.1 分布式文件系統(tǒng)HDFS
2.4.2 分布式計(jì)算框架Spark
2.5 本章小結(jié)
第三章 基于大數(shù)據(jù)預(yù)處理技術(shù)的物品特征提取
3.1 引言
3.2 用戶(hù)評(píng)論的優(yōu)勢(shì)
3.3 評(píng)論文本預(yù)處理
3.3.1 物品評(píng)論聚合
3.3.2 缺失評(píng)論填充
3.3.3 重復(fù)數(shù)據(jù)刪除
3.3.4 數(shù)據(jù)格式轉(zhuǎn)換
3.4 評(píng)論文本特征提取
3.5 本章小結(jié)
第四章 基于用戶(hù)評(píng)分與評(píng)論的推薦算法
4.1 引言
4.2 用戶(hù)評(píng)論包含信息
4.3 物品特征改進(jìn)
4.3.1 詞頻權(quán)重計(jì)算
4.3.2 評(píng)分權(quán)重計(jì)算
4.3.3 時(shí)間權(quán)重計(jì)算
4.3.4 評(píng)論幫助度權(quán)重計(jì)算
4.4 基于用戶(hù)評(píng)分與評(píng)論的推薦算法
4.4.1 物品相似度計(jì)算
4.4.2 評(píng)分預(yù)測(cè)
4.4.3 推薦列表生成
4.5 本章小結(jié)
第五章 基于Spark的推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 引言
5.2 個(gè)性化推薦系統(tǒng)架構(gòu)設(shè)計(jì)
5.3 數(shù)據(jù)收集存儲(chǔ)及傳輸
5.3.1 數(shù)據(jù)收集
5.3.2 數(shù)據(jù)存儲(chǔ)
5.3.3 數(shù)據(jù)傳輸
5.4 推薦引擎
5.4.1 在線(xiàn)計(jì)算
5.4.2 離線(xiàn)計(jì)算
5.4.3 算法并行化執(zhí)行
5.5 界面交互
5.5.1 商品推薦
5.5.2 商品評(píng)價(jià)
5.6 本章小結(jié)
第六章 實(shí)驗(yàn)與結(jié)果分析
6.1 引言
6.2 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估方法
6.2.1 實(shí)驗(yàn)數(shù)據(jù)及格式
6.2.2 實(shí)驗(yàn)評(píng)估指標(biāo)
6.3 數(shù)據(jù)預(yù)處理
6.3.1 實(shí)驗(yàn)環(huán)境配置
6.3.2 數(shù)據(jù)預(yù)處理
6.3.3 Word2Vec模型訓(xùn)練
6.4 實(shí)驗(yàn)與結(jié)果分析
6.4.1 最近鄰個(gè)數(shù)對(duì)結(jié)果的影響
6.4.2 對(duì)比實(shí)驗(yàn)結(jié)果及分析
6.4.3 并行化對(duì)結(jié)果的影響
6.5 本章小結(jié)
總結(jié)與展望
本文工作總結(jié)
本文工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號(hào):3921983
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀與分析
1.2.1 推薦系統(tǒng)研究現(xiàn)狀
1.2.2 詞向量研究現(xiàn)狀
1.2.3 大數(shù)據(jù)處理技術(shù)研究現(xiàn)狀
1.3 論文主要研究工作
1.4 論文章節(jié)安排
第二章 相關(guān)理論與技術(shù)介紹
2.1 引言
2.2 推薦系統(tǒng)
2.2.1 協(xié)同過(guò)濾推薦系統(tǒng)架構(gòu)
2.2.2 基于鄰域的協(xié)同過(guò)濾
2.2.3 基于模型的協(xié)同過(guò)濾
2.3 詞向量Word2Vec
2.4 分布式大數(shù)據(jù)計(jì)算框架
2.4.1 分布式文件系統(tǒng)HDFS
2.4.2 分布式計(jì)算框架Spark
2.5 本章小結(jié)
第三章 基于大數(shù)據(jù)預(yù)處理技術(shù)的物品特征提取
3.1 引言
3.2 用戶(hù)評(píng)論的優(yōu)勢(shì)
3.3 評(píng)論文本預(yù)處理
3.3.1 物品評(píng)論聚合
3.3.2 缺失評(píng)論填充
3.3.3 重復(fù)數(shù)據(jù)刪除
3.3.4 數(shù)據(jù)格式轉(zhuǎn)換
3.4 評(píng)論文本特征提取
3.5 本章小結(jié)
第四章 基于用戶(hù)評(píng)分與評(píng)論的推薦算法
4.1 引言
4.2 用戶(hù)評(píng)論包含信息
4.3 物品特征改進(jìn)
4.3.1 詞頻權(quán)重計(jì)算
4.3.2 評(píng)分權(quán)重計(jì)算
4.3.3 時(shí)間權(quán)重計(jì)算
4.3.4 評(píng)論幫助度權(quán)重計(jì)算
4.4 基于用戶(hù)評(píng)分與評(píng)論的推薦算法
4.4.1 物品相似度計(jì)算
4.4.2 評(píng)分預(yù)測(cè)
4.4.3 推薦列表生成
4.5 本章小結(jié)
第五章 基于Spark的推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 引言
5.2 個(gè)性化推薦系統(tǒng)架構(gòu)設(shè)計(jì)
5.3 數(shù)據(jù)收集存儲(chǔ)及傳輸
5.3.1 數(shù)據(jù)收集
5.3.2 數(shù)據(jù)存儲(chǔ)
5.3.3 數(shù)據(jù)傳輸
5.4 推薦引擎
5.4.1 在線(xiàn)計(jì)算
5.4.2 離線(xiàn)計(jì)算
5.4.3 算法并行化執(zhí)行
5.5 界面交互
5.5.1 商品推薦
5.5.2 商品評(píng)價(jià)
5.6 本章小結(jié)
第六章 實(shí)驗(yàn)與結(jié)果分析
6.1 引言
6.2 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估方法
6.2.1 實(shí)驗(yàn)數(shù)據(jù)及格式
6.2.2 實(shí)驗(yàn)評(píng)估指標(biāo)
6.3 數(shù)據(jù)預(yù)處理
6.3.1 實(shí)驗(yàn)環(huán)境配置
6.3.2 數(shù)據(jù)預(yù)處理
6.3.3 Word2Vec模型訓(xùn)練
6.4 實(shí)驗(yàn)與結(jié)果分析
6.4.1 最近鄰個(gè)數(shù)對(duì)結(jié)果的影響
6.4.2 對(duì)比實(shí)驗(yàn)結(jié)果及分析
6.4.3 并行化對(duì)結(jié)果的影響
6.5 本章小結(jié)
總結(jié)與展望
本文工作總結(jié)
本文工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號(hào):3921983
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3921983.html
最近更新
教材專(zhuān)著