基于用戶評論的推薦算法研究
發(fā)布時間:2023-06-04 02:43
隨著互聯(lián)網(wǎng)迅速發(fā)展,信息數(shù)據(jù)呈爆炸式增長。為了在海量的數(shù)據(jù)中挖掘出用戶感興趣的內(nèi)容信息,推薦算法應(yīng)運而生;谟脩舻膮f(xié)同過濾推薦算法是常用的推薦算法之一,由于存在數(shù)據(jù)稀疏性問題和冷啟動問題,系統(tǒng)的推薦效果差強人意。評論文本含有豐富的產(chǎn)品信息和用戶觀點,可以用來提高系統(tǒng)的推薦效果,近年來引起了學者們的研究興趣。本文主要利用評論文本改進基于用戶的協(xié)同過濾推薦算法,主要的研究內(nèi)容如下:(1)深入分析評論文本的特點。傳統(tǒng)的TFIDF算法應(yīng)用于評論短文本時,重要詞匯和次要詞匯的詞頻分布差別不大,無法有效地提取出文本中的關(guān)鍵信息。針對該問題,本文引入評論數(shù)據(jù)集中的helpful反饋值,改進了TFIDF算法,從而區(qū)分了重要詞匯與次要詞匯,便于提取關(guān)鍵信息。(2)傳統(tǒng)的TextRank算法在抽取關(guān)鍵詞時,詞匯節(jié)點跳轉(zhuǎn)到鄰接節(jié)點時均分權(quán)重,未考慮不同鄰接節(jié)點的重要性差異。鑒于此,結(jié)合改進的TFIDF算法重新引導TextRank算法中權(quán)重分配的過程,提高了關(guān)鍵詞抽取的準確性。然而,改進后的TextRank算法抽取出的關(guān)鍵詞包含很多同義詞、重復詞,若不進行降維處理則會影響后續(xù)用戶主題偏好相似度的計算。本文利...
【文章頁數(shù)】:52 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 主要的研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 推薦算法相關(guān)技術(shù)介紹
2.1 協(xié)同過濾推薦算法
2.1.1 基于鄰域的算法
2.1.2 基于矩陣分解的算法
2.2 文本挖掘技術(shù)
2.2.1 文本向量化表示
2.2.2 SVD奇異值分解
2.3 本章小結(jié)
第三章 評論文本挖掘
3.1 引言
3.2 關(guān)鍵詞抽取
3.2.1 改進的TFIDF算法
3.2.2 TextRank算法
3.2.3 基于改進的TFIDF的TextRank算法
3.3實驗
3.3.1 實驗環(huán)境與實驗數(shù)據(jù)
3.3.2 評價標準
3.3.3 實驗過程與結(jié)果分析
3.4 本章小結(jié)
第四章 結(jié)合評論文本和評分的協(xié)同過濾推薦算法
4.1 引言
4.2 傳統(tǒng)的基于用戶的協(xié)同過濾推薦算法
4.2.1 方法的不足
4.2.2 改進思路
4.3 用戶綜合相似度計算方法
4.3.1 項目特征分布與用戶主題偏好
4.3.2 用戶評分相似度計算
4.3.3 用戶綜合相似度計算
4.4 評分預測
4.5 實驗及結(jié)果分析
4.5.1 數(shù)據(jù)集和實驗環(huán)境
4.5.2 評價標準
4.5.3 對比算法
4.5.4 實驗過程與實驗結(jié)果分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
攻讀學位期間的研究成果
本文編號:3830531
【文章頁數(shù)】:52 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 主要的研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 推薦算法相關(guān)技術(shù)介紹
2.1 協(xié)同過濾推薦算法
2.1.1 基于鄰域的算法
2.1.2 基于矩陣分解的算法
2.2 文本挖掘技術(shù)
2.2.1 文本向量化表示
2.2.2 SVD奇異值分解
2.3 本章小結(jié)
第三章 評論文本挖掘
3.1 引言
3.2 關(guān)鍵詞抽取
3.2.1 改進的TFIDF算法
3.2.2 TextRank算法
3.2.3 基于改進的TFIDF的TextRank算法
3.3實驗
3.3.1 實驗環(huán)境與實驗數(shù)據(jù)
3.3.2 評價標準
3.3.3 實驗過程與結(jié)果分析
3.4 本章小結(jié)
第四章 結(jié)合評論文本和評分的協(xié)同過濾推薦算法
4.1 引言
4.2 傳統(tǒng)的基于用戶的協(xié)同過濾推薦算法
4.2.1 方法的不足
4.2.2 改進思路
4.3 用戶綜合相似度計算方法
4.3.1 項目特征分布與用戶主題偏好
4.3.2 用戶評分相似度計算
4.3.3 用戶綜合相似度計算
4.4 評分預測
4.5 實驗及結(jié)果分析
4.5.1 數(shù)據(jù)集和實驗環(huán)境
4.5.2 評價標準
4.5.3 對比算法
4.5.4 實驗過程與實驗結(jié)果分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
攻讀學位期間的研究成果
本文編號:3830531
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3830531.html
最近更新
教材專著