結(jié)合雙重心理動機建模和強化學習的個性化推薦
發(fā)布時間:2022-09-29 20:44
個性化推薦系統(tǒng)能夠提供給用戶個性化對象或服務,在減輕信息過載問題方面發(fā)揮著至關(guān)重要的作用。然而,一個好的推薦系統(tǒng)不僅僅是推薦給用戶符合其心意的對象,還要能夠挖掘用戶的興趣,因此了解真實場景下影響用戶選擇的真實原因是非常必要的。在真實場景下,影響用戶選擇的真實原因是用戶的心理動機,根據(jù)心理學中對動機的闡述,其主要包括內(nèi)在動機和外在動機兩部分。其中,內(nèi)在動機是指建立在個體內(nèi)在想法的基礎(chǔ)上的,外在動機是來自于個體外在的影響。然而,在當前推薦模型中,用戶的歷史選擇信息和用戶與對象的輔助信息相結(jié)合的合理性及優(yōu)勢來源于對內(nèi)在動機的間接刻畫。而當前方法上缺乏對外在動機的刻畫,以及對兩種動機的聯(lián)合建模。為了實現(xiàn)對雙重動機的聯(lián)合建模,我們選用了深度學習與強化學習結(jié)合的方式。首先我們使用深度學習模型即堆疊多層降噪編碼機Stacked Denoising Auto-Encoder(SDAE)模型來利用用戶的歷史選擇信息和用戶與對象的輔助信息同時建模用戶和對象并得到初步的用戶和對象的潛在特征表示,并利用了貝葉斯概率矩陣分解(BPMF)對用戶與對象的潛在特征表示進行了優(yōu)化。在用戶和對象的潛在特征表示的基礎(chǔ)上,我...
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 對象的向量化表示
1.2.2 貝葉斯概率矩陣分解及其在推薦系統(tǒng)中的應用
1.2.3 強化學習及其在推薦系統(tǒng)中的應用
1.3 本文的問題定義及研究思路
1.3.1 問題定義
1.3.2 研究思路與貢獻
1.4 本文組織結(jié)構(gòu)
第2章 基于多源信息的用戶與對象的向量化表示
2.1 結(jié)合輔助信息與歷史選擇信息的推薦系統(tǒng)輸入
2.2 基于多源信息與SDAE的向量化表示
2.3 基于BPMF模型的模型構(gòu)建及優(yōu)化
2.4 本章小結(jié)
第3章 結(jié)合雙重心理動機和強化學習的個性化推薦
3.1 選擇行為的內(nèi)在與外在心理動機
3.2 基于強化學習的雙重心理動機建模
3.2.1 Q-learning(Off-policy)模型
3.2.2 基于內(nèi)在與外在動機的表示模型構(gòu)建及個性化推薦
3.3 本章小結(jié)
第4章 實驗與分析
4.1 實驗數(shù)據(jù)介紹
4.2 評價指標的介紹
4.2.1 RMSE評價指標的介紹
4.2.2 Recall@K評價指標的介紹
4.3 實驗參數(shù)設置及訓練細節(jié)
4.4 實驗模型對比、結(jié)果與分析
4.4.1 Baseline模型
4.4.2 實驗結(jié)果與RMSE評價指標分析
4.4.3 實驗結(jié)果與Recall@K評價指標分析
4.5 本章小結(jié)
第5章 總結(jié)和展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝
本文編號:3683278
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 對象的向量化表示
1.2.2 貝葉斯概率矩陣分解及其在推薦系統(tǒng)中的應用
1.2.3 強化學習及其在推薦系統(tǒng)中的應用
1.3 本文的問題定義及研究思路
1.3.1 問題定義
1.3.2 研究思路與貢獻
1.4 本文組織結(jié)構(gòu)
第2章 基于多源信息的用戶與對象的向量化表示
2.1 結(jié)合輔助信息與歷史選擇信息的推薦系統(tǒng)輸入
2.2 基于多源信息與SDAE的向量化表示
2.3 基于BPMF模型的模型構(gòu)建及優(yōu)化
2.4 本章小結(jié)
第3章 結(jié)合雙重心理動機和強化學習的個性化推薦
3.1 選擇行為的內(nèi)在與外在心理動機
3.2 基于強化學習的雙重心理動機建模
3.2.1 Q-learning(Off-policy)模型
3.2.2 基于內(nèi)在與外在動機的表示模型構(gòu)建及個性化推薦
3.3 本章小結(jié)
第4章 實驗與分析
4.1 實驗數(shù)據(jù)介紹
4.2 評價指標的介紹
4.2.1 RMSE評價指標的介紹
4.2.2 Recall@K評價指標的介紹
4.3 實驗參數(shù)設置及訓練細節(jié)
4.4 實驗模型對比、結(jié)果與分析
4.4.1 Baseline模型
4.4.2 實驗結(jié)果與RMSE評價指標分析
4.4.3 實驗結(jié)果與Recall@K評價指標分析
4.5 本章小結(jié)
第5章 總結(jié)和展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝
本文編號:3683278
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3683278.html
最近更新
教材專著