基于深度強(qiáng)化學(xué)習(xí)融合社交網(wǎng)絡(luò)信息的推薦系統(tǒng)
發(fā)布時(shí)間:2021-05-10 22:43
作為最有效的信息過(guò)濾系統(tǒng)之一,推薦系統(tǒng)在這信息過(guò)載的時(shí)代發(fā)揮著極大的作用。大量關(guān)于個(gè)性化推薦的技術(shù)被提出,然而這些技術(shù)中依舊存在以下兩個(gè)局限:(1)認(rèn)為推薦過(guò)程是靜態(tài)的,忽略了推薦系統(tǒng)中的動(dòng)態(tài)特性的影響;(2)數(shù)據(jù)稀疏性的問(wèn)題依舊存在。為了緩解以上兩個(gè)問(wèn)題,本文中分別提出了兩個(gè)推薦模型:基于深度強(qiáng)化學(xué)習(xí)的推薦模型Recommendation System based on Deep Reinforcement Learning and Attention Mechanism(DRA)以及融合了推薦模型DRA和社交網(wǎng)絡(luò)信息的推薦模型DRA+。推薦模型DRA。將用戶與推薦系統(tǒng)的交互過(guò)程視為順序決策過(guò)程,并將深度強(qiáng)化學(xué)習(xí)模型DDPG作為基礎(chǔ)模型?紤]到推薦系統(tǒng)中強(qiáng)化學(xué)習(xí)的定義,利用PMF的方法預(yù)訓(xùn)練生成內(nèi)容向量來(lái)構(gòu)成模型的輸入。同時(shí),通過(guò)顯式地結(jié)合用戶向量和內(nèi)容向量來(lái)更合理地表達(dá)用戶狀態(tài)。此外,利用用戶狀態(tài)中內(nèi)容的位置信息和各位置的內(nèi)容與動(dòng)作的相似性設(shè)計(jì)了注意力機(jī)制來(lái)進(jìn)一步挖掘用戶的興趣變化。最后在三個(gè)公開(kāi)的數(shù)據(jù)集MovieLens(100k)、MovieLens(1M)和Jester(2)...
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)推薦系統(tǒng)的國(guó)內(nèi)外研究現(xiàn)狀
1.2.2 基于社交網(wǎng)絡(luò)的推薦系統(tǒng)的國(guó)內(nèi)外研究現(xiàn)狀
1.2.3 現(xiàn)有研究的不足
1.3 論文研究?jī)?nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 強(qiáng)化學(xué)習(xí)的基本概念和相關(guān)理論
2.1 傳統(tǒng)強(qiáng)化學(xué)習(xí)的相關(guān)算法模型
2.1.1 基于值的強(qiáng)化學(xué)習(xí)
2.1.2 基于策略的強(qiáng)化學(xué)習(xí)
2.2 深度強(qiáng)化學(xué)習(xí)的相關(guān)算法模型
2.2.1 Deep Q Network算法
2.2.2 Deep Deterministic Policy Gradient算法
2.3 本章小結(jié)
第三章 基于深度強(qiáng)化學(xué)習(xí)的個(gè)性化推薦
3.1 推薦系統(tǒng)中強(qiáng)化學(xué)習(xí)的定義
3.2 基于深度強(qiáng)化學(xué)習(xí)的推薦模型
3.2.1 深度強(qiáng)化學(xué)習(xí)模型的利用
3.2.2 用戶狀態(tài)表示方法
3.2.3 注意力機(jī)制的利用
3.2.4 基于深度強(qiáng)化學(xué)習(xí)的推薦模型DRA
3.3 實(shí)驗(yàn)分析
3.3.1 實(shí)驗(yàn)?zāi)康?br> 3.3.2 數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)
3.3.3 對(duì)比試驗(yàn)和實(shí)驗(yàn)設(shè)置
3.3.4 結(jié)果分析
3.4 本章小結(jié)
第四章 融合了社交網(wǎng)絡(luò)信息的個(gè)性化推薦
4.1 社交網(wǎng)絡(luò)信息的相關(guān)定義
4.1.1 信任關(guān)系的基本性質(zhì)
4.1.2 相似關(guān)系的基本性質(zhì)
4.1.3 信任關(guān)系和相似關(guān)系的融合
4.2 融合了社交網(wǎng)絡(luò)信息的推薦模型
4.2.1 隱式信任關(guān)系
4.2.2 局部相似關(guān)系
4.2.3 自適應(yīng)權(quán)重融合信任關(guān)系和相似關(guān)系
4.2.4 推薦模型DRA的利用
4.2.5 融合了社交網(wǎng)絡(luò)信息的推薦模型DRA+
4.3 實(shí)驗(yàn)分析
4.3.1 實(shí)驗(yàn)?zāi)康?br> 4.3.2 數(shù)據(jù)集
4.3.3 對(duì)比實(shí)驗(yàn)
4.3.4 結(jié)果分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 未來(lái)展望
參考文獻(xiàn)
碩士在讀期間學(xué)術(shù)成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]社交網(wǎng)絡(luò)環(huán)境下基于信任的推薦算法[J]. 陳婷,朱青,周夢(mèng)溪,王珊. 軟件學(xué)報(bào). 2017(03)
[2]基于社交網(wǎng)絡(luò)的個(gè)性化推薦技術(shù)[J]. 張富國(guó). 小型微型計(jì)算機(jī)系統(tǒng). 2014(07)
[3]基于社交網(wǎng)絡(luò)的信息推薦系統(tǒng)[J]. 李善濤,肖波. 軟件. 2013(12)
[4]信息時(shí)代的信息超載影響及對(duì)策[J]. 羅玲. 現(xiàn)代情報(bào). 2011(06)
碩士論文
[1]推薦系統(tǒng)用戶相似度計(jì)算方法研究[D]. 朱文奇.重慶大學(xué) 2014
本文編號(hào):3180193
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)推薦系統(tǒng)的國(guó)內(nèi)外研究現(xiàn)狀
1.2.2 基于社交網(wǎng)絡(luò)的推薦系統(tǒng)的國(guó)內(nèi)外研究現(xiàn)狀
1.2.3 現(xiàn)有研究的不足
1.3 論文研究?jī)?nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 強(qiáng)化學(xué)習(xí)的基本概念和相關(guān)理論
2.1 傳統(tǒng)強(qiáng)化學(xué)習(xí)的相關(guān)算法模型
2.1.1 基于值的強(qiáng)化學(xué)習(xí)
2.1.2 基于策略的強(qiáng)化學(xué)習(xí)
2.2 深度強(qiáng)化學(xué)習(xí)的相關(guān)算法模型
2.2.1 Deep Q Network算法
2.2.2 Deep Deterministic Policy Gradient算法
2.3 本章小結(jié)
第三章 基于深度強(qiáng)化學(xué)習(xí)的個(gè)性化推薦
3.1 推薦系統(tǒng)中強(qiáng)化學(xué)習(xí)的定義
3.2 基于深度強(qiáng)化學(xué)習(xí)的推薦模型
3.2.1 深度強(qiáng)化學(xué)習(xí)模型的利用
3.2.2 用戶狀態(tài)表示方法
3.2.3 注意力機(jī)制的利用
3.2.4 基于深度強(qiáng)化學(xué)習(xí)的推薦模型DRA
3.3 實(shí)驗(yàn)分析
3.3.1 實(shí)驗(yàn)?zāi)康?br> 3.3.2 數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)
3.3.3 對(duì)比試驗(yàn)和實(shí)驗(yàn)設(shè)置
3.3.4 結(jié)果分析
3.4 本章小結(jié)
第四章 融合了社交網(wǎng)絡(luò)信息的個(gè)性化推薦
4.1 社交網(wǎng)絡(luò)信息的相關(guān)定義
4.1.1 信任關(guān)系的基本性質(zhì)
4.1.2 相似關(guān)系的基本性質(zhì)
4.1.3 信任關(guān)系和相似關(guān)系的融合
4.2 融合了社交網(wǎng)絡(luò)信息的推薦模型
4.2.1 隱式信任關(guān)系
4.2.2 局部相似關(guān)系
4.2.3 自適應(yīng)權(quán)重融合信任關(guān)系和相似關(guān)系
4.2.4 推薦模型DRA的利用
4.2.5 融合了社交網(wǎng)絡(luò)信息的推薦模型DRA+
4.3 實(shí)驗(yàn)分析
4.3.1 實(shí)驗(yàn)?zāi)康?br> 4.3.2 數(shù)據(jù)集
4.3.3 對(duì)比實(shí)驗(yàn)
4.3.4 結(jié)果分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 未來(lái)展望
參考文獻(xiàn)
碩士在讀期間學(xué)術(shù)成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]社交網(wǎng)絡(luò)環(huán)境下基于信任的推薦算法[J]. 陳婷,朱青,周夢(mèng)溪,王珊. 軟件學(xué)報(bào). 2017(03)
[2]基于社交網(wǎng)絡(luò)的個(gè)性化推薦技術(shù)[J]. 張富國(guó). 小型微型計(jì)算機(jī)系統(tǒng). 2014(07)
[3]基于社交網(wǎng)絡(luò)的信息推薦系統(tǒng)[J]. 李善濤,肖波. 軟件. 2013(12)
[4]信息時(shí)代的信息超載影響及對(duì)策[J]. 羅玲. 現(xiàn)代情報(bào). 2011(06)
碩士論文
[1]推薦系統(tǒng)用戶相似度計(jì)算方法研究[D]. 朱文奇.重慶大學(xué) 2014
本文編號(hào):3180193
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3180193.html
最近更新
教材專著