天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于排名多臂賭博機(jī)的推薦算法研究

發(fā)布時(shí)間:2021-09-09 16:18
  隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,網(wǎng)絡(luò)上的信息資源紛繁復(fù)雜并呈現(xiàn)爆炸式增長的趨勢(shì)。推薦系統(tǒng)(Recommendation System,RS)由于具有信息過濾的特點(diǎn),得到了各領(lǐng)域?qū)W者的不斷研究。傳統(tǒng)的推薦算法對(duì)用戶偏好的挖掘主要通過分析用戶的歷史性,在項(xiàng)目候選池與用戶池相對(duì)靜止的場(chǎng)景下能夠取得優(yōu)秀的效果。目前,大量的推薦行為都是通過實(shí)時(shí)在線的方式完成的,這就要求推薦系統(tǒng)能夠及時(shí)對(duì)用戶反饋進(jìn)行響應(yīng),并在一段時(shí)間做出連續(xù)推薦。傳統(tǒng)推薦算法對(duì)這種在線環(huán)境的動(dòng)態(tài)性難以適應(yīng),從而導(dǎo)致了“探索-利用”問題。多臂賭博機(jī)(Muit-Arm Bandit,MAB)能夠動(dòng)態(tài)處理數(shù)據(jù),使用連續(xù)的反饋信息不斷更新策略,很好地處理“探索-利用”的平衡問題。因此,本文將推薦問題建模為MAB問題,賭博機(jī)中的臂對(duì)應(yīng)于要推薦的項(xiàng)目,獎(jiǎng)勵(lì)對(duì)應(yīng)于用戶是否點(diǎn)擊了推薦的項(xiàng)目。雖然MAB具有優(yōu)秀的理論支持和應(yīng)用效果,但現(xiàn)存基于MAB的推薦算法仍具有一定的局限性。其一,每次推薦時(shí)僅推薦一個(gè)項(xiàng)目,這不符合日常生活中的推薦形式。第二,推薦的項(xiàng)目僅考慮其準(zhǔn)確性,忽略了其他評(píng)測(cè)指標(biāo)。本文為解決現(xiàn)存基于MAB推薦算法的這兩個(gè)局限性,提出了基于排名多... 

【文章來源】:南寧師范大學(xué)廣西壯族自治區(qū)

【文章頁數(shù)】:59 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于排名多臂賭博機(jī)的推薦算法研究


“在線學(xué)習(xí)”過程示意圖

推薦算法,樣本集,協(xié)同過濾,最早


?傳統(tǒng)的推薦算法主要可以分為基于內(nèi)容的推薦(CB)協(xié)同過濾推薦算(CF),混合推薦??三大類K4K25K26:M。具體分類如圖2-2所示。其中協(xié)同過濾是最受歡迎的推薦算法。由于傳??統(tǒng)的算法不是本文主要研究內(nèi)容,僅作為知識(shí)儲(chǔ)備,因此在本小節(jié)僅作簡要介紹。???■??推薦算法?? ̄1 ̄r—?—=7'?'r—1 ̄??基于內(nèi)容的?|??協(xié)同過濾混合推薦??推薦??????I?????1?1???基于近鄰的協(xié)同過濾?基于算法的協(xié)同過濾??I???1?????I?1??I?I?I?I??基于用戶的協(xié)同[基于項(xiàng)目的協(xié)同過1?|?■土?[貝葉斯網(wǎng)絡(luò)1?[??隱IS?乂具達(dá)?固具;云?胃^????圖2-2推薦算法分類簡圖??CB是最早被使用的推薦算法,其原理也非常簡單,通過對(duì)樣本集的學(xué)習(xí),獲取項(xiàng)目的??描述(知識(shí))后,根據(jù)用戶歷史喜歡的項(xiàng)目,將項(xiàng)目相似度高的項(xiàng)目推薦給用戶。以新聞??推薦為例,系統(tǒng)會(huì)為曾經(jīng)喜歡看科技新聞的用戶科技新聞。由于算法不需要獲取大量評(píng)分??數(shù)據(jù),只要對(duì)項(xiàng)目提取特征就可進(jìn)行推薦,因此,既不存在數(shù)據(jù)稀疏問題,也不存在冷啟??動(dòng)問題。但算法依據(jù)歷史偏好對(duì)用戶進(jìn)行推薦,這就導(dǎo)致了推薦結(jié)果與用戶歷史喜歡的項(xiàng)??目的相似性過高

多臂,手臂,問題,建模


2.?2.1?多臂賭博機(jī)原理??多臂賭博機(jī)(Multi-armed?bandit,?MAB)的名字來源于對(duì)老虎機(jī)的戲稱t3QK31],示意??圖如圖2-3所示。老虎機(jī)(每臺(tái)老虎機(jī)僅有一個(gè)臂),是需要玩家進(jìn)行搖臂的一種賭博機(jī)??器,玩家搖臂后根據(jù)機(jī)器展示的數(shù)值,玩家可能會(huì)得到一筆獎(jiǎng)勵(lì),但是老虎機(jī)的設(shè)計(jì)都是??.?對(duì)莊家更有利,因此玩家能獲得獎(jiǎng)勵(lì)的幾率很小。多臂賭博機(jī)從理論上擴(kuò)展了這種形式,??認(rèn)為一個(gè)老虎機(jī)中有多個(gè)臂,且每個(gè)臂都按照一個(gè)獨(dú)立的概率進(jìn)行獎(jiǎng)勵(lì),作為一個(gè)玩家,??并不知道機(jī)器每個(gè)臂的回報(bào)概率,唯一可以找到回報(bào)概率的方法是進(jìn)行游戲。玩家最終的??任務(wù)是在規(guī)定的次數(shù)內(nèi),通過玩這些機(jī)器,獲得最高的獎(jiǎng)勵(lì)或者最小化遺憾。??搖臂??f&W???/???k??圖2_3?MAB不竟圖??將推薦問題建模為多臂賭博機(jī)問題,每個(gè)手臂表示要推薦給用戶的項(xiàng)目,獎(jiǎng)勵(lì)對(duì)應(yīng)于??用戶是否點(diǎn)擊了推薦的項(xiàng)目。假設(shè)有一個(gè)擁有M個(gè)獨(dú)立臂的MAB,在每個(gè)時(shí)間t,搖下一個(gè)??臂j并接收從[0

【參考文獻(xiàn)】:
期刊論文
[1]融合協(xié)同過濾與上下文信息的Bandits推薦算法[J]. 王宇琛,王寶亮,侯永宏.  計(jì)算機(jī)科學(xué)與探索. 2019(03)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅.  計(jì)算機(jī)學(xué)報(bào). 2018(07)
[3]融合矩陣分解的多臂賭博機(jī)推薦算法[J]. 成石,王寶亮,毛陸虹,常鵬.  小型微型計(jì)算機(jī)系統(tǒng). 2017(12)
[4]在線學(xué)習(xí)方法綜述:湯普森抽樣和其他方法[J]. 何斯邁,金羽佳,王華,葛冬冬.  運(yùn)籌學(xué)學(xué)報(bào). 2017(04)
[5]消費(fèi)者視角下的推薦系統(tǒng)研究[J]. 楊一翁,王毅,孫國輝.  企業(yè)經(jīng)濟(jì). 2016(09)
[6]網(wǎng)絡(luò)推薦系統(tǒng)對(duì)消費(fèi)者的營銷效果——技術(shù)接受模型視角[J]. 楊一翁,王毅,孫國輝.  中國流通經(jīng)濟(jì). 2016(02)
[7]一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法[J]. 郭磊,馬軍,陳竹敏,姜浩然.  計(jì)算機(jī)學(xué)報(bào). 2014(01)
[8]融合鄰域模型與隱語義模型的推薦算法[J]. 魯權(quán),王如龍,張錦,丁怡.  計(jì)算機(jī)工程與應(yīng)用. 2013(19)
[9]推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J]. 朱郁筱,呂琳媛.  電子科技大學(xué)學(xué)報(bào). 2012(02)
[10]參與的樂趣——一個(gè)有中介的調(diào)節(jié)模型[J]. 樓尊.  管理科學(xué). 2010(02)

博士論文
[1]基于協(xié)同過濾的推薦算法研究[D]. 劉青文.中國科學(xué)技術(shù)大學(xué) 2013



本文編號(hào):3392402

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3392402.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶644ab***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com