天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

融合用戶評(píng)分和評(píng)語(yǔ)的貝葉斯推薦算法研究

發(fā)布時(shí)間:2019-09-09 20:01
【摘要】:隨著互聯(lián)網(wǎng)的高速發(fā)展,人類已經(jīng)步入一個(gè)全新的智能化時(shí)代。由于信息的數(shù)據(jù)量正呈現(xiàn)指數(shù)級(jí)增長(zhǎng),且數(shù)據(jù)的種類日益繁多,傳統(tǒng)的推薦系統(tǒng)已不能滿足商家和消費(fèi)者的雙重需求。推薦算法的核心在于如何挖掘出更多的用戶偏好信息,然后根據(jù)用戶的興趣點(diǎn)給出推薦。能反映用戶偏好的信息除評(píng)分外,還包含伴隨評(píng)分給出的評(píng)語(yǔ)。對(duì)評(píng)語(yǔ)進(jìn)行語(yǔ)義分析可以挖掘出大量的用戶偏好信息以及物品的潛在特征屬性,有助于改善數(shù)據(jù)稀疏性和"冷啟動(dòng)"問題。本文研究的是推薦系統(tǒng)中的評(píng)分預(yù)測(cè)問題。本文將抽象的用戶偏好融入到LDA(Latent Dirichlet Allocation)主題模型中,提出了引入用戶評(píng)分和評(píng)語(yǔ)的貝葉斯評(píng)分預(yù)測(cè)模型。在互聯(lián)網(wǎng)公開的數(shù)據(jù)集上做實(shí)驗(yàn),證明了本文提出的理論方法能顯著提高評(píng)分預(yù)測(cè)的準(zhǔn)確度。本文的主要工作和貢獻(xiàn)有以下兩點(diǎn):(1)本文將LDA文檔生成模型引入到協(xié)同過濾推薦算法中,用主題解釋抽象的用戶偏好,并由此提出了基于貝葉斯理論的評(píng)分生成模型。該模型采用Gibbs采樣算法對(duì)可觀測(cè)到的樣本信息進(jìn)行參數(shù)估計(jì)。對(duì)于給定的用戶和物品,該模型可預(yù)測(cè)出用戶對(duì)物品的評(píng)分值。在MovieLens數(shù)據(jù)集上做實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明本文提出的評(píng)分預(yù)測(cè)算法比Item-CF、SVD++和PLSA-CF等傳統(tǒng)算法的評(píng)分預(yù)測(cè)準(zhǔn)確度更高。(2)為了挖掘更多的用戶偏好信息,本文對(duì)伴隨評(píng)分生成的評(píng)語(yǔ)信息進(jìn)行了語(yǔ)義分析,模擬了評(píng)語(yǔ)中每個(gè)詞的生成過程。本文提出了融合用戶評(píng)分和評(píng)語(yǔ)的貝葉斯評(píng)分預(yù)測(cè)模型,并建立了基于LSTM的文本情感分析模型,對(duì)評(píng)語(yǔ)進(jìn)行情感分析,解決了評(píng)分和評(píng)語(yǔ)不一致問題。(3)在京東商城的23個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),證明了本文算法的評(píng)分預(yù)測(cè)準(zhǔn)確度得到了顯著的提高。最后,本文論證了該推薦算法具備較好的可解釋性,且對(duì)椎薦系統(tǒng)的冷啟動(dòng)問題以及數(shù)據(jù)稀疏性問題有一定的改善。
【圖文】:

推薦算法,示例,物品,相似度


邐喜歡逡逑整個(gè)過程可用圖2-1描述。逡逑邐逡逑用戶A逡逑用戶A邐/邐\邐物品C逡逑喜歡邐,邐I邐逡逑一推薦邐邐逡逑用戶A邐M物品D逡逑圖2-1基于用戶的推薦算法示例逡逑Figure邋2-1邋Example邋of邋user-based邋recommendation邋algorithm逡逑在相似度計(jì)算上,將一個(gè)用戶對(duì)所有物品的偏好程度作為一個(gè)向量,挖掘出N逡逑個(gè)鄰居用戶。然后根據(jù)用戶與鄰居的相似度權(quán)重以及鄰居對(duì)物品的偏好,在用戶逡逑未涉及的商品中挖掘出系統(tǒng)認(rèn)為用戶會(huì)感興趣的商品作為推薦列表,將推薦列表逡逑排序后呈現(xiàn)給用戶。相似度權(quán)重的計(jì)算是基于近鄰算法中的核心環(huán)節(jié),一方面相逡逑似度權(quán)重可用于選擇可信的近鄰來預(yù)測(cè)評(píng)分,另一方面可以給予不同的近鄰在預(yù)逡逑測(cè)中的權(quán)重。下面將介紹如何計(jì)算用戶之間的相似度。逡逑為了將問題公式化,這里定義U為用戶集合,I為物品集合,R為用戶評(píng)分集逡逑合。另外

物品,推薦算法,示例


品A的用戶都喜歡物品C。我們可以認(rèn)為物品A和物品C是相似物品,那么對(duì)于逡逑用戶C而言,,喜歡物品A但沒接觸過物品C,所以基于物品的推薦系統(tǒng)有理由認(rèn)逡逑為用戶C可能喜歡物品C,于是將物品C推薦給用戶C。整個(gè)過程可用圖2-2描逡逑述。逡逑Q)\ ̄ ̄ ̄ ̄ ̄ ̄物品A逡逑用戶八逡逑——H邋物品8逡逑用戶A邐\逡逑喜歡邐/邐邐逡逑一邋—邐-遍物品c逡逑推薦邐邐逡逑用戶A逡逑圖2-2基于物品的推薦算法示例逡逑Figure邋2-2邋Example邋of邋item-based邋recommendation邋algorithm逡逑從圖2-2中可以看出,item-based算法與user-based算法原理類似,不同之處逡逑在于item-based算法計(jì)算鄰居時(shí)使用的是物品本身而不是用戶本身,即基于用戶對(duì)逡逑物品的歷史偏好找到相似的物品,然后根據(jù)用戶的歷史偏好,推薦相似的物品給逡逑目標(biāo)用戶。在計(jì)算上,將所有用戶對(duì)某個(gè)物品的偏好作為一個(gè)向量,然后計(jì)算物逡逑品之間的相似度,最后根據(jù)用戶的歷史偏好預(yù)測(cè)出目標(biāo)用戶還沒有涉及的物品,逡逑計(jì)算得出一個(gè)按順序排列的物品列表作為推薦列表。逡逑在信息檢索中有一種計(jì)算對(duì)象之間相似度的方法,將兩個(gè)對(duì)象a和b表示成逡逑向量的形式計(jì)算兩個(gè)向量之間的余弦相似度見式(2-9):逡逑T逡逑cos(A:a,邋xb)邋=邋—X^-Xb—邐(2-9)逡逑II邋心邋II邋IK邋II逡逑同理
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 冷亞軍;陸青;梁昌勇;;協(xié)同過濾推薦技術(shù)綜述[J];模式識(shí)別與人工智能;2014年08期

2 吳成超;王衛(wèi)平;;考慮用戶興趣變化的概率隱語(yǔ)意協(xié)同推薦算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2014年05期

3 張瑤;陳維斌;傅順開;;協(xié)同過濾推薦研究綜述[J];微型機(jī)與應(yīng)用;2013年06期

4 孫冬婷;何濤;張福海;;推薦系統(tǒng)中的冷啟動(dòng)問題研究綜述[J];計(jì)算機(jī)與現(xiàn)代化;2012年05期

5 李文波;孫樂;張大鯤;;基于Labeled-LDA模型的文本分類新算法[J];計(jì)算機(jī)學(xué)報(bào);2008年04期

相關(guān)碩士學(xué)位論文 前7條

1 吳庭;基于位置的推薦計(jì)算:Spark實(shí)現(xiàn)[D];浙江大學(xué);2016年

2 栗波;音樂電臺(tái)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

3 李楊曦;基于圖模型的視頻推薦算法研究及實(shí)現(xiàn)[D];電子科技大學(xué);2015年

4 侯成文;基于內(nèi)容的郵箱廣告推薦系統(tǒng)[D];北京郵電大學(xué);2015年

5 段準(zhǔn);基于內(nèi)容的自適應(yīng)推薦系統(tǒng)研究[D];上海交通大學(xué);2015年

6 曹一鳴;基于協(xié)同過濾的個(gè)性化新聞推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

7 牛賀;基于PLSA模型的推薦算法研究與實(shí)現(xiàn)[D];東北大學(xué);2012年



本文編號(hào):2533821

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2533821.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e3802***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com