天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于評(píng)論文本的推薦算法研究

發(fā)布時(shí)間:2021-01-20 06:51
  推薦系統(tǒng)的評(píng)論文本作為用戶問題、建議、態(tài)度的載體,對(duì)挖掘用戶偏好極具價(jià)值。深度協(xié)同神經(jīng)網(wǎng)絡(luò)DeepCoNN,轉(zhuǎn)換網(wǎng)絡(luò)TransNets和神經(jīng)評(píng)分回歸貼士生成模型NRT等均使用評(píng)論文本來預(yù)測(cè)用戶偏好,TransNets和NRT還使用評(píng)論為用戶提供解釋文本。但上述模型沒有區(qū)分評(píng)論的重要程度,導(dǎo)致不重要的評(píng)論形成“噪音”,影響了用戶偏好預(yù)測(cè)的精確度和解釋文本的質(zhì)量。本文提出了一種基于評(píng)論文本的多任務(wù)算法ERR,針對(duì)評(píng)論“噪音”問題,根據(jù)評(píng)論的重要程度賦予不同的權(quán)重,減輕評(píng)論“噪音”的干擾;針對(duì)推薦可解釋性問題,根據(jù)用戶對(duì)不同項(xiàng)目的評(píng)論和項(xiàng)目收到不同用戶的評(píng)論構(gòu)建一個(gè)序列到序列的推薦解釋生成模型,同時(shí)使用本文提出的評(píng)論降噪方法提高生成的解釋文本質(zhì)量。在三個(gè)不同領(lǐng)域數(shù)據(jù)集上將TransNets和DeepCoNN與ERR進(jìn)行預(yù)測(cè)用戶偏好的對(duì)比,實(shí)驗(yàn)結(jié)果表明ERR的預(yù)測(cè)精確度相比二者平均提升了2.5%-5%,并且在更為稀疏的數(shù)據(jù)集上提升幅度更大;在TransNets和NRT與ERR進(jìn)行生成解釋文本的對(duì)比中,ERR的生成文本相似度有著約20%的平均提升,且生成的解釋文本實(shí)例具有較好的概括性和可讀性。 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁(yè)數(shù)】:54 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于評(píng)論文本的推薦算法研究


可解釋推薦分類圖

架構(gòu)圖,架構(gòu),文本,算法


16第三章基于評(píng)論文本的推薦算法本章提出一種基于評(píng)論文本的可解釋推薦算法,詳細(xì)闡述了本文提出的評(píng)論降噪方法的原理,以及如何通過降噪后的評(píng)論文本提取評(píng)論特征預(yù)測(cè)偏好,并產(chǎn)生推薦解釋,同時(shí)對(duì)歐氏距離進(jìn)行改進(jìn),以更精確度量特征間關(guān)系。下文將對(duì)具體的工作進(jìn)行詳細(xì)介紹。3.1模型總覽本文提出的算法模型關(guān)注偏好預(yù)測(cè)和解釋生成,屬于多任務(wù)學(xué)習(xí)算法。算法模型利用降噪后的評(píng)論文本緩解評(píng)分?jǐn)?shù)據(jù)的稀疏,并使用改進(jìn)后的歐氏距離來預(yù)測(cè)偏好,同時(shí)生成面向用戶的解釋文本。為后續(xù)方便闡述模型細(xì)節(jié),對(duì)本文算法的任務(wù)定義如下:任務(wù)定義:用戶(user)已評(píng)論個(gè)項(xiàng)目,項(xiàng)目(item)已收到個(gè)用戶的評(píng)論(review),定義用戶對(duì)項(xiàng)目(1≤≤)的評(píng)論為,項(xiàng)目收到用戶(1≤≤)的評(píng)論為,用戶對(duì)項(xiàng)目(1≤≤)的偏好(Rating)為,用戶(1≤≤)對(duì)項(xiàng)目的偏好(Rating)為。從用戶已有的個(gè)評(píng)論{1,2,…,}和項(xiàng)目已有的個(gè)評(píng)論{1,2,…,}中分別挖掘出用戶和項(xiàng)目的特征,結(jié)合這兩部分特征來預(yù)測(cè)用戶對(duì)項(xiàng)目的偏好,同時(shí)生成對(duì)應(yīng)的解釋文本。圖3.1ERR架構(gòu)Figure3.1thearchitectureofERR整體的架構(gòu)如圖3.1所示,模型分為如下模塊:

高頻詞,數(shù)據(jù)集,文本,評(píng)價(jià)指標(biāo)


26(Ⅰ)Pet(差評(píng))(Ⅱ)Music(差評(píng))(Ⅲ)Games(差評(píng))圖4.1數(shù)據(jù)集評(píng)論高頻詞Figure4.1high-frequencywordsindataset4.2評(píng)價(jià)指標(biāo)本文提出的算法ERR在進(jìn)行評(píng)分預(yù)測(cè)任務(wù)的同時(shí)要完成解釋文本生成的任務(wù),因此本文使用的評(píng)價(jià)指標(biāo)分為評(píng)分預(yù)測(cè)和文本生成兩類。4.2.1評(píng)分預(yù)測(cè)評(píng)估標(biāo)準(zhǔn)本文采用均方根誤差作為(RootMeanSquaredError,RMSE)作為預(yù)測(cè)用戶對(duì)項(xiàng)目評(píng)分的評(píng)價(jià)指標(biāo)。相比于均方誤差(MeanSquaredError,MSE),RMSE排除了數(shù)據(jù)集中標(biāo)簽量綱的影響,適用范圍更廣[9]。RMSE的公式如(4.1)所示[15]。表示數(shù)據(jù)集中用戶對(duì)項(xiàng)目的真實(shí)評(píng)分,表示用戶對(duì)項(xiàng)目的預(yù)估評(píng)分。表示用戶對(duì)個(gè)項(xiàng)目有過評(píng)分。RMSE越低,表明算法的準(zhǔn)確度越高。RMSE=√∑()2=1(4.1)4.2.2解釋生成評(píng)估標(biāo)準(zhǔn)本文采用ROUGE[77]和BLEU[28]作為解釋生成的評(píng)價(jià)指標(biāo),二者都是經(jīng)典的文本生成評(píng)價(jià)指標(biāo),從不同角度評(píng)估算法生成的文本和用戶撰寫的文本的相似度。指標(biāo)越大,表明真實(shí)文本與生成文本的相似度越大。ROUGE通過計(jì)算文本間的重疊單元數(shù)來評(píng)估相似度。ROUGE-N定義如(4.2)所示[77]。

【參考文獻(xiàn)】:
期刊論文
[1]注意力機(jī)制在深度學(xué)習(xí)中的研究進(jìn)展[J]. 朱張莉,饒?jiān)?吳淵,祁江楠,張鈺.  中文信息學(xué)報(bào). 2019(06)
[2]基于信任計(jì)算和矩陣分解的推薦算法[J]. 王瑞琴,潘俊,馮建軍.  模式識(shí)別與人工智能. 2018(09)
[3]融合評(píng)分矩陣與評(píng)論文本的商品推薦模型[J]. 李琳,劉錦行,孟祥福,蘇暢,李鑫,鐘珞.  計(jì)算機(jī)學(xué)報(bào). 2018(07)
[4]基于樸素貝葉斯方法的協(xié)同過濾推薦算法[J]. 李大學(xué),謝名亮,趙學(xué)斌.  計(jì)算機(jī)應(yīng)用. 2010(06)

博士論文
[1]推薦系統(tǒng)中面向評(píng)分和文本數(shù)據(jù)挖掘的若干關(guān)鍵技術(shù)研究[D]. 徐原博.吉林大學(xué) 2019
[2]個(gè)性化推薦的可解釋性研究[D]. 張永鋒.清華大學(xué) 2016



本文編號(hào):2988595

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/xiangmuguanli/2988595.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2c6b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com