天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于稀疏數(shù)據(jù)的協(xié)同過(guò)濾推薦算法研究及實(shí)現(xiàn)

發(fā)布時(shí)間:2021-06-03 18:22
  協(xié)同過(guò)濾能夠根據(jù)個(gè)人先前的行為數(shù)據(jù)信息,準(zhǔn)確預(yù)測(cè)個(gè)人將來(lái)所需的數(shù)據(jù)。隨著計(jì)算機(jī)科學(xué)技術(shù)的普及和應(yīng)用,在互聯(lián)網(wǎng)中產(chǎn)生了大規(guī)模的數(shù)據(jù),給人們的選擇帶來(lái)了極大的困難。因此,研究協(xié)同過(guò)濾推薦具有理論意義和應(yīng)用價(jià)值。本文在詳細(xì)分析協(xié)同過(guò)濾推薦現(xiàn)存問(wèn)題的基礎(chǔ)上,針對(duì)稀疏數(shù)據(jù)問(wèn)題進(jìn)行研究,主要工作包括:第一,針對(duì)數(shù)據(jù)稀疏環(huán)境下相似性判斷策略失效的問(wèn)題,本文提出基于用戶評(píng)分偏好的策略。首先,分析用戶間評(píng)分值信任關(guān)系,在皮爾遜相關(guān)系數(shù)的基礎(chǔ)上引入用戶評(píng)分值信任度,在計(jì)算用戶間相似性時(shí)使用評(píng)分值信任度加權(quán);其次,通過(guò)挖掘用戶評(píng)分值背后隱含的用戶真實(shí)偏好信息,找出高分人群和低分人群,構(gòu)建用戶評(píng)分偏好模型;最后,綜合改良相似性評(píng)判和評(píng)分估測(cè)方法,更加準(zhǔn)確的評(píng)判用戶間的相似性,以得到更加緊湊的用戶類別和更加準(zhǔn)確的估測(cè)結(jié)果。第二,針對(duì)稀疏數(shù)據(jù)問(wèn)題和用戶興趣的模糊性問(wèn)題,本文提出融合模糊聚類的策略。模糊C均值算法在進(jìn)行歐氏距離計(jì)算時(shí),僅僅考慮用戶對(duì)電影的評(píng)分?jǐn)?shù)據(jù),這樣顯的過(guò)于片面。本文定義用戶間的屬性距離,把用戶間的屬性距離和評(píng)分值間的歐氏距離進(jìn)行加權(quán)融合,計(jì)算用戶間的綜合距離;針對(duì)模糊C均值算法對(duì)孤立點(diǎn)很敏感,且... 

【文章來(lái)源】:重慶郵電大學(xué)重慶市

【文章頁(yè)數(shù)】:78 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于稀疏數(shù)據(jù)的協(xié)同過(guò)濾推薦算法研究及實(shí)現(xiàn)


MovieLens100k和MovieLens1m中電影類型信息

分布信息


出的把電影按照類型劃分是一種有可行的解決思路。2. 對(duì)于用戶年齡數(shù)據(jù)處理為了使實(shí)驗(yàn)結(jié)果具備可比性和有效性,本文把兩個(gè)數(shù)據(jù)集中用戶的年齡按照相同的年齡段區(qū)間進(jìn)行劃分,將處理后的數(shù)據(jù)信息以數(shù)據(jù)表和圖的形式分別進(jìn)行展示。表 4.7 MovieLens 100k 中年齡分布信息年齡段 25 18 35 45 50 56 1用戶個(gè)數(shù) 310 198 194 80 73 52 36占比(保留三位小數(shù)) 0.329 0.21 0.206 0.085 0.077 0.055 0.038表 4.8 MovieLens 1m 中年齡分布信息年齡段 25 35 18 45 50 56 1用戶個(gè)數(shù) 2096 1193 1103 550 496 380 222占比(保留三位小數(shù)) 0.347 0.198 0.183 0.091 0.082 0.063 0.037

數(shù)據(jù)信息,職業(yè)信息


(a) MovieLens 100k 中用戶職業(yè)信息 (b) MovieLens 100k 中用戶職業(yè)信息圖 4.4 MovieLens 100k 和 MovieLens 1m 中用戶職業(yè)數(shù)據(jù)信息本文通過(guò)對(duì)數(shù)據(jù)集中的數(shù)據(jù)分析發(fā)現(xiàn),用戶集中在個(gè)別職業(yè)中,學(xué)生成為了觀影的主要人群,這個(gè)很容易解釋,因?yàn)閷W(xué)生有周末和寒暑假,觀看電影成為一種娛樂(lè)方式。這也和本文通過(guò)對(duì)年齡分析得出的結(jié)論相吻合,學(xué)生大多處于 25 歲年齡段區(qū)間中,說(shuō)明了本文提出的考慮職業(yè)屬性距離是有意義的。

【參考文獻(xiàn)】:
期刊論文
[1]基于K-means聚類算法優(yōu)化方法的研究[J]. 劉葉,吳晟,周海河,吳興蛟,韓林嶧.  信息技術(shù). 2019(01)

碩士論文
[1]基于譜聚類SM算法的協(xié)同過(guò)濾推薦算法研究[D]. 陳清華.江西農(nóng)業(yè)大學(xué) 2018
[2]基于用戶的協(xié)同過(guò)濾算法改進(jìn)研究及并行化實(shí)現(xiàn)[D]. 李嵩.西北農(nóng)林科技大學(xué) 2018
[3]協(xié)同過(guò)濾推薦系統(tǒng)中的數(shù)據(jù)稀疏性及冷啟動(dòng)問(wèn)題研究[D]. 李曉菊.華東師范大學(xué) 2018
[4]基于改進(jìn)K-means聚類和RBM的協(xié)同過(guò)濾算法[D]. 耿瑞.吉林大學(xué) 2018
[5]基于模糊聚類的并行化推薦算法設(shè)計(jì)與研究[D]. 楊業(yè).浙江理工大學(xué) 2018
[6]基于興趣度和聚類的動(dòng)態(tài)加權(quán)關(guān)聯(lián)規(guī)則挖掘的研究[D]. 謝詩(shī)浩.湖南大學(xué) 2016
[7]基于張量分解的推薦算法研究[D]. 黃丹.北京交通大學(xué) 2016
[8]面向數(shù)據(jù)稀疏的協(xié)同過(guò)濾推薦算法研究與優(yōu)化[D]. 黃正.華南理工大學(xué) 2012



本文編號(hào):3211012

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3211012.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶63a6c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com