基于權(quán)重調(diào)節(jié)的矩陣補(bǔ)全協(xié)同過濾算法研究
本文選題:權(quán)重調(diào)節(jié) 切入點(diǎn):矩陣補(bǔ)全 出處:《吉林大學(xué)》2016年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的蓬勃發(fā)展,個(gè)性化推薦技術(shù)的研究勢(shì)如破竹,而作為個(gè)性化推薦系統(tǒng)中最著名,也是被研究最多的協(xié)同過濾推薦算法,現(xiàn)在以及將來的一段時(shí)間內(nèi),都將成為電子商務(wù)系統(tǒng)領(lǐng)域重要的研究方面。但是伴隨著應(yīng)用范圍的擴(kuò)大和應(yīng)用環(huán)境的變化,加上實(shí)際網(wǎng)站中對(duì)推薦精度和推薦效率的嚴(yán)苛要求,協(xié)同過濾算法的一些缺點(diǎn)也顯現(xiàn)出來。其中比較典型的有推薦實(shí)時(shí)性問題、新用戶或新項(xiàng)目的冷啟動(dòng)問題、推薦結(jié)果的準(zhǔn)確性問題等等。傳統(tǒng)的協(xié)同過濾算法是在計(jì)算兩個(gè)用戶或者兩個(gè)項(xiàng)目之間的相似性時(shí),都是直接通過對(duì)已有的評(píng)分信息進(jìn)行處理,得出用戶和用戶(項(xiàng)目和項(xiàng)目)之間的相似度。很少考慮評(píng)分以外的其他信息對(duì)相似度的影響。而基于協(xié)同過濾的改進(jìn)算法應(yīng)該盡可能多地利用系統(tǒng)中已有的信息來預(yù)測(cè)更加貼近目標(biāo)用戶興趣的推薦結(jié)果,這樣綜合了多方面因素的考量可以有效地提高算法結(jié)果的準(zhǔn)確率。本文是在協(xié)同過濾的研究基礎(chǔ)之上,添加了針對(duì)于評(píng)分的時(shí)間因素的考量以及項(xiàng)目本身屬性類別的考量,來有效地提高系統(tǒng)算法的準(zhǔn)確度。具體工作如下:首先,通過分析考慮時(shí)間因素對(duì)協(xié)同過濾算法的影響,將用戶對(duì)項(xiàng)目評(píng)分時(shí)的時(shí)間值融入到用戶對(duì)項(xiàng)目的評(píng)分中,即對(duì)原數(shù)據(jù)集中用戶對(duì)項(xiàng)目的評(píng)分值進(jìn)行時(shí)間上的權(quán)值修正,提出考量時(shí)間因素對(duì)原數(shù)據(jù)集中的評(píng)分進(jìn)行修正的協(xié)同過濾。其次,利用傳統(tǒng)的協(xié)同過濾算法在計(jì)算項(xiàng)目的相似度的時(shí)候,僅僅考慮到用戶對(duì)項(xiàng)目的評(píng)分信息,而沒有考慮項(xiàng)目本身的分類屬性信息對(duì)相似度的影響。因此本文將項(xiàng)目之間的屬性差異度融入到計(jì)算項(xiàng)目之間的相似度公式中,并以此為影響力因子作為對(duì)目標(biāo)用戶預(yù)測(cè)結(jié)果的修正。最后,將改進(jìn)算法應(yīng)用到Movie Lens數(shù)據(jù)集上,設(shè)計(jì)實(shí)驗(yàn),首先對(duì)比用余弦相似度公式和pearson相關(guān)系數(shù)公式計(jì)算項(xiàng)目間相似度,找到絕對(duì)誤差率MAE較小的那個(gè);然后將融合時(shí)間衰減曲線的評(píng)分修正和基于項(xiàng)目自身屬性標(biāo)簽的權(quán)值調(diào)節(jié)分別與未進(jìn)行改進(jìn)的協(xié)同過濾算法進(jìn)行推薦結(jié)果的比較,證明了算法的改進(jìn)可以有效的提高系統(tǒng)的推薦正確率和推薦精準(zhǔn)率。
[Abstract]:With the rapid development of Internet technology and information technology, the research of personalized recommendation technology is in full swing, and as the most famous recommendation system, it is also the most studied collaborative filtering recommendation algorithm.Now and in the future, it will become an important research area in the field of e-commerce systems.But with the expansion of application scope and the change of application environment, coupled with the harsh requirements of recommendation accuracy and recommendation efficiency in the actual website, some shortcomings of collaborative filtering algorithm also appear.Some typical problems include recommendation real-time problem, cold start-up problem of new user or new project, accuracy of recommendation result and so on.When calculating the similarity between two users or two items, the traditional collaborative filtering algorithm directly processes the existing scoring information to get the similarity between users and users (items and items).Little consideration is given to the effect of information other than scores on similarity.The improved algorithm based on collaborative filtering should make use of the existing information in the system as much as possible to predict the recommended results which are closer to the interests of the target users, which can effectively improve the accuracy of the algorithm results by synthesizing various factors.Based on the research of collaborative filtering, this paper adds the consideration of the time factor and the attribute category to improve the accuracy of the system algorithm.The specific work is as follows: firstly, by analyzing the influence of time factors on the collaborative filtering algorithm, the time value of the user scoring the item is integrated into the user's score of the item.That is to say, the user in the original data set can correct the score of the item in time, and a collaborative filtering method considering the time factor to correct the score of the original data set is put forward.Secondly the traditional collaborative filtering algorithm is used to calculate the similarity of items only taking into account the users' scoring information and not considering the impact of the items' classification attribute information on the similarity.In this paper, the attribute difference between items is incorporated into the similarity formula of the project, and it is used as the influence factor to modify the prediction results of the target users.Finally, the improved algorithm is applied to the Movie Lens data set, and the experiment is designed. Firstly, the similarity between items is calculated by using cosine similarity formula and pearson correlation coefficient formula, and the one with low absolute error rate (MAE) is found.Then the score correction of the fusion time attenuation curve and the weight adjustment based on the attribute label of the item itself are compared with the unimproved collaborative filtering algorithm.It is proved that the improved algorithm can effectively improve the recommendation accuracy and accuracy of the system.
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊風(fēng)召;;一種基于特征表的協(xié)同過濾算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年06期
2 王嵐;翟正軍;;基于時(shí)間加權(quán)的協(xié)同過濾算法[J];計(jì)算機(jī)應(yīng)用;2007年09期
3 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導(dǎo)購(gòu)系統(tǒng)[J];武漢大學(xué)學(xué)報(bào)(工學(xué)版);2008年02期
4 張富國(guó);;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年08期
5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評(píng)分矩陣的協(xié)同過濾算法[J];西安電子科技大學(xué)學(xué)報(bào);2009年04期
6 廖新考;;基于用戶特征和項(xiàng)目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
7 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過濾推薦方法[J];計(jì)算機(jī)工程;2010年20期
8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進(jìn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計(jì)算機(jī)信息;2011年11期
10 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術(shù)的個(gè)性化網(wǎng)絡(luò)教學(xué)平臺(tái)研究[J];科技風(fēng);2012年06期
相關(guān)會(huì)議論文 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項(xiàng)目分類的協(xié)同過濾算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場(chǎng)景的協(xié)同過濾推薦算法[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年
5 李建國(guó);姚良超;湯庸;郭歡;;基于認(rèn)知度的協(xié)同過濾推薦算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測(cè)量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問題的方法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 紀(jì)科;融合上下文信息的混合協(xié)同過濾推薦算法研究[D];北京交通大學(xué);2016年
2 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
3 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
4 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機(jī)研究[D];上海交通大學(xué);2011年
5 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進(jìn)機(jī)制研究[D];天津大學(xué);2012年
6 高e,
本文編號(hào):1724297
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1724297.html