融合帕累托占優(yōu)的增強(qiáng)協(xié)同過濾方法研究
本文關(guān)鍵詞:融合帕累托占優(yōu)的增強(qiáng)協(xié)同過濾方法研究
更多相關(guān)文章: 協(xié)同過濾 帕累托占優(yōu) 相似度計(jì)算
【摘要】:互聯(lián)網(wǎng)的蓬勃發(fā)展使得人們生活在信息量浩瀚如海的數(shù)據(jù)爆炸時(shí)代,人們每天都面臨著眾多選擇,但用戶往往會(huì)在花費(fèi)了大量的時(shí)間和金錢后還不能找到滿足心意的信息。推薦技術(shù)的出現(xiàn)就是讓用戶在選擇困難時(shí)幫助用戶發(fā)現(xiàn)他們可能會(huì)感興趣的信息,了解他們的潛在需求。推薦服務(wù)可以引導(dǎo)用戶在網(wǎng)上商城選購商品,可以在社交網(wǎng)絡(luò)中推薦朋友,可以推薦影片、美食、書籍等等,給人們的生活帶來極大的便利。在不同類型的推薦算法中,協(xié)同過濾推薦算法建立的模型比較簡單,使用用戶的評(píng)分?jǐn)?shù)據(jù)分析用戶的偏好,不依賴用戶或物品的屬性等數(shù)據(jù),數(shù)據(jù)采集方便,推薦質(zhì)量比較好,因此成為學(xué)術(shù)界和工業(yè)界都廣泛研究的推薦算法。在調(diào)研了現(xiàn)有的不同類型的協(xié)同過濾推薦算法后,結(jié)合現(xiàn)有的實(shí)驗(yàn)條件,本文選擇研究基于用戶的(user-based)協(xié)同過濾方法。本文分析了協(xié)同過濾推薦算法面臨的一些問題,研究了一些對(duì)存在的問題的解決方法,從中獲得啟發(fā),本文提出了一種新的方法來緩解協(xié)同過濾算法存在的數(shù)據(jù)稀疏性問題。方法是在計(jì)算相似度之前采用帕累托占優(yōu)(Pareto Dominance)理論預(yù)過濾掉那些低相似度的用戶,再將共同評(píng)分所占比例的影響因素引入PIP相似度計(jì)算方法來改進(jìn)相似度測(cè)量,PIP方法是由鄰近度(Proximity),影響力(Impact),流行度(Popularity)三個(gè)影響因素構(gòu)成。在經(jīng)典的兩個(gè)不同大小的數(shù)據(jù)集MovieLens上進(jìn)行實(shí)驗(yàn),對(duì)比現(xiàn)有的常用相似度計(jì)算方法改進(jìn)后的算法,和JPIP和PIP算法。采用MAE(Mean Absolute Error,平均絕對(duì)誤差)值、準(zhǔn)確率和召回率作為評(píng)測(cè)指標(biāo)。實(shí)驗(yàn)結(jié)果表明本文提出的融合帕累托占優(yōu)的預(yù)過濾處理結(jié)合JPIP的相似度計(jì)算的方法較其他方法在推薦質(zhì)量上有所提高。本文的貢獻(xiàn)有:(1)利用帕累托占優(yōu)理論預(yù)先過濾低相似度的用戶,提高了找到高相似度近鄰用戶的可能。(2)相比傳統(tǒng)的相似度測(cè)量只利用了評(píng)分?jǐn)?shù)據(jù)呈現(xiàn)出的淺層內(nèi)容,本文的方法通過深入分析數(shù)據(jù)表達(dá)出的深層含義來改進(jìn)相似度衡量標(biāo)準(zhǔn)。(3)本文的方法相比列舉出的其他方法在推薦質(zhì)量上有所提高,同時(shí)也緩解了數(shù)據(jù)稀疏性問題。
【學(xué)位授予單位】:西華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 邢哲;梁競(jìng)帆;朱青;;多維度自適應(yīng)的協(xié)同過濾推薦算法[J];小型微型計(jì)算機(jī)系統(tǒng);2011年11期
2 郭艷紅;鄧貴仕;雒春雨;;基于信任因子的協(xié)同過濾推薦算法[J];計(jì)算機(jī)工程;2008年20期
3 張光衛(wèi);李德毅;李鵬;康建初;陳桂生;;基于云模型的協(xié)同過濾推薦算法[J];軟件學(xué)報(bào);2007年10期
4 邢春曉;高鳳榮;戰(zhàn)思南;周立柱;;適應(yīng)用戶興趣變化的協(xié)同過濾推薦算法[J];計(jì)算機(jī)研究與發(fā)展;2007年02期
5 賈麗會(huì);張修如;;BP算法分析與改進(jìn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年10期
6 阮彤,馮東雷,李京;基于貝葉斯網(wǎng)絡(luò)的信息過濾模型研究[J];計(jì)算機(jī)研究與發(fā)展;2002年12期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王云凱;基于降維技術(shù)和分布式計(jì)算的協(xié)同過濾可擴(kuò)展性問題解決方案[D];西南財(cái)經(jīng)大學(xué);2014年
,本文編號(hào):1165411
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1165411.html