基于Hadoop平臺(tái)的協(xié)同過濾推薦算法研究
本文選題:協(xié)同過濾推薦算法 切入點(diǎn):Hadoop 出處:《廣西師范大學(xué)》2017年碩士論文
【摘要】:隨著大數(shù)據(jù)時(shí)代的到來,人們?cè)诜窒泶髷?shù)據(jù)帶來益處的同時(shí),也遭遇到大數(shù)據(jù)帶來的麻煩。當(dāng)搜索某種信息時(shí),相關(guān)信息可能會(huì)鋪天蓋地而來,面對(duì)這些海量數(shù)據(jù),人們往往無法快速定位到自己想要的那部分信息,用戶需要花費(fèi)很多時(shí)間和精力去甄別信息的有效性和可用性。人們對(duì)信息的使用效率隨著數(shù)據(jù)量的增長(zhǎng)呈現(xiàn)出急速下降的趨勢(shì),這就是著名的信息過載(information overload)問題。雖然谷歌、百度等搜索引擎提供了一些幫助,但依然未能解決人們對(duì)信息的個(gè)性化需求。在電子商務(wù)(如Amazon、淘寶、京東等)和社交網(wǎng)絡(luò)(如Twitter、新浪微博等)出現(xiàn)后,人們對(duì)信息的個(gè)性化需求更為強(qiáng)烈。于是,怎么在大數(shù)據(jù)背景下幫助人們快速找到其感興趣的、滿意的信息,已成為學(xué)術(shù)界和企業(yè)界關(guān)注的熱點(diǎn)。為了解決這些社會(huì)需求,研究者們提出了個(gè)性化推薦系統(tǒng),這是一種通過挖掘用戶歷史數(shù)據(jù),然后向用戶提供其很有可能感興趣的信息的一種智能系統(tǒng)。個(gè)性化推薦系統(tǒng)是否能提供用戶滿意的服務(wù)取決于個(gè)性化推薦算法,好的算法才能推薦出好的結(jié)果。在眾多個(gè)性化推薦算法中,目前最成功的策略之一是協(xié)同過濾算法。盡管協(xié)同過濾算法取得了很好的效果,但還是存在著不少缺點(diǎn),如數(shù)據(jù)稀疏問題,可擴(kuò)展性問題,冷啟動(dòng)問題等。為了進(jìn)一步提高個(gè)性化推薦效果,本文在閱讀大量相關(guān)文獻(xiàn)并深入學(xué)習(xí)協(xié)同過濾推薦技術(shù)的基礎(chǔ)上,對(duì)已有的協(xié)同過濾推薦算法進(jìn)行改進(jìn),提出了基于用戶評(píng)分差異計(jì)算用戶相似度和基于項(xiàng)目聚類評(píng)分預(yù)測(cè)的協(xié)同過濾算法,并在Hadoop平臺(tái)上實(shí)現(xiàn)所提出的算法。具體的研究?jī)?nèi)容如下:(1)提出了一種新的用戶相似度計(jì)算方法一基于用戶評(píng)分差異的相似度計(jì)算方法,該方法綜合考慮了用戶之間的評(píng)分差異、評(píng)分偏好和共同評(píng)分項(xiàng)目數(shù)三個(gè)因素。此方法挖掘并應(yīng)用更多的用戶評(píng)分信息,特別是應(yīng)用了均值以下的用戶評(píng)分信息,有效提高了用戶偏好相似性的準(zhǔn)確率,并能夠緩解數(shù)據(jù)稀疏性帶來的推薦質(zhì)量下降的問題。(2)改進(jìn)傳統(tǒng)的基于近鄰評(píng)分預(yù)測(cè)方法(NNSP),提出基于項(xiàng)目聚類的評(píng)分預(yù)測(cè)方法(ICBSP),實(shí)現(xiàn)對(duì)未評(píng)分項(xiàng)目的評(píng)分預(yù)測(cè)。該方法的核心思想有兩個(gè),一個(gè)是考慮鄰居用戶對(duì)待預(yù)測(cè)項(xiàng)目的評(píng)分可以有多個(gè)評(píng)分值,在其中選擇最大者作用戶最終評(píng)分值;另一個(gè)是使用項(xiàng)目權(quán)重因子和用戶相似度共同作為權(quán)重值來調(diào)節(jié)各個(gè)不同的待預(yù)測(cè)項(xiàng)目在特定用戶中應(yīng)該占有的權(quán)重。這樣可以有效地提高評(píng)分預(yù)測(cè)的準(zhǔn)確度,提升推薦質(zhì)量。(3)本文還在Hadoop平臺(tái)上對(duì)基于用戶評(píng)分差異相似度計(jì)算方法和基于項(xiàng)目聚類評(píng)分預(yù)測(cè)方法的協(xié)同過濾推薦算法進(jìn)行分布式實(shí)現(xiàn),即利用MapReduce計(jì)算模型實(shí)現(xiàn)協(xié)同過濾算法的分布式計(jì)算,把在協(xié)同過濾算法中耗時(shí)的計(jì)算過程以離線的方式計(jì)算,把不耗時(shí)的過程以在線方式計(jì)算。這樣不僅可以解決算法的可擴(kuò)展性問題,還在一定程度上解決了在海量數(shù)據(jù)的條件下信息推薦的實(shí)時(shí)性問題。(4)本文在Movie Lens提供的電影數(shù)據(jù)集上對(duì)所提出的個(gè)性化協(xié)同算法進(jìn)行了實(shí)驗(yàn),結(jié)果顯示本文提出的方法在推薦效果方面明顯優(yōu)于幾個(gè)已有的方法。
[Abstract]:......
【學(xué)位授予單位】:廣西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐義峰;陳春明;徐云青;;一種基于分類的協(xié)同過濾算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2007年01期
2 楊風(fēng)召;;一種基于特征表的協(xié)同過濾算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年06期
3 王嵐;翟正軍;;基于時(shí)間加權(quán)的協(xié)同過濾算法[J];計(jì)算機(jī)應(yīng)用;2007年09期
4 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導(dǎo)購系統(tǒng)[J];武漢大學(xué)學(xué)報(bào)(工學(xué)版);2008年02期
5 張富國(guó);;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年08期
6 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評(píng)分矩陣的協(xié)同過濾算法[J];西安電子科技大學(xué)學(xué)報(bào);2009年04期
7 廖新考;;基于用戶特征和項(xiàng)目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
8 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過濾推薦方法[J];計(jì)算機(jī)工程;2010年20期
9 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進(jìn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年04期
10 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計(jì)算機(jī)信息;2011年11期
相關(guān)會(huì)議論文 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項(xiàng)目分類的協(xié)同過濾算法[A];第二十二屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場(chǎng)景的協(xié)同過濾推薦算法[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年
5 李建國(guó);姚良超;湯庸;郭歡;;基于認(rèn)知度的協(xié)同過濾推薦算法[A];第26屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測(cè)量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問題的方法[A];第二十四屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 紀(jì)科;融合上下文信息的混合協(xié)同過濾推薦算法研究[D];北京交通大學(xué);2016年
2 程殿虎;基于協(xié)同過濾的社會(huì)網(wǎng)絡(luò)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D];中國(guó)海洋大學(xué);2015年
3 于程遠(yuǎn);基于QoS的Web服務(wù)推薦技術(shù)研究[D];上海交通大學(xué);2015年
4 段銳;融合文本內(nèi)容與情境信息的協(xié)同過濾推薦方法研究[D];合肥工業(yè)大學(xué);2017年
5 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
6 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
7 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機(jī)研究[D];上海交通大學(xué);2011年
8 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進(jìn)機(jī)制研究[D];天津大學(xué);2012年
9 高e,
本文編號(hào):1687157
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1687157.html