基于協(xié)同過濾的個性化物品推薦
本文關(guān)鍵詞:基于協(xié)同過濾的個性化物品推薦
更多相關(guān)文章: 個性化推薦 協(xié)同過濾 二部圖社區(qū)發(fā)現(xiàn) Mapreduce
【摘要】:隨著網(wǎng)絡(luò)的發(fā)展,我們進入了一個信息爆炸的時代。用戶很難從海量的信息中迅速準(zhǔn)確地找出自己真正想要的內(nèi)容。推薦系統(tǒng)在用戶和信息之間搭建了一個橋梁,能夠發(fā)掘用戶的潛在興趣點并推薦給用戶,降低了用戶搜尋信息的成本。因此,推薦系統(tǒng)受到普遍的關(guān)注和應(yīng)用。其中,協(xié)同過濾推薦算法應(yīng)用范圍最為廣泛。但是仍然存在評分?jǐn)?shù)據(jù)稀疏、擴展性差、推薦正確率低等問題。為了克服協(xié)同過濾中評分稀疏、正確率低的問題,可以將推薦系統(tǒng)中用戶和物品看作是抽象于內(nèi)容的獨立節(jié)點,構(gòu)建用戶、物品二部圖網(wǎng)絡(luò),在二部圖網(wǎng)絡(luò)的基礎(chǔ)上利用二部圖模塊函數(shù)優(yōu)化的方法進行社區(qū)發(fā)現(xiàn),從而將有內(nèi)在聯(lián)系的用戶和物品聚類在一起,在此基礎(chǔ)上進行個性化推薦。因此,本文給出了基于社區(qū)的協(xié)同過濾推薦算法,算法可以分為三個步驟:數(shù)據(jù)表述、相似性計算、推薦生成。在數(shù)據(jù)表述階段,將傳統(tǒng)的用戶-物品評分矩陣轉(zhuǎn)化為二部圖結(jié)構(gòu);然后將二部圖看做網(wǎng)絡(luò)拓撲圖,在該網(wǎng)絡(luò)上利用二部圖模塊函數(shù)優(yōu)化的方法進行社區(qū)挖掘,將相似的物品或者相似的用戶劃分到同一個社區(qū)中去,完成相似性計算;在推薦生成階段,綜合考慮了基于用戶社區(qū)劃分的推薦列表和基于物品社區(qū)劃分的推薦列表,將兩個推薦列表進行了兩種形式的混合,綜合利用了用戶和物品的相似關(guān)系。根據(jù)評分的大小從高到低進行排列,取前N個物品推薦給目標(biāo)用戶。為了解決算法的可擴展性問題,本文在Hadoop大數(shù)據(jù)平臺上利用Mapreduce編程框架分別實現(xiàn)了基于社區(qū)的協(xié)同過濾推薦算法和基于物品的協(xié)同過濾推薦算法,算法主要分為數(shù)據(jù)預(yù)處理、算法實現(xiàn)、性能測評三個步驟,利用正確率、召回率、F值指標(biāo)來綜合衡量對比算法的性能優(yōu)劣。借助大數(shù)據(jù)平臺來實現(xiàn)算法可較大幅度提高的實現(xiàn)效率,降低時間復(fù)雜度,擴展了算法的應(yīng)用領(lǐng)域。
【關(guān)鍵詞】:個性化推薦 協(xié)同過濾 二部圖社區(qū)發(fā)現(xiàn) Mapreduce
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-13
- 1.1 研究意義10-11
- 1.2 研究內(nèi)容11-12
- 1.3 論文結(jié)構(gòu)12-13
- 第2章 研究現(xiàn)狀13-30
- 2.1 推薦系統(tǒng)13-17
- 2.1.1 算法分類13-16
- 2.1.2 評價指標(biāo)16-17
- 2.2 協(xié)同過濾17-24
- 2.2.1 算法內(nèi)容17-20
- 2.2.2 算法分類20-23
- 2.2.3 算法特點23-24
- 2.3 協(xié)同過濾算法面臨的問題24-26
- 2.3.1 評分稀疏24-25
- 2.3.2 可擴展性25-26
- 2.4 分布式計算26-30
- 2.4.1 Hadoop概述26-27
- 2.4.2 Hadoop的Mapreduce編程模型27-28
- 2.4.3 Hadoop的分布式文件系統(tǒng)28-29
- 2.4.4 Hbase分布式存儲系統(tǒng)29
- 2.4.5 Hive數(shù)據(jù)倉庫29-30
- 第3章 基于社區(qū)發(fā)現(xiàn)的協(xié)同過濾算法30-44
- 3.1 引言30-31
- 3.2 算法描述31-34
- 3.2.1 符號簡介31-32
- 3.2.2 社區(qū)劃分32-33
- 3.2.3 個性化推薦33-34
- 3.3 實驗34-44
- 3.3.1 數(shù)據(jù)集34-35
- 3.3.2 實驗結(jié)果35-44
- 第4章 基于HADOOP的協(xié)同過濾算法44-58
- 4.1 引言44-45
- 4.2 基于物品相似性的協(xié)同過濾算法的Mapreduce實現(xiàn)45-49
- 4.3 基于社區(qū)發(fā)現(xiàn)的協(xié)同過濾算法的Mapreduce實現(xiàn)49-54
- 4.4 實驗54-58
- 4.4.1 數(shù)據(jù)準(zhǔn)備54-55
- 4.4.2 實驗結(jié)果55-58
- 總結(jié)及展望58-60
- 參考文獻60-65
- 攻讀學(xué)位期間發(fā)表論文與研究成果清單65-66
- 致謝66
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊風(fēng)召;;一種基于特征表的協(xié)同過濾算法[J];計算機工程與應(yīng)用;2007年06期
2 王嵐;翟正軍;;基于時間加權(quán)的協(xié)同過濾算法[J];計算機應(yīng)用;2007年09期
3 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導(dǎo)購系統(tǒng)[J];武漢大學(xué)學(xué)報(工學(xué)版);2008年02期
4 張富國;;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計算機系統(tǒng);2008年08期
5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評分矩陣的協(xié)同過濾算法[J];西安電子科技大學(xué)學(xué)報;2009年04期
6 廖新考;;基于用戶特征和項目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
7 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過濾推薦方法[J];計算機工程;2010年20期
8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進研究[J];計算機技術(shù)與發(fā)展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計算機信息;2011年11期
10 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術(shù)的個性化網(wǎng)絡(luò)教學(xué)平臺研究[J];科技風(fēng);2012年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項目分類的協(xié)同過濾算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國第20屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場景的協(xié)同過濾推薦算法[A];中國系統(tǒng)仿真學(xué)會第五次全國會員代表大會暨2006年全國學(xué)術(shù)年會論文集[C];2006年
5 李建國;姚良超;湯庸;郭歡;;基于認知度的協(xié)同過濾推薦算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動問題的方法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯一[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
2 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
3 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機研究[D];上海交通大學(xué);2011年
4 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進機制研究[D];天津大學(xué);2012年
5 高e,
本文編號:913699
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/913699.html