基于MAHOUT的幾種推薦算法的組合實(shí)現(xiàn)與評測
發(fā)布時(shí)間:2017-05-29 05:12
本文關(guān)鍵詞:基于MAHOUT的幾種推薦算法的組合實(shí)現(xiàn)與評測,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)的產(chǎn)生使得電子商務(wù)得到了前所未有的發(fā)展,伴隨而來的是商品數(shù)目與種類的爆炸式增長。在這種背景下,用戶在繁雜的信息中需要花費(fèi)大量的時(shí)間和精力來尋找自己想要的商品,與此同時(shí)不同的用戶有自己獨(dú)特的需求。針對此類問題,初期傳統(tǒng)的互聯(lián)網(wǎng)企業(yè)有兩種解決方案,一是采用分類目錄;二是搜索引擎。但是兩者有一個共同的局限:需要用戶主動提出自己的需求。但是有時(shí)候用戶無法十分確切描述出自己的需求,為了幫助用戶快捷準(zhǔn)確的鎖定自己感興趣的物品或信息,個性化推薦系統(tǒng)應(yīng)運(yùn)而生。其利用數(shù)據(jù)挖掘技術(shù),具有高度智能化,能夠?yàn)橛脩籼峁┩耆珎性化的決策支持和信息服務(wù)。推薦系統(tǒng)要想使用戶獲得良好的體驗(yàn)度,作為其核心的推薦算法的重要性不言而喻。目前實(shí)際生產(chǎn)中最常用的推薦算法要數(shù)協(xié)同過濾推薦算法,所謂協(xié)同過濾算法就是抓住用戶選擇商品這一本質(zhì),利用用戶與商品間的關(guān)系,分析用戶興趣,挖掘不同用戶之間的相似性或者不同物品之間的相似性,通過各種不同的計(jì)算方法形成用戶對未知商品的喜好程度的預(yù)測。本文所作的主要工作有:1.詳細(xì)闡述了課題的研究背景,國內(nèi)外的發(fā)展歷史及研究現(xiàn)狀。2.對推薦系統(tǒng)相關(guān)的主要技術(shù)進(jìn)行了詳細(xì)的闡述,其中重點(diǎn)分析推薦引擎的分類及評測標(biāo)準(zhǔn)。3.利用mahout協(xié)同過濾開發(fā)模型實(shí)現(xiàn)了幾種推薦算法的組合,并在Amazon圖書數(shù)據(jù)集上進(jìn)行了評估、算法的人工驗(yàn)證和手動調(diào)優(yōu)。本文的主要創(chuàng)新點(diǎn):1.在深入剖析mahout協(xié)同過濾算法框架的基礎(chǔ)上,對系統(tǒng)實(shí)現(xiàn)過程和推薦結(jié)果以及對結(jié)果的評測進(jìn)行了跟蹤、分析。2.采用限定用戶屬性的方法優(yōu)化推薦過程,使推薦結(jié)果更加合理,準(zhǔn)確。本文通過在Amazon圖書數(shù)據(jù)集上進(jìn)行的組合算法的實(shí)現(xiàn)表明:在數(shù)據(jù)集比較小的情況下,推薦的結(jié)果并不理想;通過限定用戶屬性的方法,可以使預(yù)測結(jié)果的均方根誤差明顯減小,算法更加穩(wěn)定。本文的工作對推薦系統(tǒng)的實(shí)際應(yīng)用有一定的參考價(jià)值。
【關(guān)鍵詞】:推薦引擎 協(xié)同過濾 mahout 算法評測
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-10
- 第一章 緒論10-13
- 1.1 課題的研究背景10-11
- 1.2 相關(guān)研究歷史及現(xiàn)狀11-12
- 1.2.1 國外研究歷史及應(yīng)用現(xiàn)狀11
- 1.2.2 國內(nèi)研究歷史及應(yīng)用現(xiàn)狀11-12
- 1.3 論文的研究內(nèi)容和組織結(jié)構(gòu)12-13
- 第二章 相關(guān)技術(shù)綜述13-16
- 2.1 Hadoop分布式系統(tǒng)13-14
- 2.1.1 Hdfs分布式文件系統(tǒng)13-14
- 2.1.2 MapReduce編程模型14
- 2.2 mahout機(jī)器學(xué)習(xí)算法庫14
- 2.3 maven項(xiàng)目管理框架14-15
- 2.4 本章小結(jié)15-16
- 第三章 推薦引擎16-35
- 3.1 推薦引擎的技術(shù)原理16-17
- 3.2 推薦系統(tǒng)分類及常用算法17-21
- 3.3 推薦系統(tǒng)評測指標(biāo)21-26
- 3.4 MAHOUT協(xié)同過濾推薦引擎Taste26-34
- 3.4.1 mahout數(shù)據(jù)模型27-29
- 3.4.2 mahout相似度算法29-32
- 3.4.3 mahout近鄰算法32-33
- 3.4.4 mahout推薦器33-34
- 3.5 本章小結(jié)34-35
- 第四章 MAHOUT協(xié)同過濾推薦算法實(shí)現(xiàn)35-50
- 4.1 MAHOUT推薦引擎開發(fā)模型35-36
- 4.2 實(shí)驗(yàn)策略綜述36-39
- 4.2.1 實(shí)驗(yàn)步驟36
- 4.2.2 算法組合36-37
- 4.2.3 算法評測標(biāo)準(zhǔn)37-39
- 4.3 實(shí)驗(yàn)數(shù)據(jù)集39-40
- 4.4 開發(fā)環(huán)境搭建40-42
- 4.4.1 開發(fā)環(huán)境介紹40
- 4.4.2 開發(fā)環(huán)境搭建過程40-42
- 4.5 實(shí)驗(yàn)過程及分析42-49
- 4.6 本章小結(jié)49-50
- 第五章 總結(jié)和展望50-51
- 5.1 總結(jié)50
- 5.2 展望50-51
- 參考文獻(xiàn)51-53
- 致謝53
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 林樹地;吳揚(yáng)揚(yáng);;基于Hadoop的C4.5決策樹分類算法并行化[J];微型機(jī)與應(yīng)用;2013年12期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 孫小華;協(xié)同過濾系統(tǒng)的稀疏性與冷啟動問題研究[D];浙江大學(xué);2005年
2 董振華;群落標(biāo)簽推薦系統(tǒng)體系結(jié)構(gòu)及關(guān)鍵問題研究[D];南開大學(xué);2012年
本文關(guān)鍵詞:基于MAHOUT的幾種推薦算法的組合實(shí)現(xiàn)與評測,,由筆耕文化傳播整理發(fā)布。
本文編號:404230
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/404230.html
最近更新
教材專著