天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于MAHOUT的幾種推薦算法的組合實(shí)現(xiàn)與評測

發(fā)布時(shí)間:2017-05-29 05:12

  本文關(guān)鍵詞:基于MAHOUT的幾種推薦算法的組合實(shí)現(xiàn)與評測,由筆耕文化傳播整理發(fā)布。


【摘要】:互聯(lián)網(wǎng)的產(chǎn)生使得電子商務(wù)得到了前所未有的發(fā)展,伴隨而來的是商品數(shù)目與種類的爆炸式增長。在這種背景下,用戶在繁雜的信息中需要花費(fèi)大量的時(shí)間和精力來尋找自己想要的商品,與此同時(shí)不同的用戶有自己獨(dú)特的需求。針對此類問題,初期傳統(tǒng)的互聯(lián)網(wǎng)企業(yè)有兩種解決方案,一是采用分類目錄;二是搜索引擎。但是兩者有一個共同的局限:需要用戶主動提出自己的需求。但是有時(shí)候用戶無法十分確切描述出自己的需求,為了幫助用戶快捷準(zhǔn)確的鎖定自己感興趣的物品或信息,個性化推薦系統(tǒng)應(yīng)運(yùn)而生。其利用數(shù)據(jù)挖掘技術(shù),具有高度智能化,能夠?yàn)橛脩籼峁┩耆珎性化的決策支持和信息服務(wù)。推薦系統(tǒng)要想使用戶獲得良好的體驗(yàn)度,作為其核心的推薦算法的重要性不言而喻。目前實(shí)際生產(chǎn)中最常用的推薦算法要數(shù)協(xié)同過濾推薦算法,所謂協(xié)同過濾算法就是抓住用戶選擇商品這一本質(zhì),利用用戶與商品間的關(guān)系,分析用戶興趣,挖掘不同用戶之間的相似性或者不同物品之間的相似性,通過各種不同的計(jì)算方法形成用戶對未知商品的喜好程度的預(yù)測。本文所作的主要工作有:1.詳細(xì)闡述了課題的研究背景,國內(nèi)外的發(fā)展歷史及研究現(xiàn)狀。2.對推薦系統(tǒng)相關(guān)的主要技術(shù)進(jìn)行了詳細(xì)的闡述,其中重點(diǎn)分析推薦引擎的分類及評測標(biāo)準(zhǔn)。3.利用mahout協(xié)同過濾開發(fā)模型實(shí)現(xiàn)了幾種推薦算法的組合,并在Amazon圖書數(shù)據(jù)集上進(jìn)行了評估、算法的人工驗(yàn)證和手動調(diào)優(yōu)。本文的主要創(chuàng)新點(diǎn):1.在深入剖析mahout協(xié)同過濾算法框架的基礎(chǔ)上,對系統(tǒng)實(shí)現(xiàn)過程和推薦結(jié)果以及對結(jié)果的評測進(jìn)行了跟蹤、分析。2.采用限定用戶屬性的方法優(yōu)化推薦過程,使推薦結(jié)果更加合理,準(zhǔn)確。本文通過在Amazon圖書數(shù)據(jù)集上進(jìn)行的組合算法的實(shí)現(xiàn)表明:在數(shù)據(jù)集比較小的情況下,推薦的結(jié)果并不理想;通過限定用戶屬性的方法,可以使預(yù)測結(jié)果的均方根誤差明顯減小,算法更加穩(wěn)定。本文的工作對推薦系統(tǒng)的實(shí)際應(yīng)用有一定的參考價(jià)值。
【關(guān)鍵詞】:推薦引擎 協(xié)同過濾 mahout 算法評測
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 緒論10-13
  • 1.1 課題的研究背景10-11
  • 1.2 相關(guān)研究歷史及現(xiàn)狀11-12
  • 1.2.1 國外研究歷史及應(yīng)用現(xiàn)狀11
  • 1.2.2 國內(nèi)研究歷史及應(yīng)用現(xiàn)狀11-12
  • 1.3 論文的研究內(nèi)容和組織結(jié)構(gòu)12-13
  • 第二章 相關(guān)技術(shù)綜述13-16
  • 2.1 Hadoop分布式系統(tǒng)13-14
  • 2.1.1 Hdfs分布式文件系統(tǒng)13-14
  • 2.1.2 MapReduce編程模型14
  • 2.2 mahout機(jī)器學(xué)習(xí)算法庫14
  • 2.3 maven項(xiàng)目管理框架14-15
  • 2.4 本章小結(jié)15-16
  • 第三章 推薦引擎16-35
  • 3.1 推薦引擎的技術(shù)原理16-17
  • 3.2 推薦系統(tǒng)分類及常用算法17-21
  • 3.3 推薦系統(tǒng)評測指標(biāo)21-26
  • 3.4 MAHOUT協(xié)同過濾推薦引擎Taste26-34
  • 3.4.1 mahout數(shù)據(jù)模型27-29
  • 3.4.2 mahout相似度算法29-32
  • 3.4.3 mahout近鄰算法32-33
  • 3.4.4 mahout推薦器33-34
  • 3.5 本章小結(jié)34-35
  • 第四章 MAHOUT協(xié)同過濾推薦算法實(shí)現(xiàn)35-50
  • 4.1 MAHOUT推薦引擎開發(fā)模型35-36
  • 4.2 實(shí)驗(yàn)策略綜述36-39
  • 4.2.1 實(shí)驗(yàn)步驟36
  • 4.2.2 算法組合36-37
  • 4.2.3 算法評測標(biāo)準(zhǔn)37-39
  • 4.3 實(shí)驗(yàn)數(shù)據(jù)集39-40
  • 4.4 開發(fā)環(huán)境搭建40-42
  • 4.4.1 開發(fā)環(huán)境介紹40
  • 4.4.2 開發(fā)環(huán)境搭建過程40-42
  • 4.5 實(shí)驗(yàn)過程及分析42-49
  • 4.6 本章小結(jié)49-50
  • 第五章 總結(jié)和展望50-51
  • 5.1 總結(jié)50
  • 5.2 展望50-51
  • 參考文獻(xiàn)51-53
  • 致謝53

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 林樹地;吳揚(yáng)揚(yáng);;基于Hadoop的C4.5決策樹分類算法并行化[J];微型機(jī)與應(yīng)用;2013年12期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 孫小華;協(xié)同過濾系統(tǒng)的稀疏性與冷啟動問題研究[D];浙江大學(xué);2005年

2 董振華;群落標(biāo)簽推薦系統(tǒng)體系結(jié)構(gòu)及關(guān)鍵問題研究[D];南開大學(xué);2012年


  本文關(guān)鍵詞:基于MAHOUT的幾種推薦算法的組合實(shí)現(xiàn)與評測,,由筆耕文化傳播整理發(fā)布。



本文編號:404230

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/404230.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9ef13***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com