基于關(guān)聯(lián)規(guī)則和用戶喜好程度的綜合電子商務(wù)推薦系統(tǒng)的研究
本文關(guān)鍵詞:基于關(guān)聯(lián)規(guī)則和用戶喜好程度的綜合電子商務(wù)推薦系統(tǒng)的研究
更多相關(guān)文章: 數(shù)據(jù)挖掘 推薦系統(tǒng) 關(guān)聯(lián)規(guī)則 FP-Growth優(yōu)化
【摘要】:電子商務(wù)的迅速發(fā)展帶來了用戶量和商品量的爆炸式增長,推薦系統(tǒng)作為一種幫助用戶篩選信息和提供個性化服務(wù)的強(qiáng)大工具很快被應(yīng)用在該領(lǐng)域的海量數(shù)據(jù)處理上。推薦系統(tǒng)的核心是推薦算法,關(guān)聯(lián)規(guī)則算法是當(dāng)今最流行的推薦算法之一。在同類算法中,以FP-Growth算法最為著名,但是在當(dāng)前基于FP-Growth算法的推薦系統(tǒng)中,仍存在置信度缺失、事務(wù)無區(qū)分度、算法覆蓋率低、模型易受攻擊以及個性化不足等缺陷,所以FP-Growth算法需要結(jié)合當(dāng)前推薦系統(tǒng)的上述缺陷進(jìn)行相應(yīng)的改進(jìn)。 本文對Mahout下的FP-Growth關(guān)聯(lián)挖掘算法進(jìn)行了相應(yīng)改進(jìn),并基于改進(jìn)后的算法設(shè)計(jì)實(shí)現(xiàn)了基于關(guān)聯(lián)規(guī)則算法的電子商務(wù)推薦系統(tǒng)。具體工作包括:基于支持度和置信度,使算法在強(qiáng)關(guān)聯(lián)規(guī)則得以并行實(shí)現(xiàn);設(shè)計(jì)時效度和興趣度,克服了事務(wù)無區(qū)分度的缺陷;設(shè)計(jì)了基于分層和用戶偏好度的TOP-K算法,解決了FP-Growth算法的“長尾商品”的推薦缺失問題;另外,針對算法模型易受攻擊的特點(diǎn)設(shè)計(jì)了雙閾值和黑名單機(jī)制等。該推薦引擎利用lava技術(shù)在]Hadoop平臺上設(shè)計(jì)和實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,通過對該大型網(wǎng)站的實(shí)際業(yè)務(wù)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,基于改進(jìn)的FP-Growth的推薦引擎顯著提高了推薦系統(tǒng)的準(zhǔn)確率、召回率以及預(yù)測覆蓋率。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 推薦系統(tǒng) 關(guān)聯(lián)規(guī)則 FP-Growth優(yōu)化
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-13
- 1.1 研究背景9-10
- 1.2 關(guān)聯(lián)規(guī)則算法在國內(nèi)外的研究現(xiàn)狀10-12
- 1.3 論文的主要工作12
- 1.4 論文的組織結(jié)構(gòu)12-13
- 第二章 電子商務(wù)推薦系統(tǒng)的相關(guān)背景和技術(shù)概述13-25
- 2.1 推薦系統(tǒng)13-17
- 2.2 并行FP-Growth算法17-20
- 2.3 系統(tǒng)中運(yùn)用的關(guān)鍵技術(shù)20-23
- 2.4 本章小結(jié)23-25
- 第三章 基于商務(wù)推薦的關(guān)聯(lián)規(guī)則算法的改進(jìn)設(shè)計(jì)25-35
- 3.1 基于置信度的FP-Growth算法的并行實(shí)現(xiàn)25-28
- 3.1.1 問題分析25
- 3.1.2 概念定義25-26
- 3.1.3 算法設(shè)計(jì)與實(shí)現(xiàn)26-28
- 3.2 基于時效度和興趣度概念的FP-Growth算法28-31
- 3.2.1 時效度28-29
- 3.2.2 興趣度29-31
- 3.2.3 算法事務(wù)的權(quán)值的形成31
- 3.3 基于分層和用戶偏好程度的TOP-K算法31-33
- 3.3.1 問題提出32
- 3.3.2 補(bǔ)充算法的設(shè)計(jì)方案32-33
- 3.4 本章小結(jié)33-35
- 第四章 電子商務(wù)推薦引擎的設(shè)計(jì)與實(shí)現(xiàn)35-55
- 4.1 項(xiàng)目背景35-36
- 4.1.1 業(yè)務(wù)視角35
- 4.1.2 技術(shù)視角35-36
- 4.2 系統(tǒng)架構(gòu)設(shè)計(jì)36-39
- 4.2.1 總體架構(gòu)設(shè)計(jì)36-37
- 4.2.2 功能架構(gòu)設(shè)計(jì)37-39
- 4.3 主要功能模塊設(shè)計(jì)39-50
- 4.3.1 離線計(jì)算模塊設(shè)計(jì)40-47
- 4.3.2 在線推薦優(yōu)化設(shè)計(jì)47-50
- 4.4 模塊測試和系統(tǒng)測試50-54
- 4.4.1 數(shù)據(jù)選取情況50
- 4.4.2 軟硬件資源配置50
- 4.4.3 評估指標(biāo)分析50-51
- 4.4.4 實(shí)驗(yàn)結(jié)果及分析51-54
- 4.5 本章小結(jié)54-55
- 第五章 總結(jié)及展望55-59
- 5.1 研究總結(jié)55-56
- 5.2 主要的創(chuàng)新點(diǎn)56
- 5.3 下一步研究方向56-59
- 參考文獻(xiàn)59-63
- 致謝63-65
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文65
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 朱郁筱;呂琳媛;;推薦系統(tǒng)評價指標(biāo)綜述[J];電子科技大學(xué)學(xué)報;2012年02期
2 王娟;;基于FP-Growth算法改進(jìn)的多層次關(guān)聯(lián)規(guī)則挖掘算法[J];電腦知識與技術(shù);2008年34期
3 羅建;李艷梅;;FP-Growth算法改進(jìn)研究及在電子商務(wù)中的應(yīng)用[J];西華師范大學(xué)學(xué)報(自然科學(xué)版);2010年03期
4 周皓峰,朱揚(yáng)勇,施伯樂;一個基于興趣度的關(guān)聯(lián)規(guī)則采掘算法[J];計(jì)算機(jī)研究與發(fā)展;2002年04期
5 張新霞,王耀青;基于統(tǒng)計(jì)相關(guān)性的興趣關(guān)聯(lián)規(guī)則的挖掘[J];計(jì)算機(jī)工程與科學(xué);2003年03期
6 李鳳念;;大數(shù)據(jù)時代高校圖書館受到的挑戰(zhàn)及其發(fā)展對策[J];農(nóng)業(yè)圖書情報學(xué)刊;2014年03期
7 張新猛;蔣盛益;李霞;張倩生;;基于網(wǎng)絡(luò)和標(biāo)簽的混合推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2015年01期
8 毛宇星;陳彤兵;施伯樂;;一種高效的多層和概化關(guān)聯(lián)規(guī)則挖掘方法[J];軟件學(xué)報;2011年12期
9 宋愛波,董逸生,趙茂先;稠密數(shù)據(jù)庫有趣規(guī)則的快速挖掘[J];小型微型計(jì)算機(jī)系統(tǒng);2001年07期
,本文編號:757034
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/757034.html