基于用戶特性的CF算法在B2C類電子商務(wù)RE中的研究與應(yīng)用
本文關(guān)鍵詞:基于用戶特性的CF算法在B2C類電子商務(wù)RE中的研究與應(yīng)用
更多相關(guān)文章: 推薦引擎 協(xié)同過濾 nosql 高并發(fā) lucene
【摘要】:根據(jù)CNNIC一月份發(fā)布的《第29次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2011年12月底,中國網(wǎng)民規(guī)模突破5億,達(dá)到5.13億,全年新增網(wǎng)民5580萬;ヂ(lián)網(wǎng)普及率較上年底提升4個百分點(diǎn),達(dá)到38.3%。分析顯示電子商務(wù)類應(yīng)用繼續(xù)穩(wěn)步發(fā)展,包括網(wǎng)絡(luò)購物、網(wǎng)上支付、網(wǎng)上銀行、旅行預(yù)訂在內(nèi)的電子商務(wù)類應(yīng)用在2011年繼續(xù)保持穩(wěn)步發(fā)展態(tài)勢,其中網(wǎng)絡(luò)購物用戶規(guī)模達(dá)到1.94億人,較上年底增長20.8%,網(wǎng)上支付用戶和網(wǎng)上銀行全年用戶也增長了21.6%和19.2%,目前用戶規(guī)模分別為1.67億和1.66億。 目前IT系統(tǒng)的存儲能力遠(yuǎn)遠(yuǎn)不足,就更不用說深入地挖掘和分析了。但要想使用這些數(shù)據(jù)并不是一件很容易的事情。本文將以推薦系統(tǒng)的設(shè)計為例提出一種綜合的解決方案。在應(yīng)對大數(shù)據(jù)和實(shí)時性要求的同時各大IT公司紛紛提出自己的解決之道,其中不乏優(yōu)秀的系統(tǒng)和編程模式,如:google的hadoop技術(shù)框架,,nosql數(shù)據(jù)庫和HDFS分布式存儲技術(shù),mapreduce編程模式,以及mahout等。本文就將依據(jù)這些新興技術(shù)框架改造傳統(tǒng)的推薦引擎使之可以滿足大數(shù)據(jù)時代的實(shí)時性需求,提高推薦結(jié)果的命中率。 本文在提高推薦引擎(RE)的推薦精準(zhǔn)度方面提出了,在傳統(tǒng)的相似用戶算法的基礎(chǔ)之上進(jìn)行改進(jìn)的基于用戶特性的相似用戶計算的方法。從而充分考慮了用戶自身的社會特性,提高的推薦數(shù)據(jù)個性化需求。并利用lucene平臺進(jìn)行具體的實(shí)現(xiàn),在此基礎(chǔ)之上還提出來推薦引擎的整體設(shè)計架構(gòu)圖。并對每部分拆分進(jìn)行講解。最后針對具體的實(shí)施過程當(dāng)中出現(xiàn)的技術(shù)難點(diǎn)和關(guān)鍵點(diǎn)提出了兩個切實(shí)可行的解決方案。分別是“基于redis+zookeeper的主從備份及單點(diǎn)故障自動切換技術(shù)”和“基于dubbo+lucene改進(jìn)的索引數(shù)據(jù)自動分發(fā)技術(shù)”。
【關(guān)鍵詞】:推薦引擎 協(xié)同過濾 nosql 高并發(fā) lucene
【學(xué)位授予單位】:南華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TP391.3
【目錄】:
- 圖表索引5-7
- 摘要7-8
- ABSTRACT8-10
- 術(shù)語及縮寫語10-12
- 第一章 緒論12-18
- 1.1 項(xiàng)目背景與研究意義12-13
- 1.2 研究現(xiàn)狀和發(fā)展目標(biāo)13-15
- 1.3 本文的主要工作15-16
- 1.4 本文的組織結(jié)構(gòu)16-18
- 第二章 推薦引擎18-24
- 2.1 推薦引擎的概念18-19
- 2.2 推薦引擎的分類19-20
- 2.3 推薦引擎的工作原理20-24
- 第三章 推薦算法24-32
- 3.1 集體智慧和協(xié)同過濾算法24-25
- 3.2 協(xié)同過濾算法計算步驟25-28
- 3.3 use-based 協(xié)同過濾算法28-29
- 3.4 item-based 協(xié)同過濾算法29-30
- 3.5 評分預(yù)測算法30-32
- 第四章 推薦系統(tǒng)升級設(shè)計方案及關(guān)鍵技術(shù)解決方案32-46
- 4.1 推薦引擎系統(tǒng)架構(gòu)設(shè)計32-35
- 4.1.1 前臺交互模塊33-34
- 4.1.2 推薦產(chǎn)品34-35
- 4.1.3 數(shù)據(jù)運(yùn)算模塊、數(shù)據(jù)持久模塊35
- 4.2 基于 redis+zookeeper 的主從備份及單點(diǎn)故障自動切換技術(shù)35-41
- 4.2.1 設(shè)計目標(biāo)和原則36-37
- 4.2.2 系統(tǒng)總體架構(gòu)37
- 4.2.3 開發(fā)環(huán)境以及技術(shù)支持37-38
- 4.2.4 系統(tǒng)組件及功能說明38-40
- 4.2.5 系統(tǒng)主要類圖40
- 4.2.6 部署方案40-41
- 4.3 基于 dubbo+lucene 改進(jìn)的索引數(shù)據(jù)自動分發(fā)技術(shù)41-46
- 4.3.0 設(shè)計目的與原則42-43
- 4.3.1 系統(tǒng)架構(gòu)圖43
- 4.3.2 開發(fā)環(huán)境以及技術(shù)支持43-44
- 4.3.3 系統(tǒng)組件及功能說明44
- 4.3.4 部署方案44-46
- 第五章 基于用戶屬性的協(xié)同過濾推薦算法及其實(shí)現(xiàn)46-60
- 5.1 數(shù)據(jù)的準(zhǔn)備47-53
- 5.2 相似商品計算53-55
- 5.3 實(shí)時推薦部分55-57
- 5.3.1 推薦的產(chǎn)生55-56
- 5.3.2 強(qiáng)關(guān)聯(lián)規(guī)則過濾56-57
- 5.5 實(shí)驗(yàn)結(jié)果分析57-60
- 5.5.1 系統(tǒng)運(yùn)行效果圖57
- 5.5.2 系統(tǒng)改進(jìn)以后計算效率對比57-58
- 5.5.3 推薦精度對比58-60
- 第六章 總結(jié)60-62
- 參考文獻(xiàn)62-66
- 成果目錄66-67
- 致謝67
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 周軍鋒,湯顯,郭景峰;一種優(yōu)化的協(xié)同過濾推薦算法[J];計算機(jī)研究與發(fā)展;2004年10期
2 李聰;梁昌勇;馬麗;;基于領(lǐng)域最近鄰的協(xié)同過濾推薦算法[J];計算機(jī)研究與發(fā)展;2008年09期
3 田偉;彭玉青;;基于電子商務(wù)應(yīng)用的協(xié)同過濾技術(shù)改進(jìn)綜述[J];計算機(jī)工程與科學(xué);2008年10期
4 詹宇斌;殷建平;張玲;龍軍;程杰仁;;一種基于有向樹挖掘Web日志中最大頻繁訪問模式的方法[J];計算機(jī)應(yīng)用;2006年07期
5 張付志;姜志英;;一種基于聚類技術(shù)的數(shù)字圖書館個性化推薦算法[J];計算機(jī)應(yīng)用與軟件;2008年07期
6 崔林;王輝;宋瀚濤;牛振東;陸玉昌;;基于網(wǎng)絡(luò)內(nèi)容和結(jié)構(gòu)數(shù)據(jù)的用戶瀏覽模型[J];河南科技大學(xué)學(xué)報(自然科學(xué)版);2005年06期
7 鄧愛林,朱揚(yáng)勇,施伯樂;基于項(xiàng)目評分預(yù)測的協(xié)同過濾推薦算法[J];軟件學(xué)報;2003年09期
8 於志文,周興社,谷建華,張勇;電視節(jié)目個性化技術(shù)的研究[J];小型微型計算機(jī)系統(tǒng);2005年01期
9 霍華,馮博琴;基于壓縮稀疏矩陣矢量相乘的文本相似度計算[J];小型微型計算機(jī)系統(tǒng);2005年06期
10 張忠平;郭獻(xiàn)麗;;PEV:一種新的用于Item-Based協(xié)同過濾算法的相似性度量方法[J];小型微型計算機(jī)系統(tǒng);2009年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
2 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
本文編號:674712
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/674712.html