手機應用商城智能推薦平臺的研究與應用
本文關鍵詞:手機應用商城智能推薦平臺的研究與應用,由筆耕文化傳播整理發(fā)布。
【摘要】:手機應用商城是手機用戶下載app、電子書籍、動漫等的主要客戶端。隨著app等數(shù)量激增,如何幫助用戶更好找到其感興趣的商品是應用商城的核心需求之一。當用戶有明確需求時,搜索就能夠滿足其需求;當用戶的需求不太明確或需求較難用關鍵詞來描述時,推薦能夠在一定程度上幫助用戶找到其感興趣的商品。本文主要的研究與工作是為某通信運營商的手機應用商城提供相關推薦系統(tǒng)的實現(xiàn),包括app、電子書籍、動漫的相關推薦。當用戶瀏覽某個商品的詳情頁時,相應頁面的猜你喜歡功能會為用戶推薦4個跟正在瀏覽商品相關的商品。根據(jù)應用商城已有的用戶行為數(shù)據(jù)以及相應的商品的元數(shù)據(jù)的情況,對于不同的類別的商品采用不同的推薦模型。對于app,為了綜合利用協(xié)同過濾與基于內(nèi)容推薦各自的優(yōu)點,系統(tǒng)采用二項邏輯回歸對基于物品的協(xié)同過濾和基于內(nèi)容的推薦進行線性結合,邏輯回歸訓練數(shù)據(jù)來源于線上用戶真實數(shù)據(jù)。在進行兩個推薦算法線性結合前會利用用戶正在瀏覽app類別去過濾推薦結果中不屬于該類別的商品以提高推薦商品與用戶正在瀏覽商品的相似度。對于功能比較相似的幾個類別的商品,系統(tǒng)還采用app的價值模型[1]對結果進行重排序以確保推薦商品都是有一定的價值。app價值模型的前提是推薦商品與用戶正在瀏覽商品功能相似,模型參數(shù)可從用戶的行為中學習。系統(tǒng)現(xiàn)在的app推薦模型比剛上線時所采用僅基于物品的協(xié)同過濾模型的點擊率和轉化率分別提高了30%和20%。而應用商城上的動漫和書籍現(xiàn)階段只有少量的用戶行為,系統(tǒng)則采用基于內(nèi)容的相關推薦算法。app、動漫以及電子書籍在內(nèi)容相似度計算上所采用的特征都是TF-IDF。由于應用商城的用戶行為數(shù)據(jù)和商品數(shù)據(jù)量大,本文采用開源的分布式大數(shù)據(jù)處理框架Hadoop去構建推薦系統(tǒng)。有些推薦算法在Hadoop上面實現(xiàn)必須做一定優(yōu)化使其高效運行。本人在基于內(nèi)容的相關推薦算法在Hadoop上面實現(xiàn)時做了對熱點數(shù)據(jù)切分和組合以及減少數(shù)據(jù)冗余的優(yōu)化。對熱點數(shù)據(jù)的切分和組合使得數(shù)據(jù)能真正均勻分布在集群上運行,減少數(shù)據(jù)冗余在Hadoop上面即減少了磁盤IO和網(wǎng)絡IO。在實現(xiàn)優(yōu)化后,電子書籍的內(nèi)容相似度計算時間由15個小時下降到6個小時。推薦系統(tǒng)的結果存儲在HBase,本人也實現(xiàn)相應web服務響應客戶端的推薦請求。該應用商城的推薦服務已于2014年11月底上線服務,每天的PV訪問量超過100萬。截止到目前已穩(wěn)定服務了幾個月,推薦的點擊率與轉化率達到了通信運營商之前所設定的目標。
【關鍵詞】:手機商城推薦 協(xié)同過濾 基于內(nèi)容推薦 混合推薦 Hadoop
【學位授予單位】:中山大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要3-5
- Abstract5-10
- 第一章 概述10-18
- 1.1 項目背景與意義10-11
- 1.2 國內(nèi)外研究與開發(fā)現(xiàn)狀分析11-15
- 1.2.1 推薦系統(tǒng)11-12
- 1.2.2 手機應用商城推薦12-14
- 1.2.3 大數(shù)據(jù)14-15
- 1.3 項目的主要工作15-17
- 1.4 論文的結構17-18
- 第二章 相關原理與技術18-29
- 2.1 推薦算法18-23
- 2.1.1 協(xié)同過濾18-19
- 2.1.2 基于內(nèi)容的推薦算法19-21
- 2.1.3 混合推薦21-22
- 2.1.4 app價值模型22-23
- 2.1.5 推薦效果衡量方法23
- 2.2 Hadoop23-29
- 2.2.1 HDFS24-25
- 2.2.2 MapReduce25-27
- 2.2.3 Hbase27-29
- 第三章 iMarket推薦系統(tǒng)需求分析29-33
- 3.1 iMarket推薦系統(tǒng)需求概述29
- 3.2 iMarket推薦系統(tǒng)用例分析29-31
- 3.3 iMarket推薦系統(tǒng)領域分析與建模31
- 3.4 iMarket推薦系統(tǒng)非功能性需求31-33
- 第四章 iMarket推薦系統(tǒng)的算法與實現(xiàn)33-49
- 4.1 電子書籍與動漫推薦算法33-40
- 4.1.1 電子書籍與動漫推薦算法概述33-34
- 4.1.2 電子書籍與動漫基于內(nèi)容推薦算法實現(xiàn)34-37
- 4.1.3 基于內(nèi)容推薦算法在Hadoop實現(xiàn)的優(yōu)化37-39
- 4.1.4 基于內(nèi)容推薦算法復雜度39-40
- 4.2 app推薦算法40-48
- 4.2.1 app推薦算法概述40
- 4.2.2 app基于物品協(xié)同過濾實現(xiàn)40-43
- 4.2.3 app協(xié)同過濾與基于內(nèi)容推薦線性結合43-45
- 4.2.4 app價值模型對部分推薦結果進行調(diào)整45-47
- 4.2.5 app推薦算法復雜度47-48
- 4.3 推薦結果的過濾規(guī)則48-49
- 第五章 iMarket推薦系統(tǒng)設計49-57
- 5.1 iMarket推薦系統(tǒng)架構49-51
- 5.2 iMarket推薦系統(tǒng)數(shù)據(jù)流程51-54
- 5.3 iMarket推薦系統(tǒng)代碼模塊設計54-57
- 5.3.1 主要代碼模塊54-56
- 5.3.2 代碼的詳細設計56-57
- 第六章 iMarket推薦系統(tǒng)部署與應用57-63
- 6.1 iMarket推薦系統(tǒng)線上運行壞境57-59
- 6.2 iMarket線上推薦服務穩(wěn)定性的保障59-60
- 6.3 iMarket推薦結果展示60-63
- 第七章 總結與展望63-65
- 7.1 總結63
- 7.2 展望63-65
- 參考文獻65-68
- 致謝68
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張海玉;劉志都;楊彩;賈松浩;;基于頁面聚類的推薦算法的改進[J];計算機應用與軟件;2008年09期
2 王文;;個性化推薦算法研究[J];電腦知識與技術;2010年16期
3 張愷;秦亮曦;寧朝波;李文閣;;改進評價估計的混合推薦算法研究[J];微計算機信息;2010年36期
4 楊博;趙鵬飛;;推薦算法綜述[J];山西大學學報(自然科學版);2011年03期
5 吳泓辰;王新軍;成勇;彭朝暉;;基于協(xié)同過濾與劃分聚類的改進推薦算法[J];計算機研究與發(fā)展;2011年S3期
6 趙玉艷;谷勝偉;;一種面向云計算環(huán)境的服務推薦算法[J];巢湖學院學報;2012年03期
7 李克潮;梁正友;;基于多特征的個性化圖書推薦算法[J];計算機工程;2012年11期
8 呂善國;吳效葵;曹義親;;基于網(wǎng)絡結構的推薦算法[J];實驗室研究與探索;2012年07期
9 蘇瑩;劉建國;郭強;田大鋼;;考慮負面評價的個性化推薦算法研究[J];運籌與管理;2012年06期
10 鄭志嫻;;微博個性化內(nèi)容推薦算法研究[J];電腦開發(fā)與應用;2012年12期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個性化推薦算法[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個性化推薦算法[A];2008年計算機應用技術交流會論文集[C];2008年
3 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
4 周玉妮;鄭會頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動商務個性化推薦系統(tǒng)[A];社會經(jīng)濟發(fā)展轉型與系統(tǒng)工程——中國系統(tǒng)工程學會第17屆學術年會論文集[C];2012年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡的含時推薦算法[A];第五屆全國復雜網(wǎng)絡學術會議論文(摘要)匯集[C];2009年
6 梁莘q,
本文編號:276140
本文鏈接:http://sikaile.net/wenyilunwen/dongmansheji/276140.html