基于海量數(shù)據(jù)和商圈興趣點模型的商品推薦研究
發(fā)布時間:2020-12-15 08:02
“互聯(lián)網(wǎng)+”的環(huán)境下,市場競爭愈加激烈,零售戶的營銷活動逐漸向消費終端延伸,終端零售戶已經(jīng)成為企業(yè)與消費者之間一個非常重要的中間點,直接關(guān)系到企業(yè)發(fā)展。同時,面對全國800萬零售戶產(chǎn)生的海量數(shù)據(jù),如何挖掘潛在價值成為企業(yè)實現(xiàn)精準營銷的關(guān)鍵。本文針對企業(yè)終端零售戶數(shù)量龐大、分布廣泛雜亂,難以直接從零售數(shù)據(jù)上挖掘出潛在興趣并進行準確推薦等問題,研究了基于位置的推薦算法,最終引入針對消費能力和區(qū)域經(jīng)濟發(fā)展狀況更具代表性的商圈作為分析單元,提出基于商圈的商品推薦算法。該方法能在一定程度上緩解冷啟動問題,通過轉(zhuǎn)變?yōu)橐陨倘榛A(chǔ)的市場推薦和投放模式,加強企業(yè)對市場環(huán)境變化的預(yù)判與掌控。論文的研究工作主要分為以下幾個點:1)海量數(shù)據(jù)的采集與處理。通過終端采集、市場走訪和系統(tǒng)填報等方式完成企業(yè)海量數(shù)據(jù)的采集,利用網(wǎng)絡(luò)爬蟲技術(shù)獲取美團網(wǎng)中的商圈中心點數(shù)據(jù)和百度地圖api中的POI興趣點數(shù)據(jù)。針對海量數(shù)據(jù)問題,引入Spark分布式處理框架進行加工處理,完成數(shù)據(jù)的清洗、集成與轉(zhuǎn)換,實現(xiàn)商圈興趣點數(shù)據(jù)的預(yù)處理以及企業(yè)多源數(shù)據(jù)的整合。2)商圈興趣點模型的建立。針對現(xiàn)有商圈測評模型中區(qū)域邊界劃分不穩(wěn)定和地圖api...
【文章來源】:浙江理工大學(xué)浙江省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
吳山廣場周邊部分POI數(shù)據(jù)示例圖
圖 1.2 百度地圖吳山廣場商圈示例圖智慧商圈的建設(shè)發(fā)展,如何將商圈結(jié)構(gòu)進行優(yōu)化成為一個重要的研究方劃分逐漸成為研究熱點。等[25]以 2017 年天津市中心城區(qū)的 POI 數(shù)據(jù)為例,其空間位置和屬性特結(jié)合熱點輻射,提出一種融合多維特征(K-means 空間聚類算法、空間度估計算法)的商圈劃分方法,并采用量化評分法對商圈等級進行劃分融合了多種方法的混合模型可得到較優(yōu)的商圈區(qū)域劃分;王家輝等人[2于二分思想的邊界探測算法和基于多邊形規(guī)則的商圈內(nèi)點判定方法將,建立起關(guān)于 POI 和商圈的映射關(guān)系,同時利用融合數(shù)據(jù)進行初步商圈析,提出商圈評價模型用以評價。研究內(nèi)容
展開數(shù)據(jù)挖掘工作,其中 DBSCAN 密度聚類算法將在章節(jié) 4.2 進行詳細介紹。2.2 相關(guān)推薦算法目前推薦領(lǐng)域的研究已經(jīng)較為成熟,并能得到一定的推薦效果。針對已有的主流推薦算法,本文主要選取以下幾種進行介紹。2.2.1 基于協(xié)同過濾的推薦算法協(xié)同過濾(Collabrative Filitering)算法自 1992 年首次提出以來就被大范圍應(yīng)用,是推薦算法中誕生最早,最為經(jīng)典、常用的一種,它通過分析已有用戶的歷史行為數(shù)據(jù)計算用戶之間的相似度,挖掘待推薦信息或者用戶之間的關(guān)聯(lián)性,并由此關(guān)聯(lián)預(yù)測用戶對推薦商品或內(nèi)容的偏好,進行推薦。其推薦過程可以分為提取偏好信息(構(gòu)建用戶-項目評分矩陣)、確定相似用戶或項目、產(chǎn)生推薦結(jié)果三步,具體實現(xiàn)原理如圖 2.4 所示:
【參考文獻】:
期刊論文
[1]基于核密度估計的K-CFSFDP聚類算法[J]. 董曉君,程春玲. 計算機科學(xué). 2018(11)
[2]基于電子導(dǎo)航地圖POI的北京城區(qū)綠色空間服務(wù)半徑分析[J]. 董仁才,姜天祺,李歡歡,李思遠,張永霖,付曉. 生態(tài)學(xué)報. 2018(23)
[3]基于位置和屬性特征信息的多源數(shù)據(jù)融合[J]. 張翼然,陶迎春,蔡彩,吳愛華. 北京測繪. 2018(09)
[4]基于用戶非對稱相似性的協(xié)同過濾推薦算法[J]. 黃賢英,龍姝言,謝晉. 四川大學(xué)學(xué)報(自然科學(xué)版). 2018(03)
[5]基于密度峰值優(yōu)化的Canopy-Kmeans并行算法[J]. 李琪,張欣,張平康,張航. 通信技術(shù). 2018(02)
[6]裂紋圖像分割與提取的聚類分析方法[J]. 陳超,汪同慶. 煙臺大學(xué)學(xué)報(自然科學(xué)與工程版). 2018(01)
[7]多維特征融合的城市商圈劃分方法[J]. 郝斌,董碩,胡引翠,劉學(xué),高玉健,張亞冬. 地理與地理信息科學(xué). 2017(05)
[8]社交網(wǎng)絡(luò)環(huán)境下基于信任的推薦算法[J]. 陳婷,朱青,周夢溪,王珊. 軟件學(xué)報. 2017(03)
[9]基于地理位置和協(xié)同過濾的移動推薦算法[J]. 孫禮輝. 新鄉(xiāng)學(xué)院學(xué)報. 2016(09)
[10]大數(shù)據(jù)下基于Spark的電商實時推薦系統(tǒng)的設(shè)計與實現(xiàn)[J]. 岑凱倫,于紅巖,楊騰霄. 現(xiàn)代計算機(專業(yè)版). 2016(24)
碩士論文
[1]基于FCM聚類的品牌狀態(tài)判別模型的研究[D]. 沈紅紅.浙江理工大學(xué) 2018
[2]推薦系統(tǒng)中矩陣稀疏性問題的研究[D]. 張洪順.北京交通大學(xué) 2018
[3]基于海量數(shù)據(jù)的市場投放策略研究[D]. 張琳.浙江理工大學(xué) 2018
[4]基于商圈理論的房地產(chǎn)項目定位研究[D]. 趙涌.青島理工大學(xué) 2018
[5]上海旅游興趣點搜索與點評熱度空間格局及其耦合性研究[D]. 王丹陽.上海師范大學(xué) 2017
[6]基于Spark的路網(wǎng)交通運行狀態(tài)判別研究[D]. 朱熹.長安大學(xué) 2017
[7]基于協(xié)同過濾的電子商務(wù)推薦系統(tǒng)的研究與設(shè)計[D]. 方飛強.電子科技大學(xué) 2017
[8]基于數(shù)據(jù)挖掘的客戶消費行為研究[D]. 王麗萍.浙江理工大學(xué) 2017
[9]基于流行性預(yù)測的推薦算法研究[D]. 劉冠君.電子科技大學(xué) 2016
[10]基于位置的推薦計算:Spark實現(xiàn)[D]. 吳庭.浙江大學(xué) 2016
本文編號:2917947
【文章來源】:浙江理工大學(xué)浙江省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
吳山廣場周邊部分POI數(shù)據(jù)示例圖
圖 1.2 百度地圖吳山廣場商圈示例圖智慧商圈的建設(shè)發(fā)展,如何將商圈結(jié)構(gòu)進行優(yōu)化成為一個重要的研究方劃分逐漸成為研究熱點。等[25]以 2017 年天津市中心城區(qū)的 POI 數(shù)據(jù)為例,其空間位置和屬性特結(jié)合熱點輻射,提出一種融合多維特征(K-means 空間聚類算法、空間度估計算法)的商圈劃分方法,并采用量化評分法對商圈等級進行劃分融合了多種方法的混合模型可得到較優(yōu)的商圈區(qū)域劃分;王家輝等人[2于二分思想的邊界探測算法和基于多邊形規(guī)則的商圈內(nèi)點判定方法將,建立起關(guān)于 POI 和商圈的映射關(guān)系,同時利用融合數(shù)據(jù)進行初步商圈析,提出商圈評價模型用以評價。研究內(nèi)容
展開數(shù)據(jù)挖掘工作,其中 DBSCAN 密度聚類算法將在章節(jié) 4.2 進行詳細介紹。2.2 相關(guān)推薦算法目前推薦領(lǐng)域的研究已經(jīng)較為成熟,并能得到一定的推薦效果。針對已有的主流推薦算法,本文主要選取以下幾種進行介紹。2.2.1 基于協(xié)同過濾的推薦算法協(xié)同過濾(Collabrative Filitering)算法自 1992 年首次提出以來就被大范圍應(yīng)用,是推薦算法中誕生最早,最為經(jīng)典、常用的一種,它通過分析已有用戶的歷史行為數(shù)據(jù)計算用戶之間的相似度,挖掘待推薦信息或者用戶之間的關(guān)聯(lián)性,并由此關(guān)聯(lián)預(yù)測用戶對推薦商品或內(nèi)容的偏好,進行推薦。其推薦過程可以分為提取偏好信息(構(gòu)建用戶-項目評分矩陣)、確定相似用戶或項目、產(chǎn)生推薦結(jié)果三步,具體實現(xiàn)原理如圖 2.4 所示:
【參考文獻】:
期刊論文
[1]基于核密度估計的K-CFSFDP聚類算法[J]. 董曉君,程春玲. 計算機科學(xué). 2018(11)
[2]基于電子導(dǎo)航地圖POI的北京城區(qū)綠色空間服務(wù)半徑分析[J]. 董仁才,姜天祺,李歡歡,李思遠,張永霖,付曉. 生態(tài)學(xué)報. 2018(23)
[3]基于位置和屬性特征信息的多源數(shù)據(jù)融合[J]. 張翼然,陶迎春,蔡彩,吳愛華. 北京測繪. 2018(09)
[4]基于用戶非對稱相似性的協(xié)同過濾推薦算法[J]. 黃賢英,龍姝言,謝晉. 四川大學(xué)學(xué)報(自然科學(xué)版). 2018(03)
[5]基于密度峰值優(yōu)化的Canopy-Kmeans并行算法[J]. 李琪,張欣,張平康,張航. 通信技術(shù). 2018(02)
[6]裂紋圖像分割與提取的聚類分析方法[J]. 陳超,汪同慶. 煙臺大學(xué)學(xué)報(自然科學(xué)與工程版). 2018(01)
[7]多維特征融合的城市商圈劃分方法[J]. 郝斌,董碩,胡引翠,劉學(xué),高玉健,張亞冬. 地理與地理信息科學(xué). 2017(05)
[8]社交網(wǎng)絡(luò)環(huán)境下基于信任的推薦算法[J]. 陳婷,朱青,周夢溪,王珊. 軟件學(xué)報. 2017(03)
[9]基于地理位置和協(xié)同過濾的移動推薦算法[J]. 孫禮輝. 新鄉(xiāng)學(xué)院學(xué)報. 2016(09)
[10]大數(shù)據(jù)下基于Spark的電商實時推薦系統(tǒng)的設(shè)計與實現(xiàn)[J]. 岑凱倫,于紅巖,楊騰霄. 現(xiàn)代計算機(專業(yè)版). 2016(24)
碩士論文
[1]基于FCM聚類的品牌狀態(tài)判別模型的研究[D]. 沈紅紅.浙江理工大學(xué) 2018
[2]推薦系統(tǒng)中矩陣稀疏性問題的研究[D]. 張洪順.北京交通大學(xué) 2018
[3]基于海量數(shù)據(jù)的市場投放策略研究[D]. 張琳.浙江理工大學(xué) 2018
[4]基于商圈理論的房地產(chǎn)項目定位研究[D]. 趙涌.青島理工大學(xué) 2018
[5]上海旅游興趣點搜索與點評熱度空間格局及其耦合性研究[D]. 王丹陽.上海師范大學(xué) 2017
[6]基于Spark的路網(wǎng)交通運行狀態(tài)判別研究[D]. 朱熹.長安大學(xué) 2017
[7]基于協(xié)同過濾的電子商務(wù)推薦系統(tǒng)的研究與設(shè)計[D]. 方飛強.電子科技大學(xué) 2017
[8]基于數(shù)據(jù)挖掘的客戶消費行為研究[D]. 王麗萍.浙江理工大學(xué) 2017
[9]基于流行性預(yù)測的推薦算法研究[D]. 劉冠君.電子科技大學(xué) 2016
[10]基于位置的推薦計算:Spark實現(xiàn)[D]. 吳庭.浙江大學(xué) 2016
本文編號:2917947
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2917947.html
最近更新
教材專著