基于海量數(shù)據(jù)和商圈興趣點(diǎn)模型的商品推薦研究
發(fā)布時(shí)間:2020-12-15 08:02
“互聯(lián)網(wǎng)+”的環(huán)境下,市場(chǎng)競(jìng)爭(zhēng)愈加激烈,零售戶的營(yíng)銷(xiāo)活動(dòng)逐漸向消費(fèi)終端延伸,終端零售戶已經(jīng)成為企業(yè)與消費(fèi)者之間一個(gè)非常重要的中間點(diǎn),直接關(guān)系到企業(yè)發(fā)展。同時(shí),面對(duì)全國(guó)800萬(wàn)零售戶產(chǎn)生的海量數(shù)據(jù),如何挖掘潛在價(jià)值成為企業(yè)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)的關(guān)鍵。本文針對(duì)企業(yè)終端零售戶數(shù)量龐大、分布廣泛雜亂,難以直接從零售數(shù)據(jù)上挖掘出潛在興趣并進(jìn)行準(zhǔn)確推薦等問(wèn)題,研究了基于位置的推薦算法,最終引入針對(duì)消費(fèi)能力和區(qū)域經(jīng)濟(jì)發(fā)展?fàn)顩r更具代表性的商圈作為分析單元,提出基于商圈的商品推薦算法。該方法能在一定程度上緩解冷啟動(dòng)問(wèn)題,通過(guò)轉(zhuǎn)變?yōu)橐陨倘榛A(chǔ)的市場(chǎng)推薦和投放模式,加強(qiáng)企業(yè)對(duì)市場(chǎng)環(huán)境變化的預(yù)判與掌控。論文的研究工作主要分為以下幾個(gè)點(diǎn):1)海量數(shù)據(jù)的采集與處理。通過(guò)終端采集、市場(chǎng)走訪和系統(tǒng)填報(bào)等方式完成企業(yè)海量數(shù)據(jù)的采集,利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取美團(tuán)網(wǎng)中的商圈中心點(diǎn)數(shù)據(jù)和百度地圖api中的POI興趣點(diǎn)數(shù)據(jù)。針對(duì)海量數(shù)據(jù)問(wèn)題,引入Spark分布式處理框架進(jìn)行加工處理,完成數(shù)據(jù)的清洗、集成與轉(zhuǎn)換,實(shí)現(xiàn)商圈興趣點(diǎn)數(shù)據(jù)的預(yù)處理以及企業(yè)多源數(shù)據(jù)的整合。2)商圈興趣點(diǎn)模型的建立。針對(duì)現(xiàn)有商圈測(cè)評(píng)模型中區(qū)域邊界劃分不穩(wěn)定和地圖api...
【文章來(lái)源】:浙江理工大學(xué)浙江省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
吳山廣場(chǎng)周邊部分POI數(shù)據(jù)示例圖
圖 1.2 百度地圖吳山廣場(chǎng)商圈示例圖智慧商圈的建設(shè)發(fā)展,如何將商圈結(jié)構(gòu)進(jìn)行優(yōu)化成為一個(gè)重要的研究方劃分逐漸成為研究熱點(diǎn)。等[25]以 2017 年天津市中心城區(qū)的 POI 數(shù)據(jù)為例,其空間位置和屬性特結(jié)合熱點(diǎn)輻射,提出一種融合多維特征(K-means 空間聚類(lèi)算法、空間度估計(jì)算法)的商圈劃分方法,并采用量化評(píng)分法對(duì)商圈等級(jí)進(jìn)行劃分融合了多種方法的混合模型可得到較優(yōu)的商圈區(qū)域劃分;王家輝等人[2于二分思想的邊界探測(cè)算法和基于多邊形規(guī)則的商圈內(nèi)點(diǎn)判定方法將,建立起關(guān)于 POI 和商圈的映射關(guān)系,同時(shí)利用融合數(shù)據(jù)進(jìn)行初步商圈析,提出商圈評(píng)價(jià)模型用以評(píng)價(jià)。研究?jī)?nèi)容
展開(kāi)數(shù)據(jù)挖掘工作,其中 DBSCAN 密度聚類(lèi)算法將在章節(jié) 4.2 進(jìn)行詳細(xì)介紹。2.2 相關(guān)推薦算法目前推薦領(lǐng)域的研究已經(jīng)較為成熟,并能得到一定的推薦效果。針對(duì)已有的主流推薦算法,本文主要選取以下幾種進(jìn)行介紹。2.2.1 基于協(xié)同過(guò)濾的推薦算法協(xié)同過(guò)濾(Collabrative Filitering)算法自 1992 年首次提出以來(lái)就被大范圍應(yīng)用,是推薦算法中誕生最早,最為經(jīng)典、常用的一種,它通過(guò)分析已有用戶的歷史行為數(shù)據(jù)計(jì)算用戶之間的相似度,挖掘待推薦信息或者用戶之間的關(guān)聯(lián)性,并由此關(guān)聯(lián)預(yù)測(cè)用戶對(duì)推薦商品或內(nèi)容的偏好,進(jìn)行推薦。其推薦過(guò)程可以分為提取偏好信息(構(gòu)建用戶-項(xiàng)目評(píng)分矩陣)、確定相似用戶或項(xiàng)目、產(chǎn)生推薦結(jié)果三步,具體實(shí)現(xiàn)原理如圖 2.4 所示:
【參考文獻(xiàn)】:
期刊論文
[1]基于核密度估計(jì)的K-CFSFDP聚類(lèi)算法[J]. 董曉君,程春玲. 計(jì)算機(jī)科學(xué). 2018(11)
[2]基于電子導(dǎo)航地圖POI的北京城區(qū)綠色空間服務(wù)半徑分析[J]. 董仁才,姜天祺,李歡歡,李思遠(yuǎn),張永霖,付曉. 生態(tài)學(xué)報(bào). 2018(23)
[3]基于位置和屬性特征信息的多源數(shù)據(jù)融合[J]. 張翼然,陶迎春,蔡彩,吳愛(ài)華. 北京測(cè)繪. 2018(09)
[4]基于用戶非對(duì)稱(chēng)相似性的協(xié)同過(guò)濾推薦算法[J]. 黃賢英,龍姝言,謝晉. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[5]基于密度峰值優(yōu)化的Canopy-Kmeans并行算法[J]. 李琪,張欣,張平康,張航. 通信技術(shù). 2018(02)
[6]裂紋圖像分割與提取的聚類(lèi)分析方法[J]. 陳超,汪同慶. 煙臺(tái)大學(xué)學(xué)報(bào)(自然科學(xué)與工程版). 2018(01)
[7]多維特征融合的城市商圈劃分方法[J]. 郝斌,董碩,胡引翠,劉學(xué),高玉健,張亞冬. 地理與地理信息科學(xué). 2017(05)
[8]社交網(wǎng)絡(luò)環(huán)境下基于信任的推薦算法[J]. 陳婷,朱青,周夢(mèng)溪,王珊. 軟件學(xué)報(bào). 2017(03)
[9]基于地理位置和協(xié)同過(guò)濾的移動(dòng)推薦算法[J]. 孫禮輝. 新鄉(xiāng)學(xué)院學(xué)報(bào). 2016(09)
[10]大數(shù)據(jù)下基于Spark的電商實(shí)時(shí)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 岑凱倫,于紅巖,楊騰霄. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2016(24)
碩士論文
[1]基于FCM聚類(lèi)的品牌狀態(tài)判別模型的研究[D]. 沈紅紅.浙江理工大學(xué) 2018
[2]推薦系統(tǒng)中矩陣稀疏性問(wèn)題的研究[D]. 張洪順.北京交通大學(xué) 2018
[3]基于海量數(shù)據(jù)的市場(chǎng)投放策略研究[D]. 張琳.浙江理工大學(xué) 2018
[4]基于商圈理論的房地產(chǎn)項(xiàng)目定位研究[D]. 趙涌.青島理工大學(xué) 2018
[5]上海旅游興趣點(diǎn)搜索與點(diǎn)評(píng)熱度空間格局及其耦合性研究[D]. 王丹陽(yáng).上海師范大學(xué) 2017
[6]基于Spark的路網(wǎng)交通運(yùn)行狀態(tài)判別研究[D]. 朱熹.長(zhǎng)安大學(xué) 2017
[7]基于協(xié)同過(guò)濾的電子商務(wù)推薦系統(tǒng)的研究與設(shè)計(jì)[D]. 方飛強(qiáng).電子科技大學(xué) 2017
[8]基于數(shù)據(jù)挖掘的客戶消費(fèi)行為研究[D]. 王麗萍.浙江理工大學(xué) 2017
[9]基于流行性預(yù)測(cè)的推薦算法研究[D]. 劉冠君.電子科技大學(xué) 2016
[10]基于位置的推薦計(jì)算:Spark實(shí)現(xiàn)[D]. 吳庭.浙江大學(xué) 2016
本文編號(hào):2917947
【文章來(lái)源】:浙江理工大學(xué)浙江省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
吳山廣場(chǎng)周邊部分POI數(shù)據(jù)示例圖
圖 1.2 百度地圖吳山廣場(chǎng)商圈示例圖智慧商圈的建設(shè)發(fā)展,如何將商圈結(jié)構(gòu)進(jìn)行優(yōu)化成為一個(gè)重要的研究方劃分逐漸成為研究熱點(diǎn)。等[25]以 2017 年天津市中心城區(qū)的 POI 數(shù)據(jù)為例,其空間位置和屬性特結(jié)合熱點(diǎn)輻射,提出一種融合多維特征(K-means 空間聚類(lèi)算法、空間度估計(jì)算法)的商圈劃分方法,并采用量化評(píng)分法對(duì)商圈等級(jí)進(jìn)行劃分融合了多種方法的混合模型可得到較優(yōu)的商圈區(qū)域劃分;王家輝等人[2于二分思想的邊界探測(cè)算法和基于多邊形規(guī)則的商圈內(nèi)點(diǎn)判定方法將,建立起關(guān)于 POI 和商圈的映射關(guān)系,同時(shí)利用融合數(shù)據(jù)進(jìn)行初步商圈析,提出商圈評(píng)價(jià)模型用以評(píng)價(jià)。研究?jī)?nèi)容
展開(kāi)數(shù)據(jù)挖掘工作,其中 DBSCAN 密度聚類(lèi)算法將在章節(jié) 4.2 進(jìn)行詳細(xì)介紹。2.2 相關(guān)推薦算法目前推薦領(lǐng)域的研究已經(jīng)較為成熟,并能得到一定的推薦效果。針對(duì)已有的主流推薦算法,本文主要選取以下幾種進(jìn)行介紹。2.2.1 基于協(xié)同過(guò)濾的推薦算法協(xié)同過(guò)濾(Collabrative Filitering)算法自 1992 年首次提出以來(lái)就被大范圍應(yīng)用,是推薦算法中誕生最早,最為經(jīng)典、常用的一種,它通過(guò)分析已有用戶的歷史行為數(shù)據(jù)計(jì)算用戶之間的相似度,挖掘待推薦信息或者用戶之間的關(guān)聯(lián)性,并由此關(guān)聯(lián)預(yù)測(cè)用戶對(duì)推薦商品或內(nèi)容的偏好,進(jìn)行推薦。其推薦過(guò)程可以分為提取偏好信息(構(gòu)建用戶-項(xiàng)目評(píng)分矩陣)、確定相似用戶或項(xiàng)目、產(chǎn)生推薦結(jié)果三步,具體實(shí)現(xiàn)原理如圖 2.4 所示:
【參考文獻(xiàn)】:
期刊論文
[1]基于核密度估計(jì)的K-CFSFDP聚類(lèi)算法[J]. 董曉君,程春玲. 計(jì)算機(jī)科學(xué). 2018(11)
[2]基于電子導(dǎo)航地圖POI的北京城區(qū)綠色空間服務(wù)半徑分析[J]. 董仁才,姜天祺,李歡歡,李思遠(yuǎn),張永霖,付曉. 生態(tài)學(xué)報(bào). 2018(23)
[3]基于位置和屬性特征信息的多源數(shù)據(jù)融合[J]. 張翼然,陶迎春,蔡彩,吳愛(ài)華. 北京測(cè)繪. 2018(09)
[4]基于用戶非對(duì)稱(chēng)相似性的協(xié)同過(guò)濾推薦算法[J]. 黃賢英,龍姝言,謝晉. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[5]基于密度峰值優(yōu)化的Canopy-Kmeans并行算法[J]. 李琪,張欣,張平康,張航. 通信技術(shù). 2018(02)
[6]裂紋圖像分割與提取的聚類(lèi)分析方法[J]. 陳超,汪同慶. 煙臺(tái)大學(xué)學(xué)報(bào)(自然科學(xué)與工程版). 2018(01)
[7]多維特征融合的城市商圈劃分方法[J]. 郝斌,董碩,胡引翠,劉學(xué),高玉健,張亞冬. 地理與地理信息科學(xué). 2017(05)
[8]社交網(wǎng)絡(luò)環(huán)境下基于信任的推薦算法[J]. 陳婷,朱青,周夢(mèng)溪,王珊. 軟件學(xué)報(bào). 2017(03)
[9]基于地理位置和協(xié)同過(guò)濾的移動(dòng)推薦算法[J]. 孫禮輝. 新鄉(xiāng)學(xué)院學(xué)報(bào). 2016(09)
[10]大數(shù)據(jù)下基于Spark的電商實(shí)時(shí)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 岑凱倫,于紅巖,楊騰霄. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2016(24)
碩士論文
[1]基于FCM聚類(lèi)的品牌狀態(tài)判別模型的研究[D]. 沈紅紅.浙江理工大學(xué) 2018
[2]推薦系統(tǒng)中矩陣稀疏性問(wèn)題的研究[D]. 張洪順.北京交通大學(xué) 2018
[3]基于海量數(shù)據(jù)的市場(chǎng)投放策略研究[D]. 張琳.浙江理工大學(xué) 2018
[4]基于商圈理論的房地產(chǎn)項(xiàng)目定位研究[D]. 趙涌.青島理工大學(xué) 2018
[5]上海旅游興趣點(diǎn)搜索與點(diǎn)評(píng)熱度空間格局及其耦合性研究[D]. 王丹陽(yáng).上海師范大學(xué) 2017
[6]基于Spark的路網(wǎng)交通運(yùn)行狀態(tài)判別研究[D]. 朱熹.長(zhǎng)安大學(xué) 2017
[7]基于協(xié)同過(guò)濾的電子商務(wù)推薦系統(tǒng)的研究與設(shè)計(jì)[D]. 方飛強(qiáng).電子科技大學(xué) 2017
[8]基于數(shù)據(jù)挖掘的客戶消費(fèi)行為研究[D]. 王麗萍.浙江理工大學(xué) 2017
[9]基于流行性預(yù)測(cè)的推薦算法研究[D]. 劉冠君.電子科技大學(xué) 2016
[10]基于位置的推薦計(jì)算:Spark實(shí)現(xiàn)[D]. 吳庭.浙江大學(xué) 2016
本文編號(hào):2917947
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2917947.html
最近更新
教材專(zhuān)著