天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Hadoop的餐飲商戶推薦系統(tǒng)分布式優(yōu)化設(shè)計與實現(xiàn)

發(fā)布時間:2021-08-29 05:47
  隨著互聯(lián)網(wǎng)大數(shù)據(jù)分析平臺的高速發(fā)展,各行各業(yè)尤其是民生相關(guān)行業(yè)的用戶數(shù)據(jù)分析掀起了變革的浪潮!按髷(shù)據(jù)”分析使得我們的碎片時間得以有效利用,傳統(tǒng)的生活方式正在發(fā)生顛覆性的變化。如何有效地在海量的信息中準確獲取所需的信息,并向意向人群有效推薦所需信息,使信息獲取與搜索更高效,這是當下推薦系統(tǒng)研究的核心內(nèi)容。本文通過對餐飲行業(yè)用戶的消費習慣,針對兩個關(guān)鍵屬性(1)用戶對餐飲商戶的評分和(2)餐飲商戶的地理坐標信息展開推薦系統(tǒng)的研究。通過對當下推薦系統(tǒng)的國內(nèi)外研究現(xiàn)狀以及推薦系統(tǒng)常用的算法進行原理分析,選擇與關(guān)鍵屬性關(guān)聯(lián)度最高的基于物品的協(xié)同過濾算法和Geo Hash算法進行深度研究和應(yīng)用。通過用戶對餐飲商戶評分計算出餐飲商戶之間相似度,利用相似度得出推薦度評分,再通過Geo Hash算法快速匹配用戶的實時坐標與餐飲商戶的距離,從而推薦并滿足用戶所需的餐飲商戶列表。因在單機環(huán)境在處理大數(shù)據(jù)時由于硬件的限制無法快速得出推薦結(jié)果,故本文提出了基于Hadoop平臺的分布式存儲運算框架對基于物品的協(xié)同過濾算法和Geo Hash算法進行優(yōu)化,并通過實驗驗證了優(yōu)化后推薦算法通過調(diào)度集群中多臺服務(wù)器并行運... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:62 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于Hadoop的餐飲商戶推薦系統(tǒng)分布式優(yōu)化設(shè)計與實現(xiàn)


修正的余弦向量相似度計算結(jié)果

商戶,目標用戶,餐飲


第3章推薦系統(tǒng)的算法研究-26-獲取餐飲商戶之間的相似度后,預(yù)測目標用戶u對候選推薦物品j的推薦度評分并剔除掉那些被目標用戶u已經(jīng)評分過的餐飲商戶。向目標用戶14推薦的餐飲商戶列表如圖3-4所示。圖3-4目標用戶14的推薦商戶及推薦分列表精確率的計算方法在第3.1.3節(jié)中已經(jīng)提出,計算精確率的目的是驗證推薦給目標用戶的餐飲商戶,目標用戶是否真的去消費過并做了評分(目標用戶在該餐飲商戶消費后才能對其進行評分);诖诉壿媽⒈敬窝芯坑玫臄(shù)據(jù)集按時間進行劃分比例為8:2的訓(xùn)練集:測試集拆分;訓(xùn)練集的目標是用于找出為目標用戶u推薦的餐飲商戶,而測試集的目標則是驗證目標用戶u是否對推薦的餐飲商戶進行了評分?紤]到推薦算法的穩(wěn)定性,在不同數(shù)據(jù)處理量下進行指標評價,這里考慮通過相似餐飲商戶數(shù)量K作為數(shù)據(jù)處理量的大小,當K取值為5、10、20、40、80和160時,對應(yīng)的精確率、召回率和F值的指標評價如表3-8所示。從表3-8可以看出,使用此推薦算法的精確率平均值在6%左右,召回率平均值在1.7%左右,F(xiàn)值平均值在3%左右,符合本次研究的推薦算法要求。

商戶,地理,坐標,二進制編碼


第3章推薦系統(tǒng)的算法研究-29-3.2.2GeoHash算法的編碼實現(xiàn)與結(jié)果展示本次餐飲商戶的地理坐標信息格式如表3-6所示:表3-6餐飲商戶的地理坐標信息restaurantIdlatitudelongitude123.009262113.3413223.122261113.2674………13126223.181535113.31881GeoHash的編碼實現(xiàn)過程主要分為以下幾個步驟:(1)首先初始化base32編碼對應(yīng)的字符:finalstaticchar[]digits={"0","1","2","3","4","5","6","7","8","9","b","c","d","e","f","g","h","j","k","m","n","p","q","r","s","t","u","v","w","x","y","z"},并建立字符與數(shù)字之間的映射關(guān)系;(2)獲取需要處理的經(jīng)緯度坐標;(3)對經(jīng)緯度區(qū)間分別進行30次二分法區(qū)間,并且定義左區(qū)間為二進制編碼0,右區(qū)間為二進制編碼1,并保存這些二分法區(qū)間和二進制編碼;(4)根據(jù)需要處理的經(jīng)緯度坐標,查找按(3)中的二分法區(qū)間匹配獲取對應(yīng)的經(jīng)緯度二進制編碼;(5)將(4)中獲取的經(jīng)緯度二進制編碼進行混編,奇數(shù)位放經(jīng)度的二進制編碼,偶數(shù)位放緯度的二進制編碼,得到混編后的GeoHash二進制編碼;(6)將(5)中獲取的GeoHash二進制編碼,按每5位二進制映射一位base32編碼,最后得到12位base32編碼的字符串,即為目標經(jīng)緯度坐標的GeoHash編碼。編碼后的結(jié)果如圖3-5所示:圖3-5GEOHASH編碼后商戶地理坐標

【參考文獻】:
期刊論文
[1]基于物品的改進協(xié)同過濾算法及應(yīng)用[J]. 鄧園園,吳美香,潘家輝.  計算機系統(tǒng)應(yīng)用. 2019(01)
[2]協(xié)同過濾推薦算法研究進展[J]. 翁小蘭,王志堅.  計算機工程與應(yīng)用. 2018(01)
[3]云計算框架的海量數(shù)據(jù)查詢技術(shù)研究[J]. 楊芬.  呂梁學(xué)院學(xué)報. 2017(02)
[4]云計算中Hadoop技術(shù)研究與應(yīng)用綜述[J]. 夏靖波,韋澤鯤,付凱,陳珍.  計算機科學(xué). 2016(11)
[5]基于Geohash的面數(shù)據(jù)區(qū)域查詢[J]. 金安,程承旗,宋樹華,陳波.  地理與地理信息科學(xué). 2013(05)
[6]Hadoop平臺在云計算中的應(yīng)用[J]. 王宏宇.  軟件. 2011(04)
[7]個性化推薦系統(tǒng)的研究進展[J]. 劉建國,周濤,汪秉宏.  自然科學(xué)進展. 2009(01)

博士論文
[1]基于協(xié)同過濾的推薦算法研究[D]. 劉青文.中國科學(xué)技術(shù)大學(xué) 2013

碩士論文
[1]基于Hadoop的智慧物流平臺的車輛調(diào)度優(yōu)化算法的設(shè)計與實現(xiàn)[D]. 陳燕.中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計算技術(shù)研究所) 2018
[2]基于大數(shù)據(jù)分析的推薦系統(tǒng)研究[D]. 房璐璐.北京郵電大學(xué) 2015
[3]基于Apache Mahout的推薦算法的研究與實現(xiàn)[D]. 常江.電子科技大學(xué) 2013
[4]基于Mahout的推薦系統(tǒng)的研究與實現(xiàn)[D]. 馬寧.蘭州大學(xué) 2013
[5]基于hadoop的推薦系統(tǒng)設(shè)計與實現(xiàn)[D]. 唐真.電子科技大學(xué) 2013
[6]基于Hadoop的大型網(wǎng)站海量數(shù)據(jù)的統(tǒng)計與應(yīng)用[D]. 吳金虎.南京大學(xué) 2012



本文編號:3370036

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3370036.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f4f4b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com