天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Spark平臺的ALS加速算法研究

發(fā)布時間:2021-08-17 17:54
  協(xié)同過濾推薦算法在推薦系統(tǒng)中發(fā)揮著重要作用,但其存在執(zhí)行效率與排名精度較低的問題,交替最小二乘(ALS)算法可實現(xiàn)并行計算,從而提高執(zhí)行效率,但是該算法數(shù)據(jù)加載與迭代收斂的時間較長。為此,將非線性共軛梯度(NCG)算法與ALS算法相結(jié)合,提出一種ALS-NCG算法,以達到加速ALS算法的目的。在Spark分布式數(shù)據(jù)處理環(huán)境中對ALS-NCG算法進行性能評估,實驗結(jié)果表明,相比ALS算法,ALS-NCG算法獲取高精度推薦排名時需要的迭代次數(shù)與時間更少。 

【文章來源】:計算機工程. 2020,46(02)北大核心CSCD

【文章頁數(shù)】:7 頁

【部分圖文】:

基于Spark平臺的ALS加速算法研究


數(shù)據(jù)在RDD上的分區(qū)

路由表,策略,矢量


路由表構(gòu)建在ALS算法的While循環(huán)之前,具體布局如圖2所示,每次迭代無需重新計算,同理,更新M與U類似。矢量 x — 、g、 g — 以及P均被存儲在2個單獨的RDD中,使與其相關(guān)的分量存儲在同一個RDD,且分割方式與U類似。路由表策略可以確保所有的矢量塊在矢量運算中按照成分對齊,從而實現(xiàn)了各數(shù)據(jù)的RDD存儲以及RDD的分配運行。3 實驗結(jié)果與分析

收斂值,比值,算法


圖3表示不同規(guī)模的評分矩陣下2種算法在迭代次數(shù)相同時所用時間比值的變化趨勢,可以看出,ALS-NCG在時間消耗上比ALS小很多,隨著矩陣規(guī)模的增大,ALS-NCG的加速效果更明顯,性能更加優(yōu)越。在不同收斂值時,ALS與ALS-NCG的時間性能比值變化趨勢近似一致,可見,將改進的組合算法應(yīng)用于大數(shù)據(jù)環(huán)境中,即使收斂值擴大到10-3,也可以達到同樣的加速效果。3.4 ALS-NCG算法與ALS算法排名精度比較

【參考文獻】:
期刊論文
[1]基于位置的移動推薦系統(tǒng)效用評價研究[J]. 孟祥武,梁弼,杜雨露,張玉潔.  計算機學(xué)報. 2019(12)
[2]一種基于信任機制的概率矩陣分解協(xié)同過濾推薦算法[J]. 王建芳,苗艷玲,韓鵬飛,劉永利.  小型微型計算機系統(tǒng). 2019(01)
[3]基于信任機制下概率矩陣分解的用戶評分預(yù)測[J]. 杜東舫,徐童,魯亞男,管楚,劉淇,陳恩紅.  軟件學(xué)報. 2018(12)
[4]MapReduce與Spark用于大數(shù)據(jù)分析之比較[J]. 吳信東,嵇圣硙.  軟件學(xué)報. 2018(06)
[5]社交網(wǎng)絡(luò)中基于信任的推薦算法[J]. 劉英南,謝瑾奎,張家利,楊宗源.  小型微型計算機系統(tǒng). 2015(06)

碩士論文
[1]幾種融合非線性共軛梯度法的研究[D]. 齊昌霞.燕山大學(xué) 2017



本文編號:3348224

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3348224.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b52a5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com