基于Spark平臺(tái)的ALS加速算法研究
發(fā)布時(shí)間:2021-08-17 17:54
協(xié)同過濾推薦算法在推薦系統(tǒng)中發(fā)揮著重要作用,但其存在執(zhí)行效率與排名精度較低的問題,交替最小二乘(ALS)算法可實(shí)現(xiàn)并行計(jì)算,從而提高執(zhí)行效率,但是該算法數(shù)據(jù)加載與迭代收斂的時(shí)間較長(zhǎng)。為此,將非線性共軛梯度(NCG)算法與ALS算法相結(jié)合,提出一種ALS-NCG算法,以達(dá)到加速ALS算法的目的。在Spark分布式數(shù)據(jù)處理環(huán)境中對(duì)ALS-NCG算法進(jìn)行性能評(píng)估,實(shí)驗(yàn)結(jié)果表明,相比ALS算法,ALS-NCG算法獲取高精度推薦排名時(shí)需要的迭代次數(shù)與時(shí)間更少。
【文章來源】:計(jì)算機(jī)工程. 2020,46(02)北大核心CSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
數(shù)據(jù)在RDD上的分區(qū)
路由表構(gòu)建在ALS算法的While循環(huán)之前,具體布局如圖2所示,每次迭代無需重新計(jì)算,同理,更新M與U類似。矢量 x — 、g、 g — 以及P均被存儲(chǔ)在2個(gè)單獨(dú)的RDD中,使與其相關(guān)的分量存儲(chǔ)在同一個(gè)RDD,且分割方式與U類似。路由表策略可以確保所有的矢量塊在矢量運(yùn)算中按照成分對(duì)齊,從而實(shí)現(xiàn)了各數(shù)據(jù)的RDD存儲(chǔ)以及RDD的分配運(yùn)行。3 實(shí)驗(yàn)結(jié)果與分析
圖3表示不同規(guī)模的評(píng)分矩陣下2種算法在迭代次數(shù)相同時(shí)所用時(shí)間比值的變化趨勢(shì),可以看出,ALS-NCG在時(shí)間消耗上比ALS小很多,隨著矩陣規(guī)模的增大,ALS-NCG的加速效果更明顯,性能更加優(yōu)越。在不同收斂值時(shí),ALS與ALS-NCG的時(shí)間性能比值變化趨勢(shì)近似一致,可見,將改進(jìn)的組合算法應(yīng)用于大數(shù)據(jù)環(huán)境中,即使收斂值擴(kuò)大到10-3,也可以達(dá)到同樣的加速效果。3.4 ALS-NCG算法與ALS算法排名精度比較
【參考文獻(xiàn)】:
期刊論文
[1]基于位置的移動(dòng)推薦系統(tǒng)效用評(píng)價(jià)研究[J]. 孟祥武,梁弼,杜雨露,張玉潔. 計(jì)算機(jī)學(xué)報(bào). 2019(12)
[2]一種基于信任機(jī)制的概率矩陣分解協(xié)同過濾推薦算法[J]. 王建芳,苗艷玲,韓鵬飛,劉永利. 小型微型計(jì)算機(jī)系統(tǒng). 2019(01)
[3]基于信任機(jī)制下概率矩陣分解的用戶評(píng)分預(yù)測(cè)[J]. 杜東舫,徐童,魯亞男,管楚,劉淇,陳恩紅. 軟件學(xué)報(bào). 2018(12)
[4]MapReduce與Spark用于大數(shù)據(jù)分析之比較[J]. 吳信東,嵇圣硙. 軟件學(xué)報(bào). 2018(06)
[5]社交網(wǎng)絡(luò)中基于信任的推薦算法[J]. 劉英南,謝瑾奎,張家利,楊宗源. 小型微型計(jì)算機(jī)系統(tǒng). 2015(06)
碩士論文
[1]幾種融合非線性共軛梯度法的研究[D]. 齊昌霞.燕山大學(xué) 2017
本文編號(hào):3348224
【文章來源】:計(jì)算機(jī)工程. 2020,46(02)北大核心CSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
數(shù)據(jù)在RDD上的分區(qū)
路由表構(gòu)建在ALS算法的While循環(huán)之前,具體布局如圖2所示,每次迭代無需重新計(jì)算,同理,更新M與U類似。矢量 x — 、g、 g — 以及P均被存儲(chǔ)在2個(gè)單獨(dú)的RDD中,使與其相關(guān)的分量存儲(chǔ)在同一個(gè)RDD,且分割方式與U類似。路由表策略可以確保所有的矢量塊在矢量運(yùn)算中按照成分對(duì)齊,從而實(shí)現(xiàn)了各數(shù)據(jù)的RDD存儲(chǔ)以及RDD的分配運(yùn)行。3 實(shí)驗(yàn)結(jié)果與分析
圖3表示不同規(guī)模的評(píng)分矩陣下2種算法在迭代次數(shù)相同時(shí)所用時(shí)間比值的變化趨勢(shì),可以看出,ALS-NCG在時(shí)間消耗上比ALS小很多,隨著矩陣規(guī)模的增大,ALS-NCG的加速效果更明顯,性能更加優(yōu)越。在不同收斂值時(shí),ALS與ALS-NCG的時(shí)間性能比值變化趨勢(shì)近似一致,可見,將改進(jìn)的組合算法應(yīng)用于大數(shù)據(jù)環(huán)境中,即使收斂值擴(kuò)大到10-3,也可以達(dá)到同樣的加速效果。3.4 ALS-NCG算法與ALS算法排名精度比較
【參考文獻(xiàn)】:
期刊論文
[1]基于位置的移動(dòng)推薦系統(tǒng)效用評(píng)價(jià)研究[J]. 孟祥武,梁弼,杜雨露,張玉潔. 計(jì)算機(jī)學(xué)報(bào). 2019(12)
[2]一種基于信任機(jī)制的概率矩陣分解協(xié)同過濾推薦算法[J]. 王建芳,苗艷玲,韓鵬飛,劉永利. 小型微型計(jì)算機(jī)系統(tǒng). 2019(01)
[3]基于信任機(jī)制下概率矩陣分解的用戶評(píng)分預(yù)測(cè)[J]. 杜東舫,徐童,魯亞男,管楚,劉淇,陳恩紅. 軟件學(xué)報(bào). 2018(12)
[4]MapReduce與Spark用于大數(shù)據(jù)分析之比較[J]. 吳信東,嵇圣硙. 軟件學(xué)報(bào). 2018(06)
[5]社交網(wǎng)絡(luò)中基于信任的推薦算法[J]. 劉英南,謝瑾奎,張家利,楊宗源. 小型微型計(jì)算機(jī)系統(tǒng). 2015(06)
碩士論文
[1]幾種融合非線性共軛梯度法的研究[D]. 齊昌霞.燕山大學(xué) 2017
本文編號(hào):3348224
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3348224.html
最近更新
教材專著