一種分布式用戶瀏覽點(diǎn)擊模型算法
發(fā)布時(shí)間:2021-05-14 11:58
為從海量搜索點(diǎn)擊日志中快速挖掘用戶行為,提出一種分布式用戶瀏覽點(diǎn)擊模型(UBM)算法。原始UBM算法求出的檢驗(yàn)度參數(shù)E只與搜索結(jié)果文檔所在排序位置以及上一文檔的點(diǎn)擊位置有關(guān),且非常穩(wěn)定,基于此特性,將EM迭代求解轉(zhuǎn)換為抽樣估計(jì)檢驗(yàn)度以求解吸引度的分布式UBM算法。在Spark數(shù)據(jù)平臺(tái)上進(jìn)行仿真,結(jié)果表明,與原始UBM算法相比,該算法能夠解決點(diǎn)擊日志中存在的嚴(yán)重?cái)?shù)據(jù)傾斜問題,且運(yùn)行效率較高。
【文章來源】:計(jì)算機(jī)工程. 2019,45(03)北大核心CSCD
【文章頁數(shù)】:6 頁
【文章目錄】:
0 概述
1 UBM算法
2 UBM分布式過程中存在的問題
3 分布式UBM算法設(shè)計(jì)
3.1 總體框架
3.2 數(shù)據(jù)抽樣與檢驗(yàn)度參數(shù)E估計(jì)
3.3 吸引度A求解
4 基于Spark的分布式UBM算法實(shí)現(xiàn)
5 實(shí)驗(yàn)結(jié)果與分析
6 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]搜索引擎點(diǎn)擊模型綜述[J]. 王超,劉奕群,馬少平. 智能系統(tǒng)學(xué)報(bào). 2016(06)
[2]EM算法研究與應(yīng)用[J]. 王愛平,張功營,劉方. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(09)
本文編號(hào):3185596
【文章來源】:計(jì)算機(jī)工程. 2019,45(03)北大核心CSCD
【文章頁數(shù)】:6 頁
【文章目錄】:
0 概述
1 UBM算法
2 UBM分布式過程中存在的問題
3 分布式UBM算法設(shè)計(jì)
3.1 總體框架
3.2 數(shù)據(jù)抽樣與檢驗(yàn)度參數(shù)E估計(jì)
3.3 吸引度A求解
4 基于Spark的分布式UBM算法實(shí)現(xiàn)
5 實(shí)驗(yàn)結(jié)果與分析
6 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]搜索引擎點(diǎn)擊模型綜述[J]. 王超,劉奕群,馬少平. 智能系統(tǒng)學(xué)報(bào). 2016(06)
[2]EM算法研究與應(yīng)用[J]. 王愛平,張功營,劉方. 計(jì)算機(jī)技術(shù)與發(fā)展. 2009(09)
本文編號(hào):3185596
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3185596.html
最近更新
教材專著