新聞事件的分布式混合推薦算法
本文選題:Spark + 分布式; 參考:《北京理工大學(xué)學(xué)報(bào)》2017年07期
【摘要】:針對新聞的個(gè)性化服務(wù)差及推薦效率低的問題,提出了一種新聞事件的分布式混合推薦算法.該算法改進(jìn)了傳統(tǒng)的層次聚類算法用于新聞事件發(fā)現(xiàn),通過協(xié)調(diào)簇中心距離和簇間最遠(yuǎn)距離的權(quán)重解決了傳統(tǒng)層次聚類中的大簇問題;使用混合推薦算法進(jìn)行事件推薦,引入了事件的多重特征來計(jì)算用戶興趣模型,更準(zhǔn)確地表示用戶的興趣偏好;采用Spark分布式計(jì)算平臺實(shí)現(xiàn)該算法,可處理大數(shù)據(jù)的個(gè)性化推薦問題.在公開數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明本文方法有效.
[Abstract]:A distributed hybrid recommendation algorithm for news events is proposed to solve the problems of poor personalized service and low recommendation efficiency. This algorithm improves the traditional hierarchical clustering algorithm for news event discovery, solves the problem of large clusters in traditional hierarchical clustering by coordinating the distance between the center of the cluster and the weight of the longest distance between clusters, and uses the hybrid recommendation algorithm to recommend events. The multi-feature of events is introduced to calculate user interest model, and the Spark distributed computing platform is used to implement the algorithm, which can deal with big data's personalized recommendation problem. Experimental results on open data sets show that the proposed method is effective.
【作者單位】: 北京理工大學(xué)計(jì)算機(jī)學(xué)院;北京市海量語言信息處理與云計(jì)算應(yīng)用工程技術(shù)研究中心;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61370137)
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 孫玲芳;周加波;徐會;許鋒;候志魯;;基于改進(jìn)K-means的網(wǎng)絡(luò)輿情熱點(diǎn)事件發(fā)現(xiàn)技術(shù)[J];計(jì)算機(jī)與現(xiàn)代化;2014年04期
2 于洪;李轉(zhuǎn)運(yùn);;基于遺忘曲線的協(xié)同過濾推薦算法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期
3 李忠俊;周啟海;帥青紅;;一種基于內(nèi)容和協(xié)同過濾同構(gòu)化整合的推薦系統(tǒng)模型[J];計(jì)算機(jī)科學(xué);2009年12期
相關(guān)碩士學(xué)位論文 前3條
1 楊志偉;基于Spark平臺推薦系統(tǒng)研究[D];中國科學(xué)技術(shù)大學(xué);2015年
2 唐真;基于hadoop的推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年
3 周昭濤;文本聚類分析效果評價(jià)及文本表示研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 汪佩;梁立;甘健侯;;基于用戶興趣變化的隱語義協(xié)同過濾算法[J];云南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年04期
2 牛振東;王帥;王詩航;陳杰;;新聞事件的分布式混合推薦算法[J];北京理工大學(xué)學(xué)報(bào);2017年07期
3 曲朝陽;徐鵬飛;婁建樓;顏佳;曲楠;;基于協(xié)同過濾的電力信息運(yùn)維知識個(gè)性化推薦模型[J];東北師大學(xué)報(bào)(自然科學(xué)版);2017年02期
4 朱海東;李蓓;潘倩;李穎;高健;;基于遺忘曲線理論的作業(yè)布置模型研究[J];浙江水利水電學(xué)院學(xué)報(bào);2017年02期
5 方璐;;移動(dòng)互聯(lián)網(wǎng)下本地生活服務(wù)O2O個(gè)性化推薦策略研究[J];科技創(chuàng)業(yè)月刊;2017年06期
6 余鵬程;李燁;;基于屬性規(guī)則與關(guān)聯(lián)規(guī)則的推薦模型設(shè)計(jì)[J];電子科技;2017年03期
7 王麗穎;葛麗娜;張翼鵬;王紅;;增量式聚類的新聞熱點(diǎn)話題發(fā)現(xiàn)研究[J];計(jì)算機(jī)與現(xiàn)代化;2017年03期
8 梁婷婷;李春青;李海生;;基于內(nèi)容過濾PageRank的Top-k學(xué)習(xí)資源匹配推薦[J];計(jì)算機(jī)工程;2017年02期
9 趙文濤;成亞飛;王春春;;基于Logistic時(shí)間函數(shù)和用戶特征的協(xié)同過濾算法[J];計(jì)算機(jī)應(yīng)用與軟件;2017年02期
10 孫克雷;陳安東;;基于用戶興趣的個(gè)性化推薦算法研究[J];安徽建筑大學(xué)學(xué)報(bào);2017年01期
相關(guān)碩士學(xué)位論文 前10條
1 王祥如;基于Hadoop平臺的個(gè)性化推薦算法研究與應(yīng)用[D];安徽大學(xué);2016年
2 陳茂軍;基于云平臺下的數(shù)據(jù)挖掘研究[D];華東交通大學(xué);2016年
3 劉穎瑩;基于密度的聚類算法及在新聞話題發(fā)現(xiàn)中的應(yīng)用研究[D];山東師范大學(xué);2016年
4 張賢德;基于Spark平臺的實(shí)時(shí)流計(jì)算推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];江蘇大學(xué);2016年
5 張韜;基于在線視頻用戶數(shù)據(jù)的DMP系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2016年
6 周文韜;基于Spark平臺的混合推薦算法的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2016年
7 盛華;聚類分析在文本挖掘中的應(yīng)用與研究[D];江南大學(xué);2016年
8 李琛軒;面向推薦的大數(shù)據(jù)計(jì)算與存儲平臺設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2016年
9 韓碩;并行程序性能建模關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2016年
10 劉珊珊;基于云計(jì)算平臺Hadoop的聚類神經(jīng)網(wǎng)絡(luò)算法的研究與實(shí)現(xiàn)[D];貴州大學(xué);2016年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 岳香芬;;網(wǎng)絡(luò)輿情文獻(xiàn)聚類分析[J];科技創(chuàng)業(yè)月刊;2012年06期
2 劉勘;朱懷萍;胡航;;網(wǎng)絡(luò)偽輿情的特征研究[J];情報(bào)雜志;2011年11期
3 柳虹;徐金華;;網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)研究[J];科技通報(bào);2011年03期
4 鄭魁;疏學(xué)明;袁宏永;;網(wǎng)絡(luò)輿情熱點(diǎn)信息自動(dòng)發(fā)現(xiàn)方法[J];計(jì)算機(jī)工程;2010年03期
5 曾潤喜;;網(wǎng)絡(luò)輿情信息資源共享研究[J];情報(bào)雜志;2009年08期
6 王偉;許鑫;;基于聚類的網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)及分析[J];現(xiàn)代圖書情報(bào)技術(shù);2009年03期
7 董麗;邢春曉;王克宏;;基于不同數(shù)據(jù)集的協(xié)作過濾算法評測[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版)網(wǎng)絡(luò).預(yù)覽;2009年04期
8 許海玲;吳瀟;李曉東;閻保平;;互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J];軟件學(xué)報(bào);2009年02期
9 周建頻;;供應(yīng)鏈信息共享與利用的相關(guān)模式[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年02期
10 邢春曉;高鳳榮;戰(zhàn)思南;周立柱;;適應(yīng)用戶興趣變化的協(xié)同過濾推薦算法[J];計(jì)算機(jī)研究與發(fā)展;2007年02期
相關(guān)碩士學(xué)位論文 前3條
1 梁彥;基于分布式平臺Spark和YARN的數(shù)據(jù)挖掘算法的并行化研究[D];中山大學(xué);2014年
2 邱榮財(cái);基于Spark平臺的CURE算法并行化設(shè)計(jì)與應(yīng)用[D];華南理工大學(xué);2014年
3 馮琳;集群計(jì)算引擎Spark中的內(nèi)存優(yōu)化研究與實(shí)現(xiàn)[D];清華大學(xué);2013年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐義峰;徐云青;劉曉平;;一種基于時(shí)間序列性的推薦算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年10期
2 余小鵬;;一種基于多層關(guān)聯(lián)規(guī)則的推薦算法研究[J];計(jì)算機(jī)應(yīng)用;2007年06期
3 張立燕;;一種基于用戶事務(wù)模式的推薦算法[J];福建電腦;2009年03期
4 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國科技信息;2009年07期
5 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強(qiáng);;智能博物館環(huán)境下的個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年19期
6 王文;;個(gè)性化推薦算法研究[J];電腦知識與技術(shù);2010年16期
7 張愷;秦亮曦;寧朝波;李文閣;;改進(jìn)評價(jià)估計(jì)的混合推薦算法研究[J];微計(jì)算機(jī)信息;2010年36期
8 夏秀峰;代沁;叢麗暉;;用戶顯意識下的多重態(tài)度個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年16期
9 楊博;趙鵬飛;;推薦算法綜述[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
10 尹長青;楊單稷;;基于視頻的智能推薦算法[J];科技傳播;2011年22期
相關(guān)會議論文 前7條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個(gè)性化推薦算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個(gè)性化推薦算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會論文集[C];2008年
3 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2004年
4 梁莘q,
本文編號:1810254
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1810254.html