支持聯(lián)機(jī)分析處理的推特用戶興趣維層次提取方法
本文選題:聯(lián)機(jī)分析處理 + 推特; 參考:《電子與信息學(xué)報(bào)》2017年09期
【摘要】:從海量推特?cái)?shù)據(jù)中探索用戶興趣的分布規(guī)律和相關(guān)性有利于實(shí)現(xiàn)精確的個(gè)性化推薦。聯(lián)機(jī)分析處理(OnLine Analytical Processing,OLAP)提供了一種適合人們探究數(shù)據(jù)的直觀形式。將OLAP技術(shù)應(yīng)用于推特?cái)?shù)據(jù)的關(guān)鍵是如何挖掘和構(gòu)建推特用戶的興趣維層次。針對(duì)現(xiàn)有方法只能提取單一層次興趣的不足,該文提出一種支持聯(lián)機(jī)分析處理的推特用戶興趣維層次提取方法。該方法首先通過Rest API獲取推特?cái)?shù)據(jù),然后通過改進(jìn)的LDA(Latent Dirichlet Allocation)模型挖掘用戶的興趣和子興趣,最后在此基礎(chǔ)上構(gòu)建興趣維層次結(jié)構(gòu)。實(shí)驗(yàn)評(píng)估了該方法的模型效果和可擴(kuò)展性,并證實(shí)與LDA和h LDA相比可以更有效地提取出推特用戶的興趣維層次并應(yīng)用于聯(lián)機(jī)分析處理。
[Abstract]:Exploring the distribution and correlation of user interest from massive Twitter data is beneficial to the realization of accurate personalized recommendation. Online Analytical processing (OLAP) provides an intuitive form for people to explore data. The key to apply OLAP technology to Twitter data is how to mine and construct the interest dimension of Twitter users. In view of the disadvantage that the existing methods can only extract interest at a single level, this paper proposes a method for extracting the dimension of interest of Twitter users, which supports on-line analytical processing (OLAP). The method firstly acquires Twitter data through Rest API, and then uses the improved LDA(Latent Dirichlet allocation model to mine the interest and sub-interest of users. Finally, the hierarchy of interest dimension is constructed on the basis of this. The model effect and extensibility of this method are evaluated and compared with LDA and h LDA, it is proved that this method can extract the interest dimension of Twitter users more effectively and be applied to OLAP.
【作者單位】: 杭州電子科技大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國家自然科學(xué)基金項(xiàng)目(61100043,61472112) 浙江省自然科學(xué)基金資助項(xiàng)目(LY12F02003) 浙江省科技計(jì)劃重點(diǎn)資助項(xiàng)目(2017C01010,2016F50014)~~
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張強(qiáng),鄧清,王紅霞;談聯(lián)機(jī)分析處理[J];信息技術(shù);2000年02期
2 楊雪峰,李亢,張可彤;聯(lián)機(jī)分析處理的實(shí)現(xiàn)及其性能調(diào)優(yōu)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2003年08期
3 戴科星;葉楓;;聯(lián)機(jī)分析處理在門診藥品收費(fèi)管理的應(yīng)用[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年08期
4 喻鋼,周定康;聯(lián)機(jī)分析處理(OLAP)技術(shù)的研究[J];計(jì)算機(jī)應(yīng)用;2001年11期
5 王冰峰,劉連忠;聯(lián)機(jī)分析處理及其在管理信息系統(tǒng)中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;2001年01期
6 葉德謙;具有主從服務(wù)器的聯(lián)機(jī)分析處理系統(tǒng)的研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年22期
7 張忠平,李榮,郭麗麗;聯(lián)機(jī)分析處理的綜述和分析[J];計(jì)算機(jī)應(yīng)用研究;2003年08期
8 魏莉;楊科華;;基于語義分解的聯(lián)機(jī)分析處理查詢并行優(yōu)化方案[J];計(jì)算機(jī)應(yīng)用;2010年07期
9 ;制定戰(zhàn)略決策的新工具——聯(lián)機(jī)分析處理[J];軟件世界;1994年05期
10 谷巖;基于三層結(jié)構(gòu)的聯(lián)機(jī)分析處理(OLAP)系統(tǒng)的研究與設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用與軟件;2005年03期
相關(guān)會(huì)議論文 前8條
1 方藝璇;劉虹;陳紅;李翠平;張延松;趙素云;陳杰;辛鑫;張吉;;圖形處理器加速的聯(lián)機(jī)分析處理系統(tǒng)[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
2 王偉;殷國富;;基于數(shù)據(jù)挖掘的多維聯(lián)機(jī)分析處理系統(tǒng)研究[A];全國先進(jìn)制造技術(shù)高層論壇暨制造業(yè)自動(dòng)化、信息化技術(shù)研討會(huì)論文集[C];2005年
3 遇輝;唐世渭;楊冬青;李囡;;基于單調(diào)性分類的聚集查詢結(jié)果導(dǎo)航[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
4 花鳴;王晨;周皓峰;汪衛(wèi);施伯樂;;基于審計(jì)的OLAP推論控制算法研究[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
5 遇輝;唐世渭;楊冬青;李囡;;基于立方體計(jì)算的關(guān)鍵梯度分析[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
6 李慶忠;張世棟;董國慶;;在數(shù)據(jù)多維體中進(jìn)行關(guān)聯(lián)規(guī)則的挖掘[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1999年
7 陳濤;鐘軍;陳茂華;張濤;梁嶸;;基于互聯(lián)網(wǎng)的中醫(yī)病案OLAP系統(tǒng)的開發(fā)與應(yīng)用[A];中華中醫(yī)藥學(xué)會(huì)中醫(yī)診斷學(xué)分會(huì)成立暨學(xué)術(shù)研討會(huì)論文集[C];2006年
8 王君珂;王柏;艾波;;I~3DSS在電信行業(yè)CRM系統(tǒng)中的應(yīng)用[A];’2004計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)議論文集[C];2004年
相關(guān)重要報(bào)紙文章 前1條
1 朱靜芬;新一代ERP的特點(diǎn)[N];財(cái)會(huì)信報(bào);2007年
相關(guān)碩士學(xué)位論文 前10條
1 趙淑芹;油田企業(yè)動(dòng)態(tài)聯(lián)機(jī)分析處理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
2 張柳;云環(huán)境下網(wǎng)絡(luò)告警管理系統(tǒng)設(shè)計(jì)[D];南京郵電大學(xué);2015年
3 梁遠(yuǎn)銘;基于Spark的聯(lián)機(jī)分析處理的研究[D];華中科技大學(xué);2015年
4 郭文君;聯(lián)機(jī)分析處理的研究與應(yīng)用[D];大連理工大學(xué);2002年
5 王小玲;分布式聯(lián)機(jī)分析處理在石油行業(yè)財(cái)務(wù)管理中的應(yīng)用[D];南京工業(yè)大學(xué);2005年
6 趙新;聯(lián)機(jī)分析處理的查詢分析客戶端設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2013年
7 許睿;聯(lián)機(jī)分析處理及其在商業(yè)自動(dòng)化中的應(yīng)用[D];重慶大學(xué);2002年
8 陳林;高等院校招生數(shù)據(jù)聯(lián)機(jī)分析處理系統(tǒng)[D];河海大學(xué);2005年
9 尹沐;基于文獻(xiàn)數(shù)據(jù)的Graph OLAP技術(shù)研究[D];北京郵電大學(xué);2013年
10 于敏;聯(lián)機(jī)分析處理(OLAP)建模方法研究[D];西安理工大學(xué);2009年
,本文編號(hào):1847001
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1847001.html