基于動(dòng)態(tài)主題模型融合多維數(shù)據(jù)的微博社區(qū)發(fā)現(xiàn)算法
本文選題:新浪微博 + 文本挖掘; 參考:《軟件學(xué)報(bào)》2017年02期
【摘要】:隨著微博用戶的不斷增加,微博網(wǎng)絡(luò)已成為用戶進(jìn)行信息交流的平臺(tái).針對(duì)由于博文長度受限,傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法無法有效解決微博網(wǎng)絡(luò)的稀疏性等問題,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先將微博網(wǎng)絡(luò)映射為有向加權(quán)網(wǎng)絡(luò),網(wǎng)絡(luò)中邊的方向反映節(jié)點(diǎn)之間的關(guān)注關(guān)系,利用所提出的DTM(dynamic topic model)計(jì)算出節(jié)點(diǎn)之間的語義相似度,并將其作為節(jié)點(diǎn)間連邊的權(quán)重.DTM是一種微博主題模型.該模型不僅能夠挖掘博客的主題分布,而且能夠計(jì)算出某一主題中用戶的影響力大小.其次,利用所提出的復(fù)雜度較低的標(biāo)簽傳播算法WLPA(weighted lebel propagation)進(jìn)行微博網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn).該算法的初始化階段將影響力大的用戶節(jié)點(diǎn)作為初始節(jié)點(diǎn),標(biāo)簽按照節(jié)點(diǎn)的影響力從大到小進(jìn)行傳播,避免了傳統(tǒng)標(biāo)簽傳播算法逆流現(xiàn)象的發(fā)生,提高了標(biāo)簽傳播算法的穩(wěn)定性.真實(shí)數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果表明,DTM模型能夠很好地對(duì)微博進(jìn)行主題挖掘,DC-DTM算法能夠有效地挖掘出微博網(wǎng)絡(luò)的社區(qū).
[Abstract]:With the increasing of Weibo users, Weibo network has become a platform for users to exchange information. Because of the limited length of blog posts, the traditional community discovery algorithm can not effectively solve the problem of Weibo network sparsity and so on. A DC-DTM (discovery community by dynamic topic model) algorithm .DC-DTM algorithm is proposed to map the Weibo network to a directed weighted network. The direction of edges in the network reflects the relationship of concern between nodes, and the semantic similarity between nodes is calculated by using the proposed DTM (dynamic topic model), which is regarded as the weight of the connected edges between nodes. DTM is a kind of Weibo topic model. The model not only can mine the distribution of blog topics, but also can calculate the influence of users in a certain topic. Secondly, the proposed tag propagation algorithm WLPA (weighted lebel propagation) is used for community discovery in Weibo networks. In the initialization phase of the algorithm, the influential user nodes are taken as the initial nodes, and the labels are propagated according to the influence of the nodes from large to small, thus avoiding the reverse flow phenomenon of the traditional label propagation algorithm. The stability of label propagation algorithm is improved. The experimental results on real data show that the DTM model can effectively mine the community of Weibo network by using DC-DTM algorithm.
【作者單位】: 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;東北大學(xué)軟件學(xué)院;
【分類號(hào)】:TP181
【相似文獻(xiàn)】
相關(guān)會(huì)議論文 前10條
1 何敏;陳中顯;梅松濤;;蟻群算法的研究與進(jìn)展[A];中國計(jì)量協(xié)會(huì)冶金分會(huì)2010年會(huì)論文集[C];2010年
2 高瑋;;免疫連續(xù)蟻群算法[A];第二十六屆中國控制會(huì)議論文集[C];2007年
3 唐乾玉;韓曾晉;;基于擾動(dòng)分析的優(yōu)化算法[A];1994中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1994年
4 金成勛;周廣祿;郭恒業(yè);;對(duì)ICP算法中穩(wěn)定采樣的研究[A];立體圖象技術(shù)及其應(yīng)用研討會(huì)論文集[C];2005年
5 陳元琰;閆友彪;羅曉曙;;REM算法的改進(jìn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年
6 范瑛;;改進(jìn)蟻群算法結(jié)合BP網(wǎng)絡(luò)用于入侵檢測[A];中國運(yùn)籌學(xué)會(huì)模糊信息與模糊工程分會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2010年
7 萬麗芬;鐘炎平;;約束LMS算法研究[A];第二十屆電工理論學(xué)術(shù)年會(huì)論文集[C];2008年
8 云飛;薛青;姚義軍;;改進(jìn)型LMBP算法在軍事數(shù)據(jù)分析中的應(yīng)用研究[A];'2010系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年
9 朱雙東;艾智斌;閻夏;;BP網(wǎng)絡(luò)學(xué)習(xí)算法的改進(jìn)方案探析[A];1998年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];1998年
10 唐乾玉;陳翰馥;韓曾晉;;串行生產(chǎn)線的參數(shù)優(yōu)化[A];1994年中國控制會(huì)議論文集[C];1994年
相關(guān)博士學(xué)位論文 前10條
1 楊擴(kuò)軍;TIADC系統(tǒng)校準(zhǔn)算法研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
2 黃亞魁;幾類優(yōu)化問題的BB型算法研究[D];西安電子科技大學(xué);2015年
3 王戈;通信信號(hào)若干聯(lián)合處理技術(shù)研究[D];解放軍信息工程大學(xué);2013年
4 易雯帆;非線性偏微分方程多解計(jì)算大范圍收斂算法及其應(yīng)用研究[D];湖南師范大學(xué);2016年
5 蔡永智;分布式電力系統(tǒng)狀態(tài)估計(jì)研究[D];華南理工大學(xué);2016年
6 蘇雪平;基于交叉多模信息的新聞圖像人物標(biāo)識(shí)算法[D];西北工業(yè)大學(xué);2015年
7 謝侃;稀疏盲分離的理論與算法研究[D];廣東工業(yè)大學(xué);2016年
8 王可心;大規(guī)模過程系統(tǒng)非線性優(yōu)化的簡約空間理論與算法研究[D];浙江大學(xué);2008年
9 鮑吉鋒;平衡問題和優(yōu)化問題若干算法的收斂性分析[D];浙江大學(xué);2013年
10 韓飛;基于先驗(yàn)信息編碼的約束學(xué)習(xí)算法研究[D];中國科學(xué)技術(shù)大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 楊展;城軌列車自動(dòng)調(diào)整系統(tǒng)模型與算法研究[D];西南交通大學(xué);2015年
2 馬英鈞;基于人工蜂群算法的約束優(yōu)化問題研究[D];華中師范大學(xué);2015年
3 錢其;電網(wǎng)諧波和間諧波功率的計(jì)量算法研究[D];中國科學(xué)技術(shù)大學(xué);2015年
4 蔣玉冰;無線通信信號(hào)到達(dá)角跟蹤算法研究[D];電子科技大學(xué);2014年
5 孫方亮;基于粒子群與中心引力的一種新混合算法及應(yīng)用[D];西安電子科技大學(xué);2014年
6 于詩杰;基于無波前探測的大氣光通信自適應(yīng)補(bǔ)償方法研究[D];西安電子科技大學(xué);2014年
7 柯家龍;壓縮感知算法及其在成像中的應(yīng)用[D];南京郵電大學(xué);2015年
8 劉光泓;并行磁共振圖像全變分恢復(fù)一階算法研究[D];南京郵電大學(xué);2015年
9 張德祥;基于改進(jìn)蟻群算法的機(jī)器人三維路徑規(guī)劃研究[D];青島科技大學(xué);2015年
10 張申利;基于蜂群算法的GIS優(yōu)化選址及其并行化研究與應(yīng)用[D];中國石油大學(xué)(華東);2014年
,本文編號(hào):2058806
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2058806.html