基于動態(tài)主題模型融合多維數據的微博社區(qū)發(fā)現(xiàn)算法
本文選題:新浪微博 + 文本挖掘 ; 參考:《軟件學報》2017年02期
【摘要】:隨著微博用戶的不斷增加,微博網絡已成為用戶進行信息交流的平臺.針對由于博文長度受限,傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法無法有效解決微博網絡的稀疏性等問題,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先將微博網絡映射為有向加權網絡,網絡中邊的方向反映節(jié)點之間的關注關系,利用所提出的DTM(dynamic topic model)計算出節(jié)點之間的語義相似度,并將其作為節(jié)點間連邊的權重.DTM是一種微博主題模型.該模型不僅能夠挖掘博客的主題分布,而且能夠計算出某一主題中用戶的影響力大小.其次,利用所提出的復雜度較低的標簽傳播算法WLPA(weighted lebel propagation)進行微博網絡的社區(qū)發(fā)現(xiàn).該算法的初始化階段將影響力大的用戶節(jié)點作為初始節(jié)點,標簽按照節(jié)點的影響力從大到小進行傳播,避免了傳統(tǒng)標簽傳播算法逆流現(xiàn)象的發(fā)生,提高了標簽傳播算法的穩(wěn)定性.真實數據上的實驗結果表明,DTM模型能夠很好地對微博進行主題挖掘,DC-DTM算法能夠有效地挖掘出微博網絡的社區(qū).
[Abstract]:With the increasing of Weibo users, Weibo network has become a platform for users to exchange information. Because of the limited length of blog posts, the traditional community discovery algorithm can not effectively solve the problem of Weibo network sparsity and so on. A DC-DTM (discovery community by dynamic topic model) algorithm .DC-DTM algorithm is proposed to map the Weibo network to a directed weighted network. The direction of edges in the network reflects the relationship of concern between nodes, and the semantic similarity between nodes is calculated by using the proposed DTM (dynamic topic model), which is regarded as the weight of the connected edges between nodes. DTM is a kind of Weibo topic model. The model not only can mine the distribution of blog topics, but also can calculate the influence of users in a certain topic. Secondly, the proposed tag propagation algorithm WLPA (weighted lebel propagation) is used for community discovery in Weibo networks. In the initialization phase of the algorithm, the influential user nodes are taken as the initial nodes, and the labels are propagated according to the influence of the nodes from large to small, thus avoiding the reverse flow phenomenon of the traditional label propagation algorithm. The stability of label propagation algorithm is improved. The experimental results on real data show that the DTM model can effectively mine the community of Weibo network by using DC-DTM algorithm.
【作者單位】: 東北大學計算機科學與工程學院;東北大學軟件學院;
【分類號】:TP181
【相似文獻】
相關會議論文 前10條
1 何敏;陳中顯;梅松濤;;蟻群算法的研究與進展[A];中國計量協(xié)會冶金分會2010年會論文集[C];2010年
2 高瑋;;免疫連續(xù)蟻群算法[A];第二十六屆中國控制會議論文集[C];2007年
3 唐乾玉;韓曾晉;;基于擾動分析的優(yōu)化算法[A];1994中國控制與決策學術年會論文集[C];1994年
4 金成勛;周廣祿;郭恒業(yè);;對ICP算法中穩(wěn)定采樣的研究[A];立體圖象技術及其應用研討會論文集[C];2005年
5 陳元琰;閆友彪;羅曉曙;;REM算法的改進[A];廣西計算機學會2005年學術年會論文集[C];2005年
6 范瑛;;改進蟻群算法結合BP網絡用于入侵檢測[A];中國運籌學會模糊信息與模糊工程分會第五屆學術年會論文集[C];2010年
7 萬麗芬;鐘炎平;;約束LMS算法研究[A];第二十屆電工理論學術年會論文集[C];2008年
8 云飛;薛青;姚義軍;;改進型LMBP算法在軍事數據分析中的應用研究[A];'2010系統(tǒng)仿真技術及其應用學術會議論文集[C];2010年
9 朱雙東;艾智斌;閻夏;;BP網絡學習算法的改進方案探析[A];1998年中國智能自動化學術會議論文集(上冊)[C];1998年
10 唐乾玉;陳翰馥;韓曾晉;;串行生產線的參數優(yōu)化[A];1994年中國控制會議論文集[C];1994年
相關博士學位論文 前10條
1 楊擴軍;TIADC系統(tǒng)校準算法研究與實現(xiàn)[D];電子科技大學;2015年
2 黃亞魁;幾類優(yōu)化問題的BB型算法研究[D];西安電子科技大學;2015年
3 王戈;通信信號若干聯(lián)合處理技術研究[D];解放軍信息工程大學;2013年
4 易雯帆;非線性偏微分方程多解計算大范圍收斂算法及其應用研究[D];湖南師范大學;2016年
5 蔡永智;分布式電力系統(tǒng)狀態(tài)估計研究[D];華南理工大學;2016年
6 蘇雪平;基于交叉多模信息的新聞圖像人物標識算法[D];西北工業(yè)大學;2015年
7 謝侃;稀疏盲分離的理論與算法研究[D];廣東工業(yè)大學;2016年
8 王可心;大規(guī)模過程系統(tǒng)非線性優(yōu)化的簡約空間理論與算法研究[D];浙江大學;2008年
9 鮑吉鋒;平衡問題和優(yōu)化問題若干算法的收斂性分析[D];浙江大學;2013年
10 韓飛;基于先驗信息編碼的約束學習算法研究[D];中國科學技術大學;2006年
相關碩士學位論文 前10條
1 楊展;城軌列車自動調整系統(tǒng)模型與算法研究[D];西南交通大學;2015年
2 馬英鈞;基于人工蜂群算法的約束優(yōu)化問題研究[D];華中師范大學;2015年
3 錢其;電網諧波和間諧波功率的計量算法研究[D];中國科學技術大學;2015年
4 蔣玉冰;無線通信信號到達角跟蹤算法研究[D];電子科技大學;2014年
5 孫方亮;基于粒子群與中心引力的一種新混合算法及應用[D];西安電子科技大學;2014年
6 于詩杰;基于無波前探測的大氣光通信自適應補償方法研究[D];西安電子科技大學;2014年
7 柯家龍;壓縮感知算法及其在成像中的應用[D];南京郵電大學;2015年
8 劉光泓;并行磁共振圖像全變分恢復一階算法研究[D];南京郵電大學;2015年
9 張德祥;基于改進蟻群算法的機器人三維路徑規(guī)劃研究[D];青島科技大學;2015年
10 張申利;基于蜂群算法的GIS優(yōu)化選址及其并行化研究與應用[D];中國石油大學(華東);2014年
,本文編號:2058806
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2058806.html