基于改進的OLDA模型話題檢測及演化分析
發(fā)布時間:2018-02-22 17:38
本文關鍵詞: 網絡輿情 OLDA模型 話題演化 話題檢測 Gibbs采樣 特征字 出處:《情報雜志》2017年02期 論文類型:期刊論文
【摘要】:[目的/意義]話題檢測和演化分析是網絡輿情監(jiān)控中的熱點問題,對熱點話題的檢測和演化分析有助于挖掘熱點話題和深入理解話題的演化趨勢,并給以輿情監(jiān)控者提供完整的話題演化路徑和更為合理的決策意見。[方法/過程]OLDA(Online Latent Dirichlet Allocation)模型是用于挖掘熱點話題和分析話題演化的工具,由于其存在新舊主題混合、冗余詞較多的缺點,采用雙通道模式對主題、詞分布的遺傳度進行改進,并給出了新的詞分布計算方法。[結果/結論]提出的改進OLDA模型解決了新舊主題混合問題,降低冗余詞的概率,更為明確地解釋話題的含義。實驗表明,改進的OLDA模型更為有效地對話題進行檢測及演化分析。
[Abstract]:[objective / significance] topic detection and evolution analysis are hot issues in the monitoring of network public opinion. The detection and evolution analysis of hot topics is helpful to excavate hot topics and understand the evolution trend of topics deeply. The [method / process] OLDA(Online Latent Dirichlet allocation model is a tool for mining hot topics and analyzing topic evolution. Because of the disadvantages of redundant words, we improve the heritability of topic and word distribution by using two-channel model, and give a new method to calculate word distribution. [results / conclusion] the improved OLDA model solves the problem of mixing new and old topics. The experimental results show that the improved OLDA model is more effective in detecting and analyzing the topic evolution.
【作者單位】: 合肥工業(yè)大學管理學院;過程優(yōu)化與智能決策教育部重點實驗室;
【基金】:教育部人文社會科學研究項目“云計算環(huán)境下企業(yè)知識組織與知識門戶系統(tǒng)研究”(編號:2012JYRW0710) 國家自然科學基金項目“基于制造大數據的產品研發(fā)知識集成與服務機制研究”(編號:71671057)
【分類號】:TP391.1;C912.63
,
本文編號:1524923
本文鏈接:http://sikaile.net/shekelunwen/shgj/1524923.html