基于LDA模型和AP聚類的主題演化分析
本文關(guān)鍵詞:基于LDA模型和AP聚類的主題演化分析
更多相關(guān)文章: 多主題演化 時間窗口 LDA模型 AP聚類算法 JS散度
【摘要】:隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)信息呈現(xiàn)爆炸性增長態(tài)勢,主題演化分析能夠幫助人們從海量的互聯(lián)網(wǎng)數(shù)據(jù)中獲取更有價值的信息。分析主題的演化發(fā)展軌跡有利于人們了解主題事件發(fā)生的前因后果,并對主題事件發(fā)展趨勢進(jìn)行更好地預(yù)測,進(jìn)而輔助管控。針對單個主題演化分析方法中閾值設(shè)定和主題漂移的問題,提出一種LDA-AP主題演化模型。該方法利用LDA模型對不同時間窗口內(nèi)的新聞文本分別進(jìn)行建模,得到相應(yīng)的主題。利用AP聚類算法對不同時間窗口內(nèi)的多個主題進(jìn)行聚類,其中計算主題相似度采用加入時間衰減因子的JS散度來度量。最后對多個主題內(nèi)容進(jìn)行演化分析。通過相關(guān)的實驗分析和對比,結(jié)果表明該方法可以改善主題演化的性能,并能較好地分析多個新聞主題事件隨時間的演化趨勢。
【作者單位】: 合肥工業(yè)大學(xué)管理學(xué)院;教育部過程優(yōu)化與智能決策重點實驗室;
【關(guān)鍵詞】: 多主題演化 時間窗口 LDA模型 AP聚類算法 JS散度
【基金】:國家自然科學(xué)青年基金(71301041,71271071)
【分類號】:TP391.1
【正文快照】: 0引言隨著互聯(lián)網(wǎng)的發(fā)展,社會化媒體如網(wǎng)絡(luò)新聞、微博等已成為發(fā)布事件的主要載體,有效挖掘和分析其中的事件信息有利于幫助用戶及時掌握事件動態(tài),了解事件趨勢。因此,從社會事件發(fā)生和傳播中有效地挖掘和分析網(wǎng)絡(luò)中的事件信息,具有重大的理論意義和實際價值。美國國防高級計劃
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 袁伯秋;周一民;李林;;LDA模型參數(shù)有偏估計方法[J];小型微型計算機(jī)系統(tǒng);2010年04期
2 唐曉波;向坤;;基于LDA模型和微博熱度的熱點挖掘[J];圖書情報工作;2014年05期
3 王嘉琦;徐朝軍;李藝;;基于LDA模型的社交網(wǎng)站自動量化評價研究[J];現(xiàn)代圖書情報技術(shù);2013年03期
4 曹娟;張勇東;李錦濤;唐勝;;一種基于密度的自適應(yīng)最優(yōu)LDA模型選擇方法[J];計算機(jī)學(xué)報;2008年10期
5 楚克明;李芳;;基于LDA模型的新聞話題的演化[J];計算機(jī)應(yīng)用與軟件;2011年04期
6 石大文;張暉;;基于LDA模型的BBS話題演化[J];工業(yè)控制計算機(jī);2012年05期
7 孫世杰;濮建忠;;基于LDA模型的Twitter中文微博熱點主題詞組發(fā)現(xiàn)[J];洛陽師范學(xué)院學(xué)報;2012年11期
8 石晶;胡明;石鑫;戴國忠;;基于LDA模型的文本分割[J];計算機(jī)學(xué)報;2008年10期
9 李保利;楊星;;基于LDA模型和話題過濾的研究主題演化分析[J];小型微型計算機(jī)系統(tǒng);2012年12期
10 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 丁兆云;王暉;;一種詞位置相關(guān)的LDA模型[A];2013第一屆中國指揮控制大會論文集[C];2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 張超;一種詞性標(biāo)注LDA模型的文本分類方法研究[D];華中師范大學(xué);2015年
2 毛龍龍;基于LDA模型的微博情感分析技術(shù)研究[D];西北師范大學(xué);2015年
3 張?zhí)锾?基于LDA模型的實體解析技術(shù)的研究與實現(xiàn)[D];北京郵電大學(xué);2013年
4 彭利斌;微博熱點話題發(fā)現(xiàn)與話題演化的研究[D];桂林電子科技大學(xué);2014年
5 荀靜;基于LDA模型的文檔情感摘要研究[D];山東師范大學(xué);2015年
,本文編號:610886
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/610886.html