社會(huì)網(wǎng)絡(luò)中基于U_BTM模型的主題挖掘
發(fā)布時(shí)間:2018-05-25 22:47
本文選題:社會(huì)網(wǎng)絡(luò) + 主題模型。 參考:《計(jì)算機(jī)應(yīng)用研究》2017年01期
【摘要】:現(xiàn)有的主題模型在挖掘社會(huì)網(wǎng)絡(luò)中的主題時(shí)往往會(huì)受到社會(huì)網(wǎng)絡(luò)中短文本的特征稀疏問題的影響,從而導(dǎo)致所挖掘的主題質(zhì)量低、主題差異小。為此,基于詞對(duì)主題模型BTM提出一種用戶—詞對(duì)主題模型U_BTM,采用K-means聚類算法將主題相近的短文本聚類成一個(gè)文檔,根據(jù)文檔中用戶的主題對(duì)詞對(duì)的產(chǎn)生模式進(jìn)行建模,采用Gibbs Sampling方法對(duì)模型的參數(shù)進(jìn)行推導(dǎo),最終得到社會(huì)網(wǎng)絡(luò)中潛在的主題和用戶的主題分布。實(shí)驗(yàn)結(jié)果表明,U_BTM模型能得到潛在的主題和每個(gè)用戶的主題分布,且相比其他模型所挖掘的主題差異大,具有更高的質(zhì)量和更低的困惑度。
[Abstract]:This paper puts forward a user - word - to - topic model U _ BTM based on the word - to - topic model BTM , and derives the potential theme and user ' s theme distribution in the social network . The experimental results show that the U _ BTM model can get the potential theme and the user ' s theme distribution . The experimental results show that the U _ BTM model can get the potential theme and the user ' s theme distribution . The experimental results show that the U _ BTM model has higher quality and lower degree of confusion than that of other models .
【作者單位】: 江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院;
【基金】:國家自然科學(xué)基金項(xiàng)目(71271117) 江蘇省科技支撐計(jì)劃項(xiàng)目(BE2011156)
【分類號(hào)】:TP391.1
,
本文編號(hào):1934939
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1934939.html
最近更新
教材專著