基于復雜網絡重疊社團發(fā)現(xiàn)的微博話題檢測
發(fā)布時間:2017-10-06 02:28
本文關鍵詞:基于復雜網絡重疊社團發(fā)現(xiàn)的微博話題檢測
更多相關文章: 復雜網絡 重疊社團發(fā)現(xiàn) 話題檢測 青少年
【摘要】:社交媒體話題檢測一直是個熱點問題,由于社交數(shù)據雜亂異構,且具有時效性,語義模糊性等特點,話題檢測也是個難點問題.研究利用復雜網絡對社交文本數(shù)據進行建模,并結合一種基于極大團凝聚層次聚類的重疊社團發(fā)現(xiàn)方法實現(xiàn)了社交話題的檢測.文本數(shù)據建模中,通過自定義突發(fā)系數(shù)量化話題詞,即把話題詞看作具有時域分布偏好的關鍵詞,并通過自定義相關系數(shù)連接話題詞,構建話題網絡.為使自定義系數(shù)更適用于動態(tài)數(shù)據環(huán)境,實驗結合真實數(shù)據進行了適應性測試優(yōu)化系數(shù).文章把采用EAGLE重疊社團發(fā)現(xiàn)方法在公開數(shù)據集上評測,根據Q函數(shù)值顯示結果明顯優(yōu)于當前一些重疊社團發(fā)現(xiàn)策略,研究對采樣的60萬條青少年社交數(shù)據進行了話題分析并可視化了分析結果.
【作者單位】: 武漢大學計算機學院;貴州師范大學大數(shù)據與計算機科學學院;
【關鍵詞】: 復雜網絡 重疊社團發(fā)現(xiàn) 話題檢測 青少年
【基金】:國家自然科學基金(61133012,61373108) 貴州省科技廳聯(lián)合基金(黔科合J字LKS201237)
【分類號】:O157.5;TP391.1
【正文快照】: 1引言社交話題的檢測一直是個熱點問題,由于社交網絡數(shù)據雜亂異構,數(shù)據常常具有時效性,突發(fā)性和模糊性等特點,加之中文語義切分歧義性等復雜特點,中文社交話題的檢測一直是個難點問題[1].青少年作為社交網絡的原住民,其社交生活極具影響力,因此也受到各方面的關注.社交網絡對,
本文編號:980203
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/980203.html
最近更新
教材專著