基于速度增長的微博熱點話題發(fā)現(xiàn)
發(fā)布時間:2021-06-15 01:10
在微博熱點話題發(fā)現(xiàn)中,由于微博文本短、詞量少、用詞不規(guī)范等特征,使得傳統(tǒng)的熱點話題檢測方法力不從心。針對這一問題,提出了基于速度增長的微博熱點話題發(fā)現(xiàn)方法。首先把經(jīng)過預(yù)處理的微博按等數(shù)量窗口劃分,統(tǒng)計每個窗口內(nèi)各詞語的詞頻,并表示成時間二元組序列;然后通過計算每相鄰兩個窗口的個詞語的增長斜率來發(fā)現(xiàn)增長速度快的詞語;再通過計算與該詞語有關(guān)的用戶的增長速度和微博條數(shù)的增長速度來確定該詞語是否是熱點主題詞;最后通過熱點主題詞聚類產(chǎn)生熱點話題。通過實驗驗證了該方法的可行性。實驗結(jié)果表明,該方法在一定程度上提高了檢測效率,降低了漏檢率和誤檢率,可以有效地及時發(fā)現(xiàn)微博熱點話題。
【文章來源】:計算機應(yīng)用研究. 2013,30(09)北大核心CSCD
【文章頁數(shù)】:4 頁
【參考文獻(xiàn)】:
期刊論文
[1]一種中文微博新聞話題檢測的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計算機科學(xué). 2012(01)
[2]引入活躍指數(shù)的微博用戶排名機制[J]. 石磊,張聰,衛(wèi)琳. 小型微型計算機系統(tǒng). 2012(01)
碩士論文
[1]中文微博客熱點話題檢測與跟蹤技術(shù)研究[D]. 孫勝平.北京交通大學(xué) 2011
[2]微博客熱點話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
本文編號:3230600
【文章來源】:計算機應(yīng)用研究. 2013,30(09)北大核心CSCD
【文章頁數(shù)】:4 頁
【參考文獻(xiàn)】:
期刊論文
[1]一種中文微博新聞話題檢測的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計算機科學(xué). 2012(01)
[2]引入活躍指數(shù)的微博用戶排名機制[J]. 石磊,張聰,衛(wèi)琳. 小型微型計算機系統(tǒng). 2012(01)
碩士論文
[1]中文微博客熱點話題檢測與跟蹤技術(shù)研究[D]. 孫勝平.北京交通大學(xué) 2011
[2]微博客熱點話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
本文編號:3230600
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3230600.html
最近更新
教材專著