基于主題模型的突發(fā)話題推薦算法研究
發(fā)布時間:2025-01-10 20:11
隨著互聯(lián)網(wǎng)的普及,Facebook,Twitter,微博等社交網(wǎng)絡平臺憑借其方便快捷的特點迅速普及,逐漸成為傳統(tǒng)媒體以外的一個重要的信息來源。許多用戶使用社交平臺來表達自己的感受,與朋友分享感興趣的內(nèi)容與話題。同時社交網(wǎng)絡上許多突發(fā)性話題,往往會在網(wǎng)絡社交平臺上發(fā)布,借助用戶的好友轉(zhuǎn)發(fā)機制迅速傳播,引起廣泛的社會共鳴,進而產(chǎn)生巨大的社會影響。人們面臨的問題不僅是如何在海量的互聯(lián)網(wǎng)信息跟蹤突發(fā)事件和輿情走向,還需要從中找到自己真正感興趣的實時話題信息,因此,一個能檢測突發(fā)事件并推送給感興趣用戶的推薦算法能夠帶來更好的用戶體驗。鑒于以上需求,本文在前人研究的基礎上,以新浪微博為研究平臺,改進了傳統(tǒng)話題檢測技術并提出了一種基于主題模型的微博推薦方法。本文主要工作有以下三個部分:首先,根據(jù)新浪微博中突發(fā)事件發(fā)生的突發(fā)特征,使用突發(fā)詞特征來檢測微博中的突發(fā)話題,并使用LDA主題模型獲得突發(fā)微博的主題概率分布。其中,使用相對詞頻,詞頻增長率,突發(fā)權(quán)重三個特征來篩選突發(fā)詞,將存在突發(fā)詞的微博標記為突發(fā)微博,同時對突發(fā)微博進行主題建模。實驗證明實際采集的微博文本數(shù)據(jù)不僅提高了話題檢測效率,還更好地降低了...
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4025386
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
圖3.6對比實驗圖
會慘雜著大量的無關緊要的一些話題,噪聲較大,導致查準率非常大時,查準率會不斷増大,而查全率會相應的降低。當閾值為45的準率都達到61%,對應效果最好,因此突發(fā)詞閾值選取45。比實驗為文本為中心的突發(fā)詞聚類方法作為baseline方法,分別對比查準,將通過算法獲得的推薦....
本文編號:4025386
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4025386.html
最近更新
教材專著