LDA和KNN相結(jié)合的帖子熱度預(yù)測算法
發(fā)布時間:2017-09-28 01:04
本文關(guān)鍵詞:LDA和KNN相結(jié)合的帖子熱度預(yù)測算法
更多相關(guān)文章: 網(wǎng)絡(luò)輿情 潛在狄利克雷分配 K近鄰 帖子熱度預(yù)測 相似性
【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)輿情對社會的影響與日俱增.對互聯(lián)網(wǎng)上網(wǎng)民產(chǎn)生的海量文本內(nèi)容進(jìn)行快速準(zhǔn)確的分析,以及在此基礎(chǔ)上捕捉網(wǎng)絡(luò)輿情,并對其發(fā)展趨勢進(jìn)行預(yù)測,對社會經(jīng)濟(jì)發(fā)展無疑具有重要意義.為此,本文研究了論壇中帖子的熱度預(yù)測問題,針對現(xiàn)有算法在度量帖子內(nèi)容相似性時僅僅考慮字面上的相似性,未涉及語義層面,并且未考慮發(fā)帖人的特定喜好等不足,提出了LDA(潛在狄利克雷分配)與KNN(K近鄰)相結(jié)合的熱度預(yù)測算法,該算法利用LDA挖掘帖子表面文本隱藏的主題信息和用戶感興趣的主題信息,在概念層面上度量帖子之間的相似性,在此基礎(chǔ)上基于KNN算法對帖子的熱度進(jìn)行預(yù)測.在兩組數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,所提出的算法在預(yù)測準(zhǔn)確率方面明顯優(yōu)于相關(guān)工作中的方法,平均準(zhǔn)確率分別提高了4.34%和2.52%.
【作者單位】: 四川大學(xué)計算機(jī)學(xué)院;四川省軍區(qū)軍訓(xùn)辦公室;華西第二醫(yī)院信息管理部;
【關(guān)鍵詞】: 網(wǎng)絡(luò)輿情 潛在狄利克雷分配 K近鄰 帖子熱度預(yù)測 相似性
【基金】:浙江省自然科學(xué)基金(LY12F02010) 四川大學(xué)青年基金(2011SCU11017)
【分類號】:TP393.09;TP391.1
【正文快照】: 1引言隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)用戶數(shù)量快速增長,越來越多的網(wǎng)民傾向于利用網(wǎng)絡(luò)平臺來發(fā)表自己的看法和意見.論壇作為重要的網(wǎng)絡(luò)平臺,擁有大量的用戶,是人們獲取信息,發(fā)表言論的重要場所.例如,天涯論壇目前有7000多萬注冊用戶,數(shù)以萬計的用戶每天在上面發(fā)表或者回復(fù)自己感興趣的
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 高輝;王沙沙;傅彥;;Web輿情的長期趨勢預(yù)測方法[J];電子科技大學(xué)學(xué)報;2011年03期
2 盧s,
本文編號:932900
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/932900.html
最近更新
教材專著