基于文本和社交語境的微博數(shù)據(jù)情感分類
發(fā)布時間:2018-06-16 01:03
本文選題:情感分類 + 微博。 參考:《清華大學學報(自然科學版)》2014年10期
【摘要】:微博數(shù)據(jù)的情感分析具有重要的應用價值和研究價值,是網(wǎng)絡文本挖掘領域的研究熱點。微博消息非常短而且稀疏,同時包含大量的不規(guī)則詞語,噪聲很強,給傳統(tǒng)的情感分析方法帶來了很大的挑戰(zhàn)。受社會科學的相關理論的啟發(fā),該文嘗試利用微博消息的社交語境來幫助解決情感分析所面臨的稀疏性強和噪聲大的困難。由于文本向量的維度很高,而具有情感傾向的詞只占其中較少的一部分,因此將Lasso方法加進LR(logistic regression)模型中以提高模型的魯棒性。在真實的英文Twitter數(shù)據(jù)集上的實驗結果表明,加入社交語境和模型的稀疏約束能夠有效提高微博數(shù)據(jù)情感分類的準確率。
[Abstract]:The emotion analysis of micro blog data has important application value and research value . It is a hot topic in the field of network text mining . The microblog message is very short and sparse . It also contains a lot of irregular words . It has a strong noise .
【作者單位】: 清華大學電子工程系;
【基金】:國家“八六三”高技術項目(2012AA011004) 清華大學自主科研計劃項目(20111081023)
【分類號】:TP393.092
,
本文編號:2024481
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2024481.html
最近更新
教材專著