天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本和社交語境的微博數(shù)據(jù)情感分類

發(fā)布時間:2018-06-16 01:03

  本文選題:情感分類 + 微博。 參考:《清華大學學報(自然科學版)》2014年10期


【摘要】:微博數(shù)據(jù)的情感分析具有重要的應用價值和研究價值,是網(wǎng)絡文本挖掘領域的研究熱點。微博消息非常短而且稀疏,同時包含大量的不規(guī)則詞語,噪聲很強,給傳統(tǒng)的情感分析方法帶來了很大的挑戰(zhàn)。受社會科學的相關理論的啟發(fā),該文嘗試利用微博消息的社交語境來幫助解決情感分析所面臨的稀疏性強和噪聲大的困難。由于文本向量的維度很高,而具有情感傾向的詞只占其中較少的一部分,因此將Lasso方法加進LR(logistic regression)模型中以提高模型的魯棒性。在真實的英文Twitter數(shù)據(jù)集上的實驗結果表明,加入社交語境和模型的稀疏約束能夠有效提高微博數(shù)據(jù)情感分類的準確率。
[Abstract]:The emotion analysis of micro blog data has important application value and research value . It is a hot topic in the field of network text mining . The microblog message is very short and sparse . It also contains a lot of irregular words . It has a strong noise .
【作者單位】: 清華大學電子工程系;
【基金】:國家“八六三”高技術項目(2012AA011004) 清華大學自主科研計劃項目(20111081023)
【分類號】:TP393.092


本文編號:2024481

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2024481.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶57bc1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com