基于文檔分布式表達(dá)的新浪微博情感分類研究
發(fā)布時(shí)間:2017-08-19 08:07
本文關(guān)鍵詞:基于文檔分布式表達(dá)的新浪微博情感分類研究
更多相關(guān)文章: 微博 情感分類 文檔分布式表達(dá) Docvec
【摘要】:[目的/意義]擁有龐大用戶群體的新浪微博每天都產(chǎn)生海量的文本數(shù)據(jù),對(duì)其進(jìn)行情感分類有助于分析社會(huì)的輿論走向,為輿情監(jiān)測(cè)提供幫助。其中,如何挖掘微博中的文本特征與情感信息是微博情感分類研究的關(guān)鍵。[方法/過程]將能有效考察上下文語境的基于文檔分布式的特征表達(dá)方法引入到微博情感分類研究中,通過綜合考慮上下文的語義、語序和情感信息,將微博文本轉(zhuǎn)化為高維空間的特征向量,然后利用SVM分類器判斷文本的情感極性。[結(jié)果/結(jié)論]實(shí)驗(yàn)表明,對(duì)微博文本進(jìn)行文檔分布式特征表達(dá)后,其分類準(zhǔn)確率可達(dá)90.46%,優(yōu)于其他特征表達(dá)方法。
【作者單位】: 東北林業(yè)大學(xué)信息與計(jì)算機(jī)工程學(xué)院;哈爾濱工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院;
【關(guān)鍵詞】: 微博 情感分類 文檔分布式表達(dá) Docvec
【基金】:中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“基于社會(huì)網(wǎng)絡(luò)特征提取的群體性突發(fā)事件預(yù)警方法研究”(編號(hào):2572014DB05) 國(guó)家自然科學(xué)基金項(xiàng)目“群體性突發(fā)事件預(yù)警的超網(wǎng)絡(luò)方法研究”(編號(hào):71473034)
【分類號(hào)】:TP391.1
【正文快照】: Yang Yuting1Wang M ingyang1Tian Xianyun2Li Pengyu2(1.College of Information and Computer Engineering,Northeast Forestry University,Harbin 150040;2.School of M anagement,Harbin Institute of Technology,Harbin 150001)0引言作為中國(guó)最大的社交媒體平臺(tái),新浪微博,
本文編號(hào):699573
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/699573.html
最近更新
教材專著