中文微博情感傾向性分析特征工程
本文關(guān)鍵詞: 情感傾向性分析 中文微博 特征工程 出處:《山西大學(xué)學(xué)報(bào)(自然科學(xué)版)》2014年04期 論文類型:期刊論文
【摘要】:情感傾向性分析是情感分析的重要組成部分,是一種按照情感傾向?qū)ξ谋具M(jìn)行分類的任務(wù)。微博與傳統(tǒng)的評(píng)論文本相比更加口語(yǔ)化與符號(hào)化,因此對(duì)微博進(jìn)行情感傾向性分析是一個(gè)非常有挑戰(zhàn)性的任務(wù);跈C(jī)器學(xué)習(xí)的方法是情感傾向性分析最經(jīng)典的算法,核心是要進(jìn)行特征的分析和選擇,例如詞袋特征等。然而,由于中文語(yǔ)言的獨(dú)特性,前人很多有效的特征都是語(yǔ)言相關(guān)的,將其直接用于中文微博效果不佳。在中文微博語(yǔ)料上,還沒(méi)有學(xué)者進(jìn)行細(xì)致的特征工程建設(shè)。基于此,文章綜合國(guó)內(nèi)外諸多特征,并考慮到中文的獨(dú)特性,對(duì)中文微博的褒貶中傾向性判別特征工程的詞、詞組、數(shù)值和句法特征分別進(jìn)行了研究,并提出了基于詞典規(guī)則的情感評(píng)分的新特征。最后經(jīng)過(guò)大量實(shí)驗(yàn)與分析,得出了可靠的特征組合。實(shí)驗(yàn)結(jié)果表明,此方法能夠明顯提高情感傾向性分析的結(jié)果。
[Abstract]:Affective orientation analysis is an important part of affective analysis and a task of classifying texts according to emotional tendency. Weibo is more colloquial and symbolic than traditional comment texts. Therefore, it is a very challenging task to analyze Weibo's affective orientation. The method based on machine learning is the most classical algorithm of affective orientation analysis, the core of which is to analyze and select features, such as word bag features, etc. However, Because of the uniqueness of the Chinese language, many of the former effective features are language-related, and their direct application to the Chinese language Weibo is not very effective. No scholar has carried out a detailed feature engineering construction in the Chinese Weibo corpus. Based on this, This paper synthesizes many characteristics at home and abroad, and taking into account the uniqueness of Chinese, studies the words, phrases, numerical values and syntactic features of Chinese Weibo's favoritism distinguishing feature engineering. A new feature of emotion score based on dictionary rules is proposed. After a lot of experiments and analysis, a reliable feature combination is obtained. The experimental results show that this method can obviously improve the results of emotional orientation analysis.
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院信息檢索研究中心;哈爾濱工業(yè)大學(xué)機(jī)電學(xué)院媒體系;
【基金】:國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(61133012);國(guó)家自然科學(xué)青年基金項(xiàng)目(61300113);國(guó)家自然科學(xué)基金面上項(xiàng)目(61273321)
【分類號(hào)】:TP391.1;TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學(xué)報(bào);2010年08期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 潘文富;郭友實(shí);;網(wǎng)絡(luò)輿情監(jiān)測(cè)技術(shù)研究綜述[J];福建電腦;2011年08期
2 來(lái)亮;錢(qián)屹;;文本情感分析綜述[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2012年18期
3 賀飛艷;何炎祥;劉楠;劉健博;彭敏;;面向微博短文本的細(xì)粒度情感特征抽取方法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
4 趙鴻艷;王素格;許超逸;;基于概率圖模型的文本對(duì)象情感分析[J];電腦開(kāi)發(fā)與應(yīng)用;2014年04期
5 鄭誠(chéng);楊希;張吉賡;;結(jié)合情感詞典與規(guī)則的微博情感極性分類方法[J];電腦知識(shí)與技術(shù);2014年13期
6 謝松縣;劉博;王挺;;應(yīng)用語(yǔ)義關(guān)系自動(dòng)構(gòu)建情感詞典[J];國(guó)防科技大學(xué)學(xué)報(bào);2014年03期
7 翟東海;杜佳;崔靜靜;聶洪玉;;基于雙粒度模型的中文情感特征詞提取研究[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
8 陳培文;傅秀芬;;采用SVM方法的文本情感極性分類研究[J];廣東工業(yè)大學(xué)學(xué)報(bào);2014年03期
9 王洪艷;;社會(huì)化電商用戶需求挖掘初探[J];電子商務(wù);2014年08期
10 左榮欣;;一種分層多算法集成的微博情感分類方法[J];電子世界;2014年17期
相關(guān)會(huì)議論文 前1條
1 易紅發(fā);肖明;彭繼春;寇嬌;;Twitter英文用戶眼中的中國(guó)(2006-2013)——基于主題建模和情感分析的探索[A];2014中國(guó)傳播論壇:“國(guó)際話語(yǔ)體系與國(guó)際傳播能力建設(shè)”研討會(huì)會(huì)議論文集[C];2014年
相關(guān)博士學(xué)位論文 前8條
1 田野;基于微博平臺(tái)的事件趨勢(shì)分析及預(yù)測(cè)研究[D];武漢大學(xué);2012年
2 王立才;上下文感知推薦系統(tǒng)若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2012年
3 孫春華;情感表達(dá)對(duì)在線評(píng)論有用性感知的影響研究[D];合肥工業(yè)大學(xué);2012年
4 施榮盛;投資者關(guān)注下資產(chǎn)定價(jià)研究[D];上海交通大學(xué);2013年
5 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
6 劉楠;面向微博短文本的情感分析研究[D];武漢大學(xué);2013年
7 黃煥;面向e-Learning的學(xué)習(xí)者情感建模及應(yīng)用研究[D];華中師范大學(xué);2014年
8 孫妮;B2C購(gòu)物網(wǎng)站商品評(píng)價(jià)的效應(yīng)研究[D];對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 周立柱;賀宇凱;王建勇;;情感分析研究綜述[J];計(jì)算機(jī)應(yīng)用;2008年11期
2 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期
3 徐琳宏;林鴻飛;趙晶;;情感語(yǔ)料庫(kù)的構(gòu)建和分析[J];中文信息學(xué)報(bào);2008年01期
4 姚天f ;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見(jiàn)挖掘綜述[J];中文信息學(xué)報(bào);2008年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 田海龍;朱艷輝;梁韜;馬進(jìn);劉t,
本文編號(hào):1544969
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1544969.html