基于分類的微博新情感詞抽取方法和特征分析
[Abstract]:Emotional or emotional analysis is widely used in public opinion analysis, commodity review analysis, commodity recommendation and other fields, while emotional or emotional analysis in texts is usually based on emotional dictionaries. Although the artificial emotion dictionary is accurate, it is expensive to build, it is difficult to update it in time, and it is difficult to adapt to the rapid change of new emotional words such as Weibo. Weibo platform provides a convenient way for the release and dissemination of new emotional words, and is an important source of new emotional words. Considering the existing large-scale artificial emotion dictionaries and a large number of Weibo data containing new emotional words, on the basis of statistics, analysis and comparison of the distribution differences of emotional words in Weibo between English and English, a new emotional word extraction method based on classification idea, cNSEm.cNSEm, which is independent of specific language, is proposed to automatically construct training data, train classifiers and distinguish the emotional polarity of candidate words according to Weibo dataset and emotion dictionary. Finally, the emotional polarity of candidate words is determined by voting mechanism. Through a large number of detailed experiments, this paper analyzes the performance of cNSEm on Weibo data in Chinese and English, the function and usage of six kinds of features, and the help of extracted new emotional words to Weibo emotion classification task. The experimental results show that cNSEm is better than the classical method based on co-occurrence and polar propagation, especially when considering the noun emotional words in the Chinese Weibo dataset. The new emotional words extracted by cNSEm are evaluated directly and indirectly. The former uses artificial emotion dictionary as a reference, while the latter examines the helpful effect of the extracted new emotional words on emotion classification. From the evaluation index, the quality of the new emotional words extracted by cNSEm is the same as that of artificial emotion dictionaries, and cNSEm can adapt to Chinese and English languages where there are great differences.
【作者單位】: 江西財(cái)經(jīng)大學(xué)信息管理學(xué)院 蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)與運(yùn)籌學(xué)系
【基金】:國家自然科學(xué)基金(61762042,61363039,61562032) 江西省落地計(jì)劃項(xiàng)目(KJLD14035) 江西省自然科學(xué)基金(20171BAB202021,20152ACB20003)資助~~
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 韓彤暉;楊東強(qiáng);馬宏偉;單詞統(tǒng)計(jì)特性在情感詞自動(dòng)抽取和商品評(píng)論分類中的作用[J];計(jì)算機(jī)應(yīng)用研究;2019年03期
2 劉德喜;聶建云;萬常選;劉喜平;廖述梅;廖國瓊;鐘敏娟;江騰蛟;;基于分類的微博新情感詞抽取方法和特征分析[J];計(jì)算機(jī)學(xué)報(bào);2018年07期
3 江騰蛟;萬常選;劉德喜;劉喜平;廖國瓊;;基于語義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J];計(jì)算機(jī)學(xué)報(bào);2017年03期
4 郭丹丹;金雅聲;丁燕兵;德格吉呼;;情感詞信息加工的腦神經(jīng)認(rèn)知機(jī)制研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年03期
5 吳金源;冀俊忠;趙學(xué)武;吳晨生;杜芳華;;基于特征選擇技術(shù)的情感詞權(quán)重計(jì)算[J];北京工業(yè)大學(xué)學(xué)報(bào);2016年01期
6 劉德喜;;情感詞擴(kuò)展對(duì)微博情感分類性能影響的實(shí)驗(yàn)分析[J];小型微型計(jì)算機(jī)系統(tǒng);2016年05期
7 何天翔;張暉;李波;楊春明;趙旭劍;;結(jié)合情感詞網(wǎng)的中文短文本情感分類[J];計(jì)算機(jī)應(yīng)用研究;2015年10期
8 孫艷;周學(xué)廣;付偉;;基于依存關(guān)聯(lián)分析的情感詞擴(kuò)展[J];北京郵電大學(xué)學(xué)報(bào);2012年05期
9 鄧淑卿;李玩?zhèn)?徐健;;基于句法依賴規(guī)則和詞性特征的情感詞識(shí)別研究[J];情報(bào)理論與實(shí)踐;2018年05期
10 陳鑫;王素格;廖健;;基于詞語相關(guān)度的微博新情感詞自動(dòng)識(shí)別[J];計(jì)算機(jī)應(yīng)用;2016年02期
相關(guān)會(huì)議論文 前6條
1 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
3 劉鴻宇;趙妍妍;秦兵;劉挺;;評(píng)價(jià)對(duì)象抽取及其傾向性分析[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
4 葛正榮;李婷玉;姚天f ;;漢語情感問題類型分類研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
5 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評(píng)論信息的挖掘[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
6 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動(dòng)標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 江騰蛟;基于句法和語義挖掘的Web金融評(píng)論情感分析[D];江西財(cái)經(jīng)大學(xué);2015年
2 楊玉珍;基于Web評(píng)論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年
3 彭云;提取商品特征和情感詞的語義約束LDA模型研究[D];江西財(cái)經(jīng)大學(xué);2016年
4 李榮軍;中文商品評(píng)論傾向性分析研究[D];北京郵電大學(xué);2011年
5 黃勝;Web評(píng)論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年
6 李巖;文本情感分析中關(guān)鍵問題的研究[D];北京郵電大學(xué);2014年
7 劉全超;面向中文微博的觀點(diǎn)挖掘與傾向性分析研究[D];北京理工大學(xué);2015年
8 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
9 何慧;WEB文本挖掘中關(guān)鍵問題的研究[D];北京郵電大學(xué);2009年
10 謝松縣;社交媒體中觀點(diǎn)信息分析與應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 馮佳;基于半監(jiān)督學(xué)習(xí)的餐廳評(píng)論情感分析技術(shù)[D];華中科技大學(xué);2016年
2 易劍波;基于文本挖掘的電商用戶評(píng)論分析與系統(tǒng)實(shí)現(xiàn)[D];東南大學(xué);2017年
3 孫健;基于信息融合的情感詞典擴(kuò)建研究[D];東華大學(xué);2017年
4 焦晨晨;基于深度學(xué)習(xí)的情感詞向量生成模型研究[D];北京郵電大學(xué);2016年
5 周曉;基于互聯(lián)網(wǎng)的情感詞庫擴(kuò)展與優(yōu)化研究[D];東北大學(xué);2011年
6 何新宇;基于改進(jìn)情感詞識(shí)別方法的輿情情感分析系統(tǒng)設(shè)計(jì)[D];北方工業(yè)大學(xué);2016年
7 張玉杰;情感詞的傾向性研究[D];北京郵電大學(xué);2011年
8 陳鑫;基于語義相關(guān)度特定文體新情感詞自動(dòng)識(shí)別[D];山西大學(xué);2016年
9 羅艷;基于情感詞的產(chǎn)品評(píng)論挖掘研究[D];華中科技大學(xué);2010年
10 馮倉龍;商品細(xì)粒度評(píng)價(jià)的識(shí)別與分析[D];沈陽航空航天大學(xué);2017年
,本文編號(hào):2508873
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2508873.html