天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于分類的微博新情感詞抽取方法和特征分析

發(fā)布時(shí)間:2019-07-02 10:46
【摘要】:情感或情緒分析在輿情分析、商品評(píng)論分析、商品推薦等領(lǐng)域應(yīng)用廣泛,而文本中的情感或情緒分析通常以情感詞典為基礎(chǔ).人工情感詞典雖然準(zhǔn)確但構(gòu)建代價(jià)大、難以及時(shí)更新,很難適應(yīng)微博這類新情感詞快速更迭的數(shù)據(jù).微博平臺(tái)為新情感詞的發(fā)布和傳播提供了便捷的途徑,是新情感詞的重要來源.考慮到已有規(guī)模較大的人工情感詞典及大量包含新情感詞的微博數(shù)據(jù),在統(tǒng)計(jì)、分析、對(duì)比中、英兩種語言微博中情感詞分布差異的基礎(chǔ)上,提出了與特定語言無關(guān)的基于分類思想的微博新情感詞抽取方法cNSEm.cNSEm根據(jù)微博數(shù)據(jù)集和情感詞典自動(dòng)構(gòu)建訓(xùn)練數(shù)據(jù)、訓(xùn)練分類器并判別候選詞的情感極性,最后采用投票機(jī)制確定候選詞的情感極性.通過大量而細(xì)致的實(shí)驗(yàn),分析了cNSEm在中、英文兩種語言的微博數(shù)據(jù)上的表現(xiàn)、六類特征的作用和用法以及抽取的新情感詞對(duì)微博情感分類任務(wù)的幫助作用.實(shí)驗(yàn)結(jié)果表明,cNSEm比經(jīng)典的基于共現(xiàn)和極性傳播的方法要好,特別是當(dāng)考慮中文微博數(shù)據(jù)集中的名詞類情感詞時(shí).對(duì)cNSEm抽取的新情感詞進(jìn)行了直接和間接兩種方法評(píng)測(cè),前者利用人工情感詞典作參照,后者考察抽取的新情感詞對(duì)情感分類的幫助作用,從評(píng)測(cè)指標(biāo)上看,cNSEm抽取的新情感詞與人工情感詞典的質(zhì)量相當(dāng),并且cNSEm能適應(yīng)有較大差異的中、英兩個(gè)語種.
[Abstract]:Emotional or emotional analysis is widely used in public opinion analysis, commodity review analysis, commodity recommendation and other fields, while emotional or emotional analysis in texts is usually based on emotional dictionaries. Although the artificial emotion dictionary is accurate, it is expensive to build, it is difficult to update it in time, and it is difficult to adapt to the rapid change of new emotional words such as Weibo. Weibo platform provides a convenient way for the release and dissemination of new emotional words, and is an important source of new emotional words. Considering the existing large-scale artificial emotion dictionaries and a large number of Weibo data containing new emotional words, on the basis of statistics, analysis and comparison of the distribution differences of emotional words in Weibo between English and English, a new emotional word extraction method based on classification idea, cNSEm.cNSEm, which is independent of specific language, is proposed to automatically construct training data, train classifiers and distinguish the emotional polarity of candidate words according to Weibo dataset and emotion dictionary. Finally, the emotional polarity of candidate words is determined by voting mechanism. Through a large number of detailed experiments, this paper analyzes the performance of cNSEm on Weibo data in Chinese and English, the function and usage of six kinds of features, and the help of extracted new emotional words to Weibo emotion classification task. The experimental results show that cNSEm is better than the classical method based on co-occurrence and polar propagation, especially when considering the noun emotional words in the Chinese Weibo dataset. The new emotional words extracted by cNSEm are evaluated directly and indirectly. The former uses artificial emotion dictionary as a reference, while the latter examines the helpful effect of the extracted new emotional words on emotion classification. From the evaluation index, the quality of the new emotional words extracted by cNSEm is the same as that of artificial emotion dictionaries, and cNSEm can adapt to Chinese and English languages where there are great differences.
【作者單位】: 江西財(cái)經(jīng)大學(xué)信息管理學(xué)院 蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)與運(yùn)籌學(xué)系
【基金】:國家自然科學(xué)基金(61762042,61363039,61562032) 江西省落地計(jì)劃項(xiàng)目(KJLD14035) 江西省自然科學(xué)基金(20171BAB202021,20152ACB20003)資助~~
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 韓彤暉;楊東強(qiáng);馬宏偉;單詞統(tǒng)計(jì)特性在情感詞自動(dòng)抽取和商品評(píng)論分類中的作用[J];計(jì)算機(jī)應(yīng)用研究;2019年03期

2 劉德喜;聶建云;萬常選;劉喜平;廖述梅;廖國瓊;鐘敏娟;江騰蛟;;基于分類的微博新情感詞抽取方法和特征分析[J];計(jì)算機(jī)學(xué)報(bào);2018年07期

3 江騰蛟;萬常選;劉德喜;劉喜平;廖國瓊;;基于語義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J];計(jì)算機(jī)學(xué)報(bào);2017年03期

4 郭丹丹;金雅聲;丁燕兵;德格吉呼;;情感詞信息加工的腦神經(jīng)認(rèn)知機(jī)制研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年03期

5 吳金源;冀俊忠;趙學(xué)武;吳晨生;杜芳華;;基于特征選擇技術(shù)的情感詞權(quán)重計(jì)算[J];北京工業(yè)大學(xué)學(xué)報(bào);2016年01期

6 劉德喜;;情感詞擴(kuò)展對(duì)微博情感分類性能影響的實(shí)驗(yàn)分析[J];小型微型計(jì)算機(jī)系統(tǒng);2016年05期

7 何天翔;張暉;李波;楊春明;趙旭劍;;結(jié)合情感詞網(wǎng)的中文短文本情感分類[J];計(jì)算機(jī)應(yīng)用研究;2015年10期

8 孫艷;周學(xué)廣;付偉;;基于依存關(guān)聯(lián)分析的情感詞擴(kuò)展[J];北京郵電大學(xué)學(xué)報(bào);2012年05期

9 鄧淑卿;李玩?zhèn)?徐健;;基于句法依賴規(guī)則和詞性特征的情感詞識(shí)別研究[J];情報(bào)理論與實(shí)踐;2018年05期

10 陳鑫;王素格;廖健;;基于詞語相關(guān)度的微博新情感詞自動(dòng)識(shí)別[J];計(jì)算機(jī)應(yīng)用;2016年02期

相關(guān)會(huì)議論文 前6條

1 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

2 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

3 劉鴻宇;趙妍妍;秦兵;劉挺;;評(píng)價(jià)對(duì)象抽取及其傾向性分析[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

4 葛正榮;李婷玉;姚天f ;;漢語情感問題類型分類研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年

5 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評(píng)論信息的挖掘[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

6 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動(dòng)標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

相關(guān)博士學(xué)位論文 前10條

1 江騰蛟;基于句法和語義挖掘的Web金融評(píng)論情感分析[D];江西財(cái)經(jīng)大學(xué);2015年

2 楊玉珍;基于Web評(píng)論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年

3 彭云;提取商品特征和情感詞的語義約束LDA模型研究[D];江西財(cái)經(jīng)大學(xué);2016年

4 李榮軍;中文商品評(píng)論傾向性分析研究[D];北京郵電大學(xué);2011年

5 黃勝;Web評(píng)論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年

6 李巖;文本情感分析中關(guān)鍵問題的研究[D];北京郵電大學(xué);2014年

7 劉全超;面向中文微博的觀點(diǎn)挖掘與傾向性分析研究[D];北京理工大學(xué);2015年

8 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年

9 何慧;WEB文本挖掘中關(guān)鍵問題的研究[D];北京郵電大學(xué);2009年

10 謝松縣;社交媒體中觀點(diǎn)信息分析與應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 馮佳;基于半監(jiān)督學(xué)習(xí)的餐廳評(píng)論情感分析技術(shù)[D];華中科技大學(xué);2016年

2 易劍波;基于文本挖掘的電商用戶評(píng)論分析與系統(tǒng)實(shí)現(xiàn)[D];東南大學(xué);2017年

3 孫健;基于信息融合的情感詞典擴(kuò)建研究[D];東華大學(xué);2017年

4 焦晨晨;基于深度學(xué)習(xí)的情感詞向量生成模型研究[D];北京郵電大學(xué);2016年

5 周曉;基于互聯(lián)網(wǎng)的情感詞庫擴(kuò)展與優(yōu)化研究[D];東北大學(xué);2011年

6 何新宇;基于改進(jìn)情感詞識(shí)別方法的輿情情感分析系統(tǒng)設(shè)計(jì)[D];北方工業(yè)大學(xué);2016年

7 張玉杰;情感詞的傾向性研究[D];北京郵電大學(xué);2011年

8 陳鑫;基于語義相關(guān)度特定文體新情感詞自動(dòng)識(shí)別[D];山西大學(xué);2016年

9 羅艷;基于情感詞的產(chǎn)品評(píng)論挖掘研究[D];華中科技大學(xué);2010年

10 馮倉龍;商品細(xì)粒度評(píng)價(jià)的識(shí)別與分析[D];沈陽航空航天大學(xué);2017年

,

本文編號(hào):2508873

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2508873.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e1282***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com