天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于情感字集的中文情感傾向性分類研究

發(fā)布時間:2018-12-25 14:36
【摘要】:情感傾向性分類一般是指對文本的情感極性,如:積極、消極、中性等,進行自動化分類,在大數(shù)據(jù)時代主要用于調(diào)查大眾對某事件、人物或團體所持態(tài)度。傳統(tǒng)的方法特別費時且有很大的局限性,現(xiàn)如今通過搜取互聯(lián)網(wǎng)上的海量信息可以更加快速、方便的得到他人的意見,并且根據(jù)這些大量信息得出的意見可靠性往往更高。本文首先分析了基于情感詞典的中文情感傾向性分類的情況并利用ICTCLAS分詞和知網(wǎng)情感詞典進行傳統(tǒng)的中文情感傾向性分類實驗,對實驗結(jié)果進行分析總結(jié)后,發(fā)現(xiàn)不管是用哪種分詞工具或情感詞典都將給情感傾向分類結(jié)果帶來一些不確定的干擾,特別是不同的情感詞典在可靠度和分析的類別上都有很大的差別。針對以上這些情況,本文提出了 "情感字集"的概念,這些"字"不僅與使用類別無關(guān)且不需要中文分詞。所以這里首先欲找出這樣的一個情感字集:這些字本身就能影響其所組詞后的詞的情感傾向,或者字本身就帶有強烈的情感傾向。本文從兩個不同的來源挖掘出兩個不同版本的"情感字集",并且分別對這兩個版本進行了實驗得到了不同的實驗結(jié)果,最后選擇實驗效果更好的版本對情感傾向值的計算方法進行了以下改進。因為沒有分詞的過程,針對常用的否定詞與程度詞分別歸納整理了常用的"否定字"與"程度字"并將這些"否定字"、"程度字"對情感字的影響加入到實驗算法中;谇楦凶旨那楦袃A向性分類,在計算句子的情感傾向值時是根據(jù)每個字的情感值進行計算的,且所有的字都是完全獨立,而一些特殊詞組被拆分后有可能會影響句子的情感傾向性,所以本文使用了最大正向匹配法對這些詞進行識別。最后又通過查找字間關(guān)聯(lián),減少了連續(xù)同類型字的信息熵,進一步提高實驗的準確率,最高準確率相對于傳統(tǒng)按詞的準確率提高了近20%。
[Abstract]:Emotional preference classification generally refers to the emotional polarity of the text, such as positive, negative, neutral, etc. In big data's time, it was mainly used to investigate the attitude of the public towards a certain event, person or group. Traditional methods are especially time-consuming and have great limitations. Nowadays, it is more rapid and convenient to get the opinions of others by searching the vast amount of information on the Internet, and the reliability of the opinions obtained from these information is often higher. This paper first analyzes the situation of Chinese affective preference classification based on affective dictionary and carries on the traditional Chinese affective tendency classification experiment by using ICTCLAS participle and Know-net emotion dictionary. After analyzing and summing up the experimental results, It is found that no matter which kind of word segmentation tool or emotion dictionary is used, it will bring some uncertain interference to the classification results of affective tendency, especially different emotion dictionaries have great differences in reliability and category of analysis. In view of the above, this paper proposes the concept of "affective word set", which is not only independent of the usage category but also does not need Chinese word segmentation. So the first thing here is to find out such a set of emotional words: the words themselves can affect the emotional tendency of the words after the words, or the word itself has a strong emotional tendency. In this paper, two different versions of "affective word sets" are mined from two different sources, and the two versions are experimented with to obtain different experimental results. Finally, the better version of the experiment is chosen to improve the calculation method of affective tendency. Because there is no participle process, the common negative words and degree words are summed up and arranged separately, and the influence of these negative words and degree words on the affective words is added to the experimental algorithm. The affective preference classification based on the affective word set is calculated according to the emotion value of each word when calculating the affective tendency value of the sentence, and all the words are completely independent. Some special phrases may affect the emotional tendency of sentences after they are split, so we use the maximum forward matching method to identify these words. Finally, by searching the correlation between words, the information entropy of the words of the same continuous type is reduced, and the accuracy of the experiment is further improved. The highest accuracy rate is nearly 20% higher than that of the traditional words.
【學位授予單位】:昆明理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【參考文獻】

相關(guān)期刊論文 前10條

1 李婷婷;姬東鴻;;基于SVM和CRF多特征組合的微博情感分析[J];計算機應(yīng)用研究;2015年04期

2 朱璽;董喜雙;關(guān)毅;劉志廣;;基于半監(jiān)督學習的微博情感傾向性分析[J];山東大學學報(理學版);2014年11期

3 楊麗tD;;漢字字體設(shè)計中造型的情感表現(xiàn)方式[J];設(shè)計;2014年09期

4 劉姍;胡勇;;中文網(wǎng)絡(luò)話題評論文本語義傾向分析[J];信息安全與通信保密;2012年06期

5 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學報;2012年01期

6 吳亮;;一種改進的最大匹配分詞算法研究[J];現(xiàn)代商貿(mào)工業(yè);2010年09期

7 楊超;馮時;王大玲;楊楠;于戈;;基于情感詞典擴展技術(shù)的網(wǎng)絡(luò)輿情傾向性分析[J];小型微型計算機系統(tǒng);2010年04期

8 張小艷;宋麗平;;論文本分類中特征選擇方法[J];現(xiàn)代情報;2009年03期

9 吳志杰;;機器翻譯中漢語詞語切分的現(xiàn)狀——漢語分詞與漢英機器翻譯研究系列之一[J];外語研究;2009年01期

10 周立柱;賀宇凱;王建勇;;情感分析研究綜述[J];計算機應(yīng)用;2008年11期

相關(guān)博士學位論文 前1條

1 吳苑斌;情感傾向分析中的結(jié)構(gòu)化方法[D];復(fù)旦大學;2012年

相關(guān)碩士學位論文 前8條

1 李明;面向微博電影評論的情感分類研究[D];云南財經(jīng)大學;2014年

2 樊小超;基于機器學習的中文文本主題分類及情感分類研究[D];南京理工大學;2014年

3 陳曉東;基于情感詞典的中文微博情感傾向分析研究[D];華中科技大學;2012年

4 張立;基于新聞評論數(shù)據(jù)的K-means聚類算法的研究[D];太原理工大學;2010年

5 楊超;基于情感詞典擴展技術(shù)的網(wǎng)絡(luò)輿情傾向性分析[D];東北大學;2009年

6 邸錦;基于支持向量機的文本分類問題的研究[D];北京交通大學;2008年

7 劉偉;基于限定領(lǐng)域的問句相似度[D];天津師范大學;2008年

8 鄭偉;基于類別均衡的文本分類算法研究[D];西安電子科技大學;2006年

,

本文編號:2391262

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2391262.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶756fe***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产日韩精品欧美综合区| 熟女乱一区二区三区四区| 亚洲男人的天堂就去爱| 男人操女人下面国产剧情| 深夜日本福利在线观看| 国产精品免费精品一区二区| 天堂网中文字幕在线视频| 欧美一区二区三区99| 欧美不卡午夜中文字幕| 日韩欧美综合在线播放| 能在线看的视频你懂的| 观看日韩精品在线视频| 在线观看欧美视频一区| 国产精品一区二区视频成人| 内用黄老外示儒术出处| 加勒比日本欧美在线观看| 丰满少妇被猛烈插入在线观看| 国产一区二区三区四区中文| 日韩欧美国产高清在线| 五月天婷亚洲天婷综合网| 久久老熟女一区二区三区福利| 国产一区一一一区麻豆| 日本熟妇熟女久久综合| 国产又长又粗又爽免费视频| 欧美一级不卡视频在线观看| 嫩草国产福利视频一区二区| 成人日韩视频中文字幕| 91免费精品国自产拍偷拍| 午夜福利精品视频视频| 人人妻在人人看人人澡| 亚洲成人免费天堂诱惑| 国产精品一区二区三区日韩av| 日本人妻的诱惑在线观看| 人妻久久这里只有精品| 亚洲国产成人精品福利| 国产大屁股喷水在线观看视频| 国产精品欧美激情在线播放| 国产精品福利精品福利| 中文字日产幕码三区国产| 国内精品美女福利av在线| 日韩少妇人妻中文字幕|