基于集成方法的情感分析
本文選題:集成方法 + 情感分析 ; 參考:《河北地質(zhì)大學(xué)》2016年碩士論文
【摘要】:網(wǎng)絡(luò)社交媒體為人們提供了快速便捷的交流環(huán)境,通過這些社交平臺人們可以對社會輿論熱點發(fā)表自己的觀點和看法,情感分析是一種從觀點和看法中分析人們所表達(dá)情感的技術(shù),已成為當(dāng)前自然語言處理的熱點問題,在情感預(yù)測領(lǐng)域具有重大的應(yīng)用前景。針對單分類算法模型的情感分析泛化能力較弱等問題,提出了集成方法的情感分析,泛化能力較好,在情感分析上有很好的適應(yīng)性。本文研究的主要工作圍繞以下兩個方面展開。1.對目前比較流行的開放情感詞典進(jìn)行了分析,構(gòu)建了情感分析中使用的情感詞典,按照情感傾向劃分了詞匯庫。根據(jù)微博短文本數(shù)據(jù)的特點,對數(shù)據(jù)預(yù)處理篩選出研究的語料庫,并基于選取的特征,對語料庫進(jìn)行了向量表示。調(diào)查了情感分析的現(xiàn)有模型和常用的單分類算法模型分析優(yōu)點和不足,并對單分類算法模型進(jìn)行了實驗驗證。2.提出了一種異質(zhì)集成方法的情感分析模型,解決了單分類算法模型在假設(shè)空間的訓(xùn)練集上進(jìn)行學(xué)習(xí)時誤選而導(dǎo)致泛化性能不佳等問題;舅枷胧,首先,利用構(gòu)建好的情感詞典對微博短文本特征進(jìn)行表示和選擇。然后,根據(jù)不同的單分類算法模型特點將模型按照一定的策略進(jìn)行集成,包括兩種方式,一種是將兩種或兩種以上單分類算法模型的實驗結(jié)果采用置信度加權(quán)平均的方法組合情感分析模型,選擇置信度高的子分類器做分類決策;另一種是將分類器的分類結(jié)果和置信度作為更高一層集成分類器的特征的方法組合成情感分析模型。最后,設(shè)計實現(xiàn)輿情情感分析平臺。實驗結(jié)果表明了提出的集成方法對情感分析是有效和可行的。
[Abstract]:Internet social media provides a rapid and convenient environment for people to communicate. Through these social platforms, people can express their views and opinions to the hot spots of public opinion. Affective analysis is a technique to analyze the emotions expressed by people from the viewpoint and view. It has become a hot issue in natural language processing and has a great application prospect in the field of emotion prediction. Aiming at the problem that the generalization ability of emotion analysis of single classification algorithm model is weak, this paper puts forward the integration method of emotion analysis, which has good generalization ability and good adaptability in emotion analysis. The main work of this paper is focused on the following two aspects. 1. The open emotion dictionary which is popular at present is analyzed, the emotion dictionary used in emotion analysis is constructed, and the lexical database is divided according to emotion tendency. According to the characteristics of Weibo short text data, the corpus of the study is screened out by data preprocessing, and based on the selected features, the corpus is represented by vector. The advantages and disadvantages of the existing emotional analysis model and the commonly used single classification algorithm model are investigated, and the experimental verification of the single classification algorithm model is given. An affective analysis model of heterogeneous ensemble method is proposed to solve the problem of poor generalization performance caused by misselection of single classification algorithm model in training set in hypothesis space. The basic idea is: firstly, using the constructed affective dictionary to express and select the features of Weibo short text. Then, according to the characteristics of different single classification algorithm models, the model is integrated according to a certain strategy, including two ways, One is that the experimental results of two or more single classification algorithms are combined with the affective analysis model using the method of confidence weighted average, and the sub-classifier with high confidence level is selected to make classification decision. The other is to combine the classifier classification results with the confidence degree as the feature of a higher level integrated classifier to form an emotional analysis model. Finally, the design and implementation of public opinion emotional analysis platform. The experimental results show that the proposed integration method is effective and feasible for emotional analysis.
【學(xué)位授予單位】:河北地質(zhì)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蘇瑩;張勇;胡珀;涂新輝;;基于樸素貝葉斯與潛在狄利克雷分布相結(jié)合的情感分析[J];計算機(jī)應(yīng)用;2016年06期
2 劉艷梅;;深度學(xué)習(xí)技術(shù)下的中文微博情感的分析與研究[J];軟件;2016年05期
3 高琰;陳白帆;晁緒耀;毛芳;;基于對比散度-受限玻爾茲曼機(jī)深度學(xué)習(xí)的產(chǎn)品評論情感分析[J];計算機(jī)應(yīng)用;2016年04期
4 張慶慶;劉西林;;基于深度信念網(wǎng)絡(luò)的文本情感分類研究[J];西北工業(yè)大學(xué)學(xué)報(社會科學(xué)版);2016年01期
5 寇凱;;基于輿論數(shù)據(jù)的中文情感分析研究[J];無線互聯(lián)科技;2016年01期
6 李景玉;張仰森;蔣玉茹;;基于多特征融合的中文微博評價對象抽取方法[J];計算機(jī)應(yīng)用研究;2016年02期
7 陳永恒;左萬利;林耀進(jìn);;基于主題種子詞的情感分析方法[J];計算機(jī)應(yīng)用;2015年09期
8 王文;王樹鋒;李洪華;;基于文本語義和表情傾向的微博情感分析方法[J];南京理工大學(xué)學(xué)報;2014年06期
9 張林;錢冠群;樊衛(wèi)國;華琨;張莉;;輕型評論的情感分析研究[J];軟件學(xué)報;2014年12期
10 趙煜;邵必林;邊根慶;;一種融合詞序信息的多粒度文本話題情感聯(lián)合模型[J];西安交通大學(xué)學(xué)報;2014年11期
相關(guān)博士學(xué)位論文 前3條
1 李巖;文本情感分析中關(guān)鍵問題的研究[D];北京郵電大學(xué);2014年
2 劉楠;面向微博短文本的情感分析研究[D];武漢大學(xué);2013年
3 崔安頎;微博熱點事件的公眾情感分析研究[D];清華大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 劉政;基于知識元和集成學(xué)習(xí)的中文微博情感分析[D];大連理工大學(xué);2015年
2 高偉;基于半監(jiān)督集成學(xué)習(xí)的情感分類方法研究[D];蘇州大學(xué);2015年
3 婁鑫坡;基于K關(guān)聯(lián)圖的流分類算法及其在微博情感分析中的應(yīng)用[D];鄭州大學(xué);2014年
4 李鈺;微博情感詞典的構(gòu)建及其在微博情感分析中的應(yīng)用研究[D];鄭州大學(xué);2014年
5 楊希;基于情感詞典與規(guī)則結(jié)合的微博情感分析模型研究[D];安徽大學(xué);2014年
6 劉坤林;短文本情感分析[D];上海交通大學(xué);2014年
7 杜振雷;面向微博短文本的情感分析研究[D];北京信息科技大學(xué);2013年
8 張想;面向熱點話題型微博的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
9 李楚楚;評論文本的情感分析研究及其在信用評估中的應(yīng)用[D];首都師范大學(xué);2013年
10 張家紅;集成分類學(xué)習(xí)算法研究[D];山東師范大學(xué);2011年
,本文編號:2086805
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2086805.html