天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向中文微博文本的情感極性判別方法研究

發(fā)布時間:2018-06-01 06:34

  本文選題:微博 + 情感分析; 參考:《中國民航大學》2017年碩士論文


【摘要】:微博是一個分享實時短信息的社交媒體,為網(wǎng)民提供了一個溝通思想,交流看法的平臺。用戶既可以作為一個觀眾來瀏覽感興趣的話題信息,也可以作為一個內(nèi)容發(fā)布者提供內(nèi)容供其他人瀏覽。這種新的社交形式已經(jīng)被大眾廣泛接受,在近十年中取得了用戶數(shù)量和信息量的爆發(fā)式增長。微博文本涉及到的話題廣泛,為情感分析研究提供了豐富的語料素材。情感極性判別是情感分析的一種具體任務,通過對帶有情感色彩的文本進行處理、分析,從而判斷它的情感是屬于積極的還是消極的。對微博進行情感極性判別的目的在于識別出微博中的主觀信息,從而挖掘出用戶對熱點話題、新聞事件和產(chǎn)品服務等評價對象的觀點和態(tài)度,從而實現(xiàn)輿情監(jiān)控、市場營銷等目的。本文選取包含民航輿情關(guān)鍵詞的微博進行情感極性判別研究,分別給出了基于情感詞和語義規(guī)則、基于Adaboost和分類器加權(quán)投票的兩種方法。第一種方法結(jié)合現(xiàn)有情感詞典和語義相似度計算來提取情感詞,避免了情感詞典中詞語不全而導致情感詞遺漏的情況,然后利用句內(nèi)規(guī)則和句間規(guī)則計算出微博文本情感得分,與微博表情符號得分做加權(quán)求和,得到最終情感極性分值,從而判斷微博的情感極性。第二種方法基于機器學習判別情感極性,利用Adaboost集成學習對效果較差的單一分類器進行提升后,將三種分類器進行加權(quán)投票組合,得到最終分類器對測試微博文本進行分類。本文所使用的微博語料是利用微博爬蟲抓取的,對其情感極性進行人工標注后用于實驗,實驗結(jié)果表明:兩種方法在情感極性分類的準確度上均取得了較好的效果,第一種方法不依賴于領(lǐng)域知識,對微博內(nèi)容的普適性較強;第二種方法使弱分類器的性能得到提高,結(jié)合了不同分類器的優(yōu)勢,克服了單一分類器的缺陷。
[Abstract]:Weibo is a social media that shares real-time short messages and provides a platform for Internet users to communicate ideas and ideas. Users can view topics of interest either as an audience member or as a content publisher for others to browse. This new form of social networking has been widely accepted, in the past decade has achieved explosive growth in the number of users and information. Weibo texts cover a wide range of topics and provide rich corpus material for affective analysis. Emotion polarity discrimination is a kind of concrete task of emotion analysis. By processing and analyzing the text with emotion color, we can judge whether its emotion is positive or negative. The purpose of judging the emotional polarity of Weibo is to identify the subjective information in the Weibo, so as to excavate the opinions and attitudes of the users on the hot topics, news events and products and services, so as to realize the monitoring of public opinion. Marketing, etc. In this paper, we select the Weibo which contains the key words of civil aviation public opinion to study the emotional polarity, and give two methods based on emotional words and semantic rules, Adaboost and classifier weighted voting. The first method combines the existing emotion dictionary and semantic similarity calculation to extract the emotion words, which avoids the omission of the words in the emotion dictionary, and then calculates the emotional score of the Weibo text by using intra-sentence rules and inter-sentence rules. The final emotional polarity score was obtained by weighted summation with the Weibo emoji score, and then the emotional polarity of Weibo was judged. The second method is based on machine learning to distinguish emotional polarity. After using Adaboost ensemble learning to improve a single classifier with poor effect, the three classifiers are weighted to vote together, and the final classifier is obtained to classify the test Weibo text. The Weibo corpus used in this paper is captured by Weibo crawler, and the affective polarity is labeled manually for experiment. The experimental results show that the two methods have achieved good results in the classification accuracy of affective polarity. The first method does not rely on domain knowledge and has a strong universality for Weibo content. The second method improves the performance of weak classifier and combines the advantages of different classifiers to overcome the shortcomings of single classifier.
【學位授予單位】:中國民航大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1;TP393.092

【相似文獻】

相關(guān)期刊論文 前10條

1 郭紅玲;程顯毅;;多分類器選擇集成方法[J];計算機工程與應用;2009年13期

2 呂岳,施鵬飛,趙宇明;多分類器組合的投票表決規(guī)則[J];上海交通大學學報;2000年05期

3 韓宏;楊靜宇;;多分類器組合及其應用[J];計算機科學;2000年01期

4 陳剛,戚飛虎;多分類器結(jié)合的人臉識別[J];上海交通大學學報;2001年02期

5 韓宏,楊靜宇,婁震;基于層次的分類器組合[J];南京理工大學學報(自然科學版);2002年01期

6 趙誼虹,程國華,史習智;多分類器融合中一種新的加權(quán)算法[J];上海交通大學學報;2002年06期

7 王正群,葉暉,孫興華,楊靜宇;模糊多分類器組合[J];小型微型計算機系統(tǒng);2003年01期

8 楊利英,覃征,王向華;多分類器融合實現(xiàn)機型識別[J];計算機工程與應用;2004年15期

9 楊利英,覃征,王衛(wèi)紅;多分類器融合系統(tǒng)設(shè)計與應用[J];計算機工程;2005年05期

10 陳湘;;1-范數(shù)軟間隔分類器的風險[J];湖北大學學報(自然科學版);2006年02期

相關(guān)會議論文 前10條

1 王占一;徐蔚然;劉東鑫;郭軍;;一種基于兩級分類器的垃圾短信過濾方法[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年

2 翟靜;李海宏;唐常杰;陳敏敏;李智;;可驗證對象集分類器的再訓練演進[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2002年

3 陳繼航;劉家鋒;趙巍;唐降龍;;聯(lián)機手寫識別筆段特征分類器的學習方法[A];黑龍江省計算機學會2009年學術(shù)交流年會論文集[C];2010年

4 穆明生;;基于特征集的多種分類器模型的在線筆跡認證[A];第十屆全國信號處理學術(shù)年會(CCSP-2001)論文集[C];2001年

5 彭濤;左萬利;赫楓齡;;基于鏈接上下文的分類器主題爬行技術(shù)(英文)[A];第二十三屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2006年

6 王嵐;陳珂;遲惠生;;基于多特征組合多分類器的方法用于“與文本無關(guān)”的說話人辨認[A];第四屆全國人機語音通訊學術(shù)會議論文集[C];1996年

7 謝秋玲;;應用于心電圖分類的KNN-SVM分類器研究[A];2006中國控制與決策學術(shù)年會論文集[C];2006年

8 胡瓊;汪榮貴;胡韋偉;孫見青;;基于級聯(lián)分類器的快速人臉檢測方法[A];計算機技術(shù)與應用進展·2007——全國第18屆計算機技術(shù)與應用(CACIS)學術(shù)會議論文集[C];2007年

9 李蘭春;王雙成;杜瑞杰;;認知結(jié)構(gòu)評估的動態(tài)貝葉斯網(wǎng)絡(luò)分類器方法[A];2011年中國智能自動化學術(shù)會議論文集(第一分冊)[C];2011年

10 邵小健;段華;賀國平;;一種改進的最少核分類器[A];中國運籌學會第七屆學術(shù)交流會論文集(上卷)[C];2004年

相關(guān)重要報紙文章 前1條

1 黃明;精子分類器決定生男生女[N];廣東科技報;2000年

相關(guān)博士學位論文 前10條

1 張非;對抗逃避攻擊的防守策略研究[D];華南理工大學;2015年

2 張文博;多類別智能分類器方法研究[D];西安電子科技大學;2014年

3 許勁松;智能交通中目標檢測與分類關(guān)鍵技術(shù)研究[D];南京理工大學;2014年

4 趙作林;基于圖像分析的北京地區(qū)楊樹種類識別研究[D];北京林業(yè)大學;2015年

5 任亞峰;基于標注和未標注數(shù)椐的虛假評論識別研究[D];武漢大學;2015年

6 曹鵬;不均衡數(shù)據(jù)分類方法的研究[D];東北大學;2014年

7 劉明;分類器組合技術(shù)研究及其在人機交互系統(tǒng)中的應用[D];北京交通大學;2008年

8 嚴志永;在劃分數(shù)據(jù)空間的視角下基于決策邊界的分類器研究[D];浙江大學;2011年

9 王U,

本文編號:1963207


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1963207.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f8b8a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com