面向話題型微博的熱點事件情感分析研究
本文關(guān)鍵詞:面向話題型微博的熱點事件情感分析研究
更多相關(guān)文章: 熱點事件話題微博 情感分析 評價對象抽取 情感詞典
【摘要】:隨著國內(nèi)微博的快速發(fā)展,國內(nèi)輿論幾乎都在微博形成熱點并引起廣泛的討論和強烈的反響,微博已經(jīng)逐漸成為了一個重要的實時信息源和輿論傳播中心。在熱點事件發(fā)生之后,人們往往通過微博第一時間獲取事件信息,并在微博上參與討論,從而產(chǎn)生一些熱門話題,對話題下的用戶所發(fā)表的相關(guān)微博的信息進行挖掘和分析,可以幫助我們探究事件發(fā)生后群眾的情感和關(guān)注變化,這對政府掌握和監(jiān)控突發(fā)事件后的社會公眾心理變化情況有著非常重要的意義。為了獲取微博熱點話題事件的輿情演化情況,本文針對新浪微博熱門事件話題“女司機慘遭男司機暴打”中的評論文本進行情感分析和輿情追蹤,基于情感詞典和CRF模型多特征組合的方法進行話題型微博情感極性分類,對比不同特征組合下,情感極性分類的效果。基于規(guī)則和句法依存分析相結(jié)合的方法挖掘熱點話題下微博評價對象。針對抽取的評價對象存在含義相似、形式不同的問題,本文還進行了聚類研究,從而挖掘出用戶對熱點事件的多個關(guān)注點,呈現(xiàn)出更好的微博關(guān)注點分布,最終實現(xiàn)對熱門話題微博的輿情演化分析。主要研究包括以下幾個方面:(1)對微博文本區(qū)別于傳統(tǒng)文本的特點進行了研究,分析幾種后期研究可能使用的微博文本特征,并介紹了微博情感分類相關(guān)技術(shù)、目前情感分析的研究現(xiàn)狀,以及情感分析相關(guān)的國內(nèi)外評測會議。(2)構(gòu)造了中文微博情感詞典,以知網(wǎng)情感詞典、臺灣大學情感詞典和大連理工情感詞匯本體為基礎(chǔ)構(gòu)造情感詞典,并對基礎(chǔ)情感詞典進行基于《同義詞詞林擴展版》的同義詞擴展。另外,還對情感詞典進行網(wǎng)絡(luò)新詞、表情符號、程度副詞以及連詞的擴展。(3)以構(gòu)建的情感詞典為基礎(chǔ),本文采用基于CRF模型多特征組合的情感分析方法對話題型微博進行情感極性分類,選用四種文本特征,包括詞、詞性、情感詞極性和否定詞,并采取不同的特征組合,通過多組實驗進行對比,獲得使情感分類效果最優(yōu)的特征組合。(4)微博熱點事件話題下,不同用戶往往對同一事件有著不同的關(guān)注點和不同的評價對象,因此本文進行了如何抽取話題類微博的評價對象的相關(guān)研究。通過分析發(fā)現(xiàn)熱點話題下的微博評價對象多為名詞、名詞短語以及微博的話題標簽,因此本文將潛在評價對象限定為名詞或名詞短語,首先基于漢語名詞短語的定義抽取潛在評價對象。之后采用了基于規(guī)則和句法依存分析相結(jié)合的方法提取情感詞,評價對象二元關(guān)系詞對過濾潛在評價對象,抽取實際評價對象。針對評價對象抽取結(jié)果表達形式多樣的問題,本文基于聚類對評價對象進行合并,提煉出話題的評價角度,從而挖掘出用戶對熱點事件的多個關(guān)注點,呈現(xiàn)出更好的微博關(guān)注點分布。同時針對這些關(guān)注點進行情感追蹤,了解輿論情感的變化情況。(5)本文采用的實驗數(shù)據(jù)集為新浪微博熱門話題“女司機慘遭男司機暴打”下的微博評論,是通過新浪API爬取的連續(xù)5天的微博數(shù)據(jù)。
【關(guān)鍵詞】:熱點事件話題微博 情感分析 評價對象抽取 情感詞典
【學位授予單位】:安徽大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要3-5
- Abstract5-9
- 第一章 緒論9-16
- 1.1 研究背景與意義9-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.2.1 基于情感詞典的情感分類12-13
- 1.2.2 基于機器學習的情感分類13
- 1.2.3 微博短文本情感分類的研究現(xiàn)狀13-14
- 1.3 本文的主要研究內(nèi)容和章節(jié)安排14-16
- 1.3.1 本文的主要研究內(nèi)容14-15
- 1.3.2 論文章節(jié)安排15-16
- 第二章 微博文本特點及情感分類基礎(chǔ)研究16-26
- 2.1 微博文本特性概述16-17
- 2.2 微博文本的特征分析17-19
- 2.3 文本情感分類基礎(chǔ)研究19-25
- 2.3.1 文本分詞19-20
- 2.3.2 文本表示技術(shù)20-21
- 2.3.3 特征選擇21-23
- 2.3.4 文本情感分類器23-25
- 2.4 本章小結(jié)25-26
- 第三章 中文微博情感分析研究概述26-31
- 3.1 情感分析的研究任務(wù)26-28
- 3.1.1 微博的主客觀分類26
- 3.1.2 微博的情感傾向分析26-28
- 3.2 常用的情感分析方法28-29
- 3.2.1 基于情感詞典的方法28
- 3.2.2 基于機器學習的方法28-29
- 3.2.3 基于語義規(guī)則的方法29
- 3.3 情感分析的相關(guān)評測29-30
- 3.4 本章小結(jié)30-31
- 第四章 基于情感詞典和CRF多特征組合的話題微博情感分析31-43
- 4.1 構(gòu)建中文微博情感詞典31-36
- 4.1.1 基礎(chǔ)情感詞典31-32
- 4.1.2 基于《同義詞詞林擴展版》的情感詞擴展32-33
- 4.1.3 微博表情符號擴展33
- 4.1.4 網(wǎng)絡(luò)新詞擴展33-34
- 4.1.5 領(lǐng)域詞典34
- 4.1.6 程度副詞詞典34-35
- 4.1.7 否定詞詞典35
- 4.1.8 轉(zhuǎn)折連詞詞典35-36
- 4.2 基于CRF多特征組合的情感極性分類36-39
- 4.2.1 CRF模型基本原理36-37
- 4.2.2 特征選擇37-38
- 4.2.3 特征模板38-39
- 4.3 實驗與分析39-42
- 4.3.1 實驗數(shù)據(jù)與實驗設(shè)置39-40
- 4.3.2 評估指標40
- 4.3.3 實驗結(jié)果分析40-42
- 4.4 本章小結(jié)42-43
- 第五章 微博熱點話題事件的公眾輿情分析43-61
- 5.1 引言43
- 5.2 熱點事件話題微博評價對象的抽取43-51
- 5.2.1 抽取潛在情感評價對象45-46
- 5.2.2 基于規(guī)則和句法關(guān)系二元組提取實際評價對象46-49
- 5.2.3 實驗數(shù)據(jù)49
- 5.2.4 實驗結(jié)果49-51
- 5.3 基于聚類的熱點事件話題微博評價對象歸并51-57
- 5.3.1 詞語相似度計算52-54
- 5.3.2 評價對象的聚類研究54-55
- 5.3.3 實驗設(shè)置55-56
- 5.3.4 實驗結(jié)果對比分析56-57
- 5.4 評價對象情感趨勢分析57-60
- 5.5 本章小結(jié)60-61
- 第六章 總結(jié)與展望61-63
- 6.1 本文總結(jié)61-62
- 6.3 工作展望62-63
- 參考文獻63-68
- 致謝68
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 袁媛;;情感分析研究綜述[J];信息與電腦(理論版);2015年21期
2 何炎祥;牛菲菲;方文其;陳強;孫松濤;;基于詞性組合規(guī)則改進的中文句子極性判斷方法[J];計算機應(yīng)用與軟件;2015年03期
3 張盛;李芳;;基于迭代兩步CRF模型的評價對象與極性抽取研究[J];中文信息學報;2015年01期
4 李婷婷;姬東鴻;;基于SVM和CRF多特征組合的微博情感分析[J];計算機應(yīng)用研究;2015年04期
5 潘艷茜;姚天f ;;微博汽車領(lǐng)域中用戶觀點句識別方法的研究[J];中文信息學報;2014年05期
6 王昊;楊亮;林鴻飛;;日本地震的微博熱點事件分析[J];中文信息學報;2012年05期
7 龐磊;李壽山;周國棟;;基于情緒知識的中文微博情感分類方法[J];計算機工程;2012年13期
8 宋雙永;李秋丹;路冬媛;;面向微博客的熱點事件情感分析方法[J];計算機科學;2012年S1期
9 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學報;2012年01期
10 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計算方法[J];吉林大學學報(信息科學版);2010年06期
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 劉楠;面向微博短文本的情感分析研究[D];武漢大學;2013年
2 崔安頎;微博熱點事件的公眾情感分析研究[D];清華大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 沈磊;基于規(guī)則與機器學習方法的中文微博情感分析研究[D];安徽大學;2015年
2 張想;面向熱點話題型微博的情感分析研究[D];哈爾濱工業(yè)大學;2013年
3 徐帥;基于中文微博的情感分析研究[D];華中科技大學;2013年
4 朱洪;面向互聯(lián)網(wǎng)中文輿情信息的情感傾向分析[D];國防科學技術(shù)大學;2011年
,本文編號:878900
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/878900.html