基于微博的情感分析算法研究與實現(xiàn)
發(fā)布時間:2017-04-10 12:15
本文關(guān)鍵詞:基于微博的情感分析算法研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,隨著微博的快速發(fā)展,微博數(shù)據(jù)成倍增長,如何利用這些海量的數(shù)據(jù),挖掘有用的信息,成為了研究熱點。其中,微博情感分類是一個比較熱門的研究方向,它在分析與預(yù)測時事走向、反饋商品和產(chǎn)品意見、分析消費者喜好、政府網(wǎng)絡(luò)輿情監(jiān)控等方面都有廣泛的應(yīng)用。微博情感分類研究分為以下三個方面:基于情感詞典的分類、基于機器學(xué)習的分類和基于特征融合的分類。由于微博信息量少、格式不規(guī)范、語言風格多變、含有大量的噪音等原因,微博情感分類研究的效果不理想。針對這一情況,本文結(jié)合了現(xiàn)有的情感分類算法,針對微博信息的特點,設(shè)計并實現(xiàn)了三種微博情感分類方案,提高微博情感分類的效果。本文主要貢獻包括:1、設(shè)計了基于情感計算的情感分類算法。該算法的基礎(chǔ)是情感詞典,目標是包含有很明顯的正、負情感詞的微博。在傳統(tǒng)以單個情感詞典為核心的情感分類的基礎(chǔ)上,該算法結(jié)合了四個常用的情感詞典,從多個維度描述微博,通過計算微博包含的情感詞的情感傾向,計算微博的情感傾向,從而判斷微博的情感分類。2、設(shè)計了基于分類器融合的情感分類算法。該算法的基礎(chǔ)是機器學(xué)習,它適合大量數(shù)據(jù)處理。該算法詳細的分析了基于機器學(xué)習的情感分類方法,結(jié)合了三個常用的分類算法,提取三個不同分類器的預(yù)測標簽和預(yù)測得分,根據(jù)融合分類器,預(yù)測微博的分類標簽。3、設(shè)計了基于特征融合的情感分類算法。該算法把人類情感分析和機器學(xué)習方法相結(jié)合,先分析微博本身特有的特點,并且根據(jù)人類情感的表達方式,選取了四組特征;然后,選用了客觀的統(tǒng)計特征;最后,把兩方面特征融合,用SVM訓(xùn)練模型,預(yù)測微博的情感分類。通過實驗證明了本文設(shè)計的方法可以有效的提高微博情感分類的能力。
【關(guān)鍵詞】:情感分類 情感計算 機器學(xué)習 特征融合 情感詞典
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1;TP393.092
【目錄】:
- 摘要6-7
- Abstract7-11
- 第1章 緒論11-15
- 1.1 課題的研究背景和意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.3 本文的主要內(nèi)容和結(jié)構(gòu)安排14-15
- 第2章 相關(guān)技術(shù)和資源15-20
- 2.1 預(yù)處理技術(shù)15-16
- 2.2 微博文本表示16-17
- 2.3 情感資源介紹17-18
- 2.4 情感分類評估方法18-19
- 2.5 本章小結(jié)19-20
- 第3章 基于情感詞典的情感分類20-30
- 3.1 基于情感詞典的情感分類20-21
- 3.1.1 微博的情感分類介紹20
- 3.1.2 基于情感詞典的情感分類算法20-21
- 3.2 基于情感計算的情感分類算法21-23
- 3.2.1 情感詞的權(quán)重21-22
- 3.2.2 情感傾向性計算22
- 3.2.3 算法描述22-23
- 3.3 實驗設(shè)計與結(jié)果分析23-29
- 3.3.1 實驗數(shù)據(jù)23-24
- 3.3.2 SCAAC算法性能分析24-27
- 3.3.3 SCAAC算法實驗結(jié)果與分析27-29
- 3.4 本章小結(jié)29-30
- 第4章 基于分類器融合的情感分類30-43
- 4.1 特征選擇30-33
- 4.1.1 互信息(MI,Mutual Information)30
- 4.1.2 卡方檢驗(Chi-square)30-32
- 4.1.3 信息增益(IG,Information Gain)32-33
- 4.2 基于分類器融合的情感分類算法設(shè)計33-39
- 4.2.1 樸素貝葉斯情感分類33-34
- 4.2.2 SVM情感分類34-36
- 4.2.3 KNN情感分類36-37
- 4.2.4 分類器融合的情感分類算法原理37-39
- 4.3 實驗39-42
- 4.3.1 SCACF算法性能分析39-41
- 4.3.2 SCACF算法實驗結(jié)果分析41-42
- 4.4 本章小結(jié)42-43
- 第5章 基于特征融合的情感分類43-59
- 5.1 微博特征對情感分類的影響43-51
- 5.1.1 詞性特征對微博情感分類的影響43-45
- 5.1.2 表情符號對微博情感分類的影響45-47
- 5.1.3 語法關(guān)系對微博情感分類的影響47-51
- 5.2 基于特征融合的情感分類算法51-54
- 5.2.1 特征選擇和融合51-52
- 5.2.2 基于特征融合情感分類實現(xiàn)52-54
- 5.3 實驗結(jié)果與分析54-58
- 5.3.1 SCAFF算法性能分析54-56
- 5.3.2 SCAFF算法實驗結(jié)果分析56-58
- 5.4 本章小結(jié)58-59
- 結(jié)論59-60
- 致謝60-61
- 參考文獻61-65
- 攻讀碩士學(xué)位期間發(fā)表的論文及科研成果65
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期
本文關(guān)鍵詞:基于微博的情感分析算法研究與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號:296697
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/296697.html
最近更新
教材專著