微博情緒分類的關鍵技術研究
發(fā)布時間:2017-09-20 17:43
本文關鍵詞:微博情緒分類的關鍵技術研究
【摘要】:近幾年來,隨著網(wǎng)絡走進千家萬戶,越來越多的人從之前的單純從互聯(lián)網(wǎng)中獲取信息,漸漸地轉(zhuǎn)化為利用網(wǎng)絡發(fā)布與共享信息。這個過程中,微博,作為當今社交網(wǎng)絡平臺的主力軍之一,在人們?nèi)粘I钪衅鸬降淖饔貌豢尚∮U。微博在吸引大量活躍用戶的同時,微博作為大數(shù)據(jù)的代表,也引起了不少學者的青睞。新浪微博日均千萬的數(shù)據(jù)量中夾雜著網(wǎng)民對各種話題的各式各樣的情緒。如果合理地對這些數(shù)據(jù)進行情感分析與事件主題分析,那么在輿情分析、危機公關、互聯(lián)網(wǎng)營銷分析和企業(yè)競爭情報挖掘等方面都大有裨益。本文旨在對現(xiàn)有情感分類與話題抽取方法進行歸納總結,通過大量實驗分析,最終得出一套面向中文微博情緒分類與話題抽取的最優(yōu)算法。為此,本文從如下三個方面對此任務做了深入研究。傳統(tǒng)的情感分類方法研究部分,本文借鑒與優(yōu)化了現(xiàn)有優(yōu)秀情感分類算法,對基于詞典規(guī)則的情緒分類、基于機器學習的情緒分類和啟發(fā)式情緒判斷規(guī)則的自動構建三方面工作進行了調(diào)研與實驗。根據(jù)相關實驗的分析,證明了該情緒分類算法可以有效提升現(xiàn)有模型在中文微博情緒分類任務中的分類效果。新興的情感分類技術的融合方法研究部分,針對當前算法存在的分類盲區(qū),本文提出了與主題模型、主動學習方法之間的融合的情感分類方法和與詞匯向量化表示、神經(jīng)網(wǎng)絡模型融合的情感分類算法,最終通過均衡分類效果與分類效率,選擇性地將相關方法融入到了現(xiàn)有的情緒分類系統(tǒng)中。微博事件情感分布的原因分析的研究部分,本文從真實實驗場景中存在的情緒分布不同的現(xiàn)象引入問題,針對性地提出了一套關鍵話題自動挖掘算法和半監(jiān)督的微博話題糾正算法,實現(xiàn)了聚類算法與分類算法的互補,充分挖掘了話題對應的微博及情緒信息。最終,本文通過對海量、實時的新浪微博進行基于社會熱點事件的情緒分類,最終搭建了“網(wǎng)民情緒監(jiān)控”和“社會熱點事件追蹤”平臺——微博情緒指數(shù)系統(tǒng)。本平臺自上線以來,穩(wěn)定運行的同時,其展示效果也廣受好評。
【關鍵詞】:中文微博 情緒分類 話題抽取
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-26
- 1.1 課題來源10-11
- 1.2 研究目的和意義11-13
- 1.3 國內(nèi)外相關研究13-23
- 1.3.1 情感分類概念簡介13-14
- 1.3.2 傳統(tǒng)的情感分類方法14-17
- 1.3.3 新興的情感分類方法17-21
- 1.3.4 面向微博的話題抽取21-23
- 1.4 本文研究內(nèi)容23-26
- 1.4.1 傳統(tǒng)的情感分類方法研究24
- 1.4.2 新興的情感分類技術的融合24
- 1.4.3 微博事件情感分布的原因分析24-25
- 1.4.4 微博情緒指數(shù)系統(tǒng)展示25-26
- 第2章 傳統(tǒng)的情感分類方法研究26-36
- 2.1 引言26
- 2.2 無監(jiān)督的基于詞典規(guī)則的情緒分類26-28
- 2.2.1 詞典資源收集26-28
- 2.2.2 算法流程設計28
- 2.3 有監(jiān)督的基于特征抽取的情緒分類28-30
- 2.3.1 特征模板設計29
- 2.3.2 特征工程建設29-30
- 2.4 啟發(fā)式情緒判斷規(guī)則的自動構建30-32
- 2.4.1 算法設計31-32
- 2.4.2 構建結果舉例32
- 2.5 實驗語料32-33
- 2.6 評價指標33-34
- 2.7 實驗結果34
- 2.8 本章小結34-36
- 第3章 新興的情感分類技術的融合36-49
- 3.1 引言36-37
- 3.2 與主題模型之間的融合37-39
- 3.2.1 算法設計37-38
- 3.2.2 實驗結果及分析38-39
- 3.3 與主動學習方法之間的融合39-40
- 3.3.1 算法設計39-40
- 3.4 與詞匯向量化表示之間的融合40-44
- 3.4.1 算法介紹41-42
- 3.4.2 詞向量訓練42-43
- 3.4.3 實驗結果43-44
- 3.5 與神經(jīng)網(wǎng)絡模型之間的融合44-47
- 3.5.1 算法介紹44-46
- 3.5.2 模型調(diào)優(yōu)46
- 3.5.3 實驗設置46-47
- 3.5.4 實驗結果47
- 3.6 本章小結47-49
- 第4章 微博事件情感分布的原因分析49-59
- 4.1 引言49-50
- 4.2 算法設計50
- 4.3 微博關鍵話題挖掘算法50-54
- 4.3.1 問題分析50-51
- 4.3.2 事件話題的聚類算法設計51-52
- 4.3.3 事件話題熱度排序算法設計52
- 4.3.4 實驗數(shù)據(jù)52-53
- 4.3.5 評價方法53
- 4.3.6 實驗結果與分析53-54
- 4.4 微博話題糾正算法54-57
- 4.4.1 問題分析54
- 4.4.2 算法設計54-56
- 4.4.3 評價方法56
- 4.4.4 實驗結果與分析56-57
- 4.5 情感分布的原因分析57-58
- 4.6 本章小結58-59
- 第5章 微博情緒指數(shù)系統(tǒng)59-64
- 5.1 系統(tǒng)整體架構與功能介紹59-61
- 5.2 微博情緒分類模塊設計61-62
- 5.3 微博熱點事件話題分析模塊設計62-63
- 5.4 本章小結63-64
- 結論64-66
- 參考文獻66-73
- 攻讀學位期間發(fā)表的學術論文73-75
- 致謝75-76
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭飛飛;王小華;諶志群;王榮波;;基于回應消息的中文微博情感分類方法[J];杭州電子科技大學學報;2013年06期
2 李赫元;俞曉明;劉悅;程學旗;程工;;中文微博客的垃圾用戶檢測[J];中文信息學報;2014年03期
3 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學報;2012年06期
4 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術師范學院學報;2014年03期
5 肖s,
本文編號:889488
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/889488.html
最近更新
教材專著