微博情緒分類的關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2017-09-20 17:43
本文關(guān)鍵詞:微博情緒分類的關(guān)鍵技術(shù)研究
【摘要】:近幾年來,隨著網(wǎng)絡(luò)走進(jìn)千家萬戶,越來越多的人從之前的單純從互聯(lián)網(wǎng)中獲取信息,漸漸地轉(zhuǎn)化為利用網(wǎng)絡(luò)發(fā)布與共享信息。這個(gè)過程中,微博,作為當(dāng)今社交網(wǎng)絡(luò)平臺的主力軍之一,在人們?nèi)粘I钪衅鸬降淖饔貌豢尚∮U。微博在吸引大量活躍用戶的同時(shí),微博作為大數(shù)據(jù)的代表,也引起了不少學(xué)者的青睞。新浪微博日均千萬的數(shù)據(jù)量中夾雜著網(wǎng)民對各種話題的各式各樣的情緒。如果合理地對這些數(shù)據(jù)進(jìn)行情感分析與事件主題分析,那么在輿情分析、危機(jī)公關(guān)、互聯(lián)網(wǎng)營銷分析和企業(yè)競爭情報(bào)挖掘等方面都大有裨益。本文旨在對現(xiàn)有情感分類與話題抽取方法進(jìn)行歸納總結(jié),通過大量實(shí)驗(yàn)分析,最終得出一套面向中文微博情緒分類與話題抽取的最優(yōu)算法。為此,本文從如下三個(gè)方面對此任務(wù)做了深入研究。傳統(tǒng)的情感分類方法研究部分,本文借鑒與優(yōu)化了現(xiàn)有優(yōu)秀情感分類算法,對基于詞典規(guī)則的情緒分類、基于機(jī)器學(xué)習(xí)的情緒分類和啟發(fā)式情緒判斷規(guī)則的自動構(gòu)建三方面工作進(jìn)行了調(diào)研與實(shí)驗(yàn)。根據(jù)相關(guān)實(shí)驗(yàn)的分析,證明了該情緒分類算法可以有效提升現(xiàn)有模型在中文微博情緒分類任務(wù)中的分類效果。新興的情感分類技術(shù)的融合方法研究部分,針對當(dāng)前算法存在的分類盲區(qū),本文提出了與主題模型、主動學(xué)習(xí)方法之間的融合的情感分類方法和與詞匯向量化表示、神經(jīng)網(wǎng)絡(luò)模型融合的情感分類算法,最終通過均衡分類效果與分類效率,選擇性地將相關(guān)方法融入到了現(xiàn)有的情緒分類系統(tǒng)中。微博事件情感分布的原因分析的研究部分,本文從真實(shí)實(shí)驗(yàn)場景中存在的情緒分布不同的現(xiàn)象引入問題,針對性地提出了一套關(guān)鍵話題自動挖掘算法和半監(jiān)督的微博話題糾正算法,實(shí)現(xiàn)了聚類算法與分類算法的互補(bǔ),充分挖掘了話題對應(yīng)的微博及情緒信息。最終,本文通過對海量、實(shí)時(shí)的新浪微博進(jìn)行基于社會熱點(diǎn)事件的情緒分類,最終搭建了“網(wǎng)民情緒監(jiān)控”和“社會熱點(diǎn)事件追蹤”平臺——微博情緒指數(shù)系統(tǒng)。本平臺自上線以來,穩(wěn)定運(yùn)行的同時(shí),其展示效果也廣受好評。
【關(guān)鍵詞】:中文微博 情緒分類 話題抽取
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-26
- 1.1 課題來源10-11
- 1.2 研究目的和意義11-13
- 1.3 國內(nèi)外相關(guān)研究13-23
- 1.3.1 情感分類概念簡介13-14
- 1.3.2 傳統(tǒng)的情感分類方法14-17
- 1.3.3 新興的情感分類方法17-21
- 1.3.4 面向微博的話題抽取21-23
- 1.4 本文研究內(nèi)容23-26
- 1.4.1 傳統(tǒng)的情感分類方法研究24
- 1.4.2 新興的情感分類技術(shù)的融合24
- 1.4.3 微博事件情感分布的原因分析24-25
- 1.4.4 微博情緒指數(shù)系統(tǒng)展示25-26
- 第2章 傳統(tǒng)的情感分類方法研究26-36
- 2.1 引言26
- 2.2 無監(jiān)督的基于詞典規(guī)則的情緒分類26-28
- 2.2.1 詞典資源收集26-28
- 2.2.2 算法流程設(shè)計(jì)28
- 2.3 有監(jiān)督的基于特征抽取的情緒分類28-30
- 2.3.1 特征模板設(shè)計(jì)29
- 2.3.2 特征工程建設(shè)29-30
- 2.4 啟發(fā)式情緒判斷規(guī)則的自動構(gòu)建30-32
- 2.4.1 算法設(shè)計(jì)31-32
- 2.4.2 構(gòu)建結(jié)果舉例32
- 2.5 實(shí)驗(yàn)語料32-33
- 2.6 評價(jià)指標(biāo)33-34
- 2.7 實(shí)驗(yàn)結(jié)果34
- 2.8 本章小結(jié)34-36
- 第3章 新興的情感分類技術(shù)的融合36-49
- 3.1 引言36-37
- 3.2 與主題模型之間的融合37-39
- 3.2.1 算法設(shè)計(jì)37-38
- 3.2.2 實(shí)驗(yàn)結(jié)果及分析38-39
- 3.3 與主動學(xué)習(xí)方法之間的融合39-40
- 3.3.1 算法設(shè)計(jì)39-40
- 3.4 與詞匯向量化表示之間的融合40-44
- 3.4.1 算法介紹41-42
- 3.4.2 詞向量訓(xùn)練42-43
- 3.4.3 實(shí)驗(yàn)結(jié)果43-44
- 3.5 與神經(jīng)網(wǎng)絡(luò)模型之間的融合44-47
- 3.5.1 算法介紹44-46
- 3.5.2 模型調(diào)優(yōu)46
- 3.5.3 實(shí)驗(yàn)設(shè)置46-47
- 3.5.4 實(shí)驗(yàn)結(jié)果47
- 3.6 本章小結(jié)47-49
- 第4章 微博事件情感分布的原因分析49-59
- 4.1 引言49-50
- 4.2 算法設(shè)計(jì)50
- 4.3 微博關(guān)鍵話題挖掘算法50-54
- 4.3.1 問題分析50-51
- 4.3.2 事件話題的聚類算法設(shè)計(jì)51-52
- 4.3.3 事件話題熱度排序算法設(shè)計(jì)52
- 4.3.4 實(shí)驗(yàn)數(shù)據(jù)52-53
- 4.3.5 評價(jià)方法53
- 4.3.6 實(shí)驗(yàn)結(jié)果與分析53-54
- 4.4 微博話題糾正算法54-57
- 4.4.1 問題分析54
- 4.4.2 算法設(shè)計(jì)54-56
- 4.4.3 評價(jià)方法56
- 4.4.4 實(shí)驗(yàn)結(jié)果與分析56-57
- 4.5 情感分布的原因分析57-58
- 4.6 本章小結(jié)58-59
- 第5章 微博情緒指數(shù)系統(tǒng)59-64
- 5.1 系統(tǒng)整體架構(gòu)與功能介紹59-61
- 5.2 微博情緒分類模塊設(shè)計(jì)61-62
- 5.3 微博熱點(diǎn)事件話題分析模塊設(shè)計(jì)62-63
- 5.4 本章小結(jié)63-64
- 結(jié)論64-66
- 參考文獻(xiàn)66-73
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文73-75
- 致謝75-76
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭飛飛;王小華;諶志群;王榮波;;基于回應(yīng)消息的中文微博情感分類方法[J];杭州電子科技大學(xué)學(xué)報(bào);2013年06期
2 李赫元;俞曉明;劉悅;程學(xué)旗;程工;;中文微博客的垃圾用戶檢測[J];中文信息學(xué)報(bào);2014年03期
3 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報(bào);2012年06期
4 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術(shù)師范學(xué)院學(xué)報(bào);2014年03期
5 肖s,
本文編號:889488
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/889488.html
最近更新
教材專著