基于內(nèi)容挖掘的話題微博情感分析研究
發(fā)布時(shí)間:2017-04-19 21:14
本文關(guān)鍵詞:基于內(nèi)容挖掘的話題微博情感分析研究,由筆耕文化傳播整理發(fā)布。
【摘要】:微博作為新興的社交網(wǎng)絡(luò)媒體,憑借其發(fā)布的便捷性、閱讀的及時(shí)性,成為了人們獲取信息與對(duì)外交流的主要媒介。微博含有多個(gè)話題,其中包含了許多有價(jià)值的信息。對(duì)這些話題微博進(jìn)行情感分析,可以進(jìn)行輔助政府進(jìn)行網(wǎng)絡(luò)輿情監(jiān)控,可以給企業(yè)提供產(chǎn)品改進(jìn)建議、幫助其維護(hù)客戶關(guān)系、微博營銷與危機(jī)應(yīng)對(duì)等等。因此話題微博的情感分析逐漸成為了研究新熱點(diǎn)。話題微博情感分析一般包括三個(gè)任務(wù):一為主客觀微博識(shí)別;二為微博情感傾向性分析;三為評(píng)價(jià)對(duì)象抽取。但在實(shí)際研究中,課題組發(fā)現(xiàn)話題微博的情緒研究可以更為準(zhǔn)確地表達(dá)用戶的情感,因此本文主要針對(duì)話題微博的主客觀識(shí)別、情感傾向性分析和情緒分析三個(gè)任務(wù)進(jìn)行深入研究。在主客觀微博識(shí)別任務(wù)中,本文首先對(duì)主客觀微博定義進(jìn)行了詳細(xì)描述,提出了基于SVM模型的主客觀微博識(shí)別的方法,在深入分析語料的基礎(chǔ)上,嘗試從句式、句法以及隱性結(jié)構(gòu)三個(gè)方面選擇特征來表示微博;之后使用NLPCC 2012提供的評(píng)測語料進(jìn)行SVM模型的訓(xùn)練與測試,得到主客觀微博識(shí)別的準(zhǔn)確率達(dá)到87%以上,召回率達(dá)到79%以上;并在特征選擇相同的情況下,本文提出的方法的結(jié)果優(yōu)于CRFs模型,驗(yàn)證了本文提出方法的有效性和優(yōu)越性。在話題微博的情感傾向性分析任務(wù)中,本文首先提出了基于SVM模型的微博情感傾向性分析方法,并嘗試將情感特征、句內(nèi)特征和句間特征結(jié)合起來表示微博,之后將提出的方法應(yīng)用到COAE2014評(píng)測任務(wù)中文微博情感傾向性分析中,在評(píng)測中取得了準(zhǔn)確率第一的成績,其中模型的準(zhǔn)確率達(dá)到了96.1%,召回率達(dá)到44.2%,F為60.1%。在話題微博情緒分析任務(wù)中,本文首先嘗試結(jié)合心理學(xué)、漢語語言學(xué)來將微博情緒劃分為“喜”、“怒”、“哀”、“懼”、“惡”五大類別,然后完善了大連理工大學(xué)的情感詞匯本體,并深入分析話題微博情緒特征的基礎(chǔ)上,提出了基于SVM模型的情緒分析方法;最后使用NLPCC2013提供的情緒語料進(jìn)行測試,驗(yàn)證了本文提出情緒分析方法的有效性和構(gòu)建語料庫的科學(xué)性。
【關(guān)鍵詞】:話題微博 情感傾向性 SVM 主觀微博 情緒分析 內(nèi)容挖掘
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:G206
【目錄】:
- 摘要5-6
- ABSTRACT6-9
- 1 緒論9-15
- 1.1 研究背景9-11
- 1.2 研究意義11-12
- 1.3 研究內(nèi)容12-13
- 1.4 論文的組織結(jié)構(gòu)13-15
- 2 相關(guān)理論及研究現(xiàn)狀分析15-28
- 2.1 話題微博情感分析研究現(xiàn)狀15-23
- 2.1.1 微博情感傾向性分析研究現(xiàn)狀15-18
- 2.1.2 主客觀文本識(shí)別研究現(xiàn)狀18-20
- 2.1.3 微博情緒分析研究現(xiàn)狀20-23
- 2.2 SVM模型及開源工具23-25
- 2.2.1 SVM模型23-25
- 2.2.2 LibSVM開源工具25
- 2.3 文本分類性能評(píng)價(jià)指標(biāo)25-27
- 2.3.1 性能評(píng)價(jià)的基本指標(biāo)25-26
- 2.3.2 性能評(píng)價(jià)的綜合指標(biāo)26-27
- 2.4 本章小結(jié)27-28
- 3 微博情感分析相關(guān)詞典構(gòu)建28-35
- 3.1 微博情感詞典構(gòu)建28-29
- 3.2 微博情緒本體構(gòu)建與完善29-30
- 3.3 微博情感分析其他相關(guān)詞典30-34
- 3.4 本章小結(jié)34-35
- 4 主客觀微博識(shí)別35-48
- 4.1 主客觀微博定義35
- 4.2 主客觀微博識(shí)別實(shí)驗(yàn)方案設(shè)計(jì)35-37
- 4.3 主客觀微博識(shí)別特征分析與計(jì)算37-41
- 4.4 主客觀微博識(shí)別實(shí)驗(yàn)41-47
- 4.4.1 實(shí)驗(yàn)語料41-42
- 4.4.2 實(shí)驗(yàn)過程42-45
- 4.4.3 實(shí)驗(yàn)結(jié)果及分析45-47
- 4.5 本章小結(jié)47-48
- 5 微博情感傾向性分析48-60
- 5.1 微博情感傾向分析實(shí)驗(yàn)方案設(shè)計(jì)48-50
- 5.2 微博情感傾向特征分析與計(jì)算50-53
- 5.3 微博情感傾向性分析實(shí)驗(yàn)53-59
- 5.3.1 實(shí)驗(yàn)語料53
- 5.3.2 實(shí)驗(yàn)過程53-57
- 5.3.3 實(shí)驗(yàn)結(jié)果及分析57-59
- 5.4 本章小結(jié)59-60
- 6 微博情緒分析60-71
- 6.1 情緒類別劃分60-62
- 6.1.1 情感與情緒的區(qū)別60-61
- 6.1.2 基于情緒本體的情緒類別劃分61-62
- 6.2 微博情緒分析實(shí)驗(yàn)方案設(shè)計(jì)62-64
- 6.3 微博情緒分類語料庫構(gòu)建64-66
- 6.3.1 情緒微博提取64
- 6.3.2 情緒分類標(biāo)注實(shí)驗(yàn)64-65
- 6.3.3 情緒分類標(biāo)注實(shí)驗(yàn)結(jié)果及分析65-66
- 6.4 微博情緒特征分析與計(jì)算66-67
- 6.5 微博情緒分類實(shí)驗(yàn)67-70
- 6.5.1 實(shí)驗(yàn)過程67
- 6.5.2 實(shí)驗(yàn)結(jié)果及分析67-68
- 6.5.3 微博情緒分析方法驗(yàn)證68-70
- 6.6 本章小結(jié)70-71
- 7 總結(jié)和展望71-74
- 7.1 總結(jié)71-72
- 7.2 存在的問題和未來展望72-74
- 致謝74-75
- 參考文獻(xiàn)75-80
- 附錄80
【引證文獻(xiàn)】
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 許小穎;陶建華;;漢語情感系統(tǒng)中情感劃分的研究[A];第一屆中國情感計(jì)算及智能交互學(xué)術(shù)會(huì)議論文集[C];2003年
本文關(guān)鍵詞:基于內(nèi)容挖掘的話題微博情感分析研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):317134
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/317134.html
最近更新
教材專著