基于主題情感混合模型的無監(jiān)督微博情感分類
發(fā)布時(shí)間:2022-11-11 22:37
隨著互聯(lián)網(wǎng)的興起,帶動(dòng)了以微博為主的社交網(wǎng)絡(luò)平臺(tái)的快速發(fā)展,微博評(píng)論文本呈指數(shù)型增長(zhǎng),從海量評(píng)論文本中挖掘的情感信息在商業(yè)策劃與社會(huì)應(yīng)用中的價(jià)值越來越大,與此同時(shí),依托計(jì)算機(jī)的無監(jiān)督微博情感分析技術(shù)應(yīng)運(yùn)而生。與傳統(tǒng)文本情感分析不同的是,微博評(píng)論文本在情感表達(dá)上有其獨(dú)特之處,微博評(píng)論有一定的字?jǐn)?shù)限制,短文本評(píng)論居多且數(shù)量規(guī)模大,易出現(xiàn)文本語(yǔ)法不規(guī)范、頻現(xiàn)網(wǎng)絡(luò)新詞等現(xiàn)象。故本文針對(duì)微博文本以上特點(diǎn)開展研究,構(gòu)建一個(gè)面向微博文本的領(lǐng)域情感詞典,提出一種基于BTM主題模型的無監(jiān)督微博情感分類模型(W-BSTM)。本文所構(gòu)建的微博文本領(lǐng)域情感詞典包含基礎(chǔ)情感詞典、網(wǎng)絡(luò)用語(yǔ)情感詞典、表情符號(hào)情感詞典和領(lǐng)域擴(kuò)建情感詞典四部分。在現(xiàn)有情感詞典基礎(chǔ)上構(gòu)建了一個(gè)二分類基礎(chǔ)情感詞典;通過觀察與整理構(gòu)建了針對(duì)文本中網(wǎng)絡(luò)詞語(yǔ)和表情符號(hào)的情感詞典;使用基于HowNet語(yǔ)義計(jì)算方法建立微博領(lǐng)域的擴(kuò)展詞典,收集那些在傳統(tǒng)文本中無情感傾向在微博文本表述中含情感傾向的詞。W-BSTM模型是在BTM模型的基礎(chǔ)上增加情感層,融合權(quán)重模型,形成無監(jiān)督的“主題-情感-詞匯”三層貝葉斯主題情感混合模型,在保留BTM模型原有優(yōu)越性的...
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于情感詞典的分析方法
1.2.2 基于機(jī)器學(xué)習(xí)的情感分析方法
1.3 論文的主要研究?jī)?nèi)容與組織結(jié)構(gòu)
1.3.1 主要研究?jī)?nèi)容
1.3.2 本文組織結(jié)構(gòu)
1.4 本章小結(jié)
第二章 相關(guān)關(guān)鍵理論與技術(shù)研究
2.1 微博文本情感分類流程
2.2 中文數(shù)據(jù)預(yù)處理技術(shù)
2.2.1 中文分詞
2.2.2 停用詞處理
2.3 主題模型
2.3.1 LDA模型
2.3.2 BTM模型
2.4 主題情感模型
2.5 本章小結(jié)
第三章 面向微博文本的情感詞典構(gòu)建
3.1 情感詞典相關(guān)介紹
3.2 微博情感詞典的構(gòu)建
3.2.1 基礎(chǔ)情感詞典
3.2.2 網(wǎng)絡(luò)用語(yǔ)情感詞典
3.2.3 表情符號(hào)情感詞典
3.3 微博情感領(lǐng)域詞典擴(kuò)建
3.4 本章小結(jié)
第四章 改進(jìn)的主題情感混合模型
4.1 權(quán)重模型
4.1.1 CV詞權(quán)重模型
4.1.2 SO-PMI詞權(quán)重模型
4.1.3 詞綜合權(quán)重模型
4.2 加權(quán)主題情感混合模型
4.3 文檔情感極性判定
4.4 本章小結(jié)
第五章 微博情感分析實(shí)驗(yàn)
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.1.1 數(shù)據(jù)獲取
5.1.2 數(shù)據(jù)預(yù)處理
5.2 實(shí)驗(yàn)參數(shù)及評(píng)價(jià)指標(biāo)
5.3 模型對(duì)比實(shí)驗(yàn)結(jié)果與分析
5.4 微博評(píng)論情感隨機(jī)測(cè)評(píng)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
學(xué)術(shù)論文與科研項(xiàng)目
致謝
本文編號(hào):3705875
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于情感詞典的分析方法
1.2.2 基于機(jī)器學(xué)習(xí)的情感分析方法
1.3 論文的主要研究?jī)?nèi)容與組織結(jié)構(gòu)
1.3.1 主要研究?jī)?nèi)容
1.3.2 本文組織結(jié)構(gòu)
1.4 本章小結(jié)
第二章 相關(guān)關(guān)鍵理論與技術(shù)研究
2.1 微博文本情感分類流程
2.2 中文數(shù)據(jù)預(yù)處理技術(shù)
2.2.1 中文分詞
2.2.2 停用詞處理
2.3 主題模型
2.3.1 LDA模型
2.3.2 BTM模型
2.4 主題情感模型
2.5 本章小結(jié)
第三章 面向微博文本的情感詞典構(gòu)建
3.1 情感詞典相關(guān)介紹
3.2 微博情感詞典的構(gòu)建
3.2.1 基礎(chǔ)情感詞典
3.2.2 網(wǎng)絡(luò)用語(yǔ)情感詞典
3.2.3 表情符號(hào)情感詞典
3.3 微博情感領(lǐng)域詞典擴(kuò)建
3.4 本章小結(jié)
第四章 改進(jìn)的主題情感混合模型
4.1 權(quán)重模型
4.1.1 CV詞權(quán)重模型
4.1.2 SO-PMI詞權(quán)重模型
4.1.3 詞綜合權(quán)重模型
4.2 加權(quán)主題情感混合模型
4.3 文檔情感極性判定
4.4 本章小結(jié)
第五章 微博情感分析實(shí)驗(yàn)
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.1.1 數(shù)據(jù)獲取
5.1.2 數(shù)據(jù)預(yù)處理
5.2 實(shí)驗(yàn)參數(shù)及評(píng)價(jià)指標(biāo)
5.3 模型對(duì)比實(shí)驗(yàn)結(jié)果與分析
5.4 微博評(píng)論情感隨機(jī)測(cè)評(píng)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
學(xué)術(shù)論文與科研項(xiàng)目
致謝
本文編號(hào):3705875
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3705875.html
最近更新
教材專著