基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)輿情文本情感分類方法研究
發(fā)布時(shí)間:2021-07-17 09:32
文本情感分析是自然語言處理領(lǐng)域的主要研究方向之一,其主要研究圍繞著詞向量表示、文本特征提取、模型的建立等展開。而隨著互聯(lián)網(wǎng)對(duì)人們生活影響的逐步加深,互聯(lián)網(wǎng)文本情感分析不僅在自然語言處理領(lǐng)域有著重要的研究意義,而且更對(duì)現(xiàn)實(shí)生活有著重要的利用價(jià)值。近年來,國(guó)內(nèi)外對(duì)文本情感的研究一直在進(jìn)行中,且取得了不少研究成果,但目前大部分的研究具有語言局限性,再加上當(dāng)前可用的有效的文本情感數(shù)據(jù)集較少,因此目前的中文文本的情感分析還存在很多局限性。針對(duì)中文文本的情感分析,本文主要研究詞向量表示模型的改進(jìn)、文本數(shù)據(jù)增強(qiáng)策略以及中文文本情感分類模型,并設(shè)計(jì)一個(gè)基于文本情感分析的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)。本文的主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)包括:(1)本文提出了兩種改進(jìn)的詞向量表示模型,分別是基于CME(Concatenation Meta-embedding)的詞向量表示模型和基于AME(Average Meta-embedding)的詞向量表示模型。這兩種詞向量模型以不同的方式融合了word2vec和Glove詞向量。實(shí)驗(yàn)結(jié)果表明,應(yīng)用改進(jìn)的詞向量時(shí)有助于文本情感分類模型性能的提升。(2)針對(duì)中文語料庫(kù)中有標(biāo)記的情感數(shù)據(jù)集缺...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外相關(guān)研究
1.3 本文研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.4 本文的結(jié)構(gòu)安排
1.5 本章小結(jié)
第二章 文本情感分類技術(shù)基礎(chǔ)
2.1 情感分析概述
2.2 文本處理相關(guān)技術(shù)
2.2.1 文本預(yù)處理
2.2.2 經(jīng)典文本表示方法
2.3 經(jīng)典文本分類相關(guān)技術(shù)
2.3.1 K近鄰算法(KNN)
2.3.2 支持向量機(jī)(SVM)
2.3.3 樸素貝葉斯
2.4 本章小結(jié)
第三章 文本情感分類模型相關(guān)技術(shù)改進(jìn)與模型設(shè)計(jì)
3.1 引言
3.2 模型設(shè)計(jì)使用的理論基礎(chǔ)介紹
3.2.1 詞向量技術(shù)介紹
3.2.1.1 word2vec
3.2.1.2 Glove
3.2.2 常用網(wǎng)絡(luò)介紹
3.2.2.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2.2 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
3.2.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)
3.3 改進(jìn)的詞向量表示模型
3.3.1 基于CME的詞向量表示模型
3.3.2 基于AME的詞向量表示模型
3.4 文本數(shù)據(jù)增強(qiáng)策略設(shè)計(jì)
3.4.1 文本數(shù)據(jù)增強(qiáng)的必要性分析
3.4.2 基于EDA技術(shù)的文本數(shù)據(jù)增強(qiáng)策略
3.5 文本情感分類模型設(shè)計(jì)
3.5.1 基于HCRNN的文本情感分類模型結(jié)構(gòu)
3.5.1.1 輸入層設(shè)計(jì)
3.5.1.2 情感特征提取層設(shè)計(jì)
3.5.1.3 輸出層設(shè)計(jì)
3.5.1.4 損失函數(shù)
3.5.1.5 擬合問題與優(yōu)化訓(xùn)練過程
3.5.1.6 模型結(jié)構(gòu)圖
3.5.2 基于注意力機(jī)制的HCRNN-Att模型結(jié)構(gòu)
3.5.3 基于TF-IDF特征的THCRNN-Att模型結(jié)構(gòu)
3.6 本章小結(jié)
第四章 基于文本情感分析的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)
4.1 引言
4.2 系統(tǒng)設(shè)計(jì)目標(biāo)
4.2.1 系統(tǒng)設(shè)計(jì)難點(diǎn)
4.2.2 系統(tǒng)目標(biāo)
4.3 網(wǎng)絡(luò)部署
4.4 系統(tǒng)功能與架構(gòu)設(shè)計(jì)
4.5 系統(tǒng)模塊設(shè)計(jì)
4.5.1 數(shù)據(jù)采集模塊設(shè)計(jì)
4.5.2 數(shù)據(jù)預(yù)處理模塊設(shè)計(jì)
4.5.3 輿情分析模塊設(shè)計(jì)
4.6 本章小結(jié)
第五章 實(shí)驗(yàn)過程與結(jié)果分析
5.1 情感分類評(píng)價(jià)指標(biāo)
5.2 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)集
5.2.1 實(shí)驗(yàn)環(huán)境
5.2.2 實(shí)驗(yàn)數(shù)據(jù)
5.3 文本情感分類模型實(shí)驗(yàn)過程與結(jié)果分析
5.3.1 實(shí)驗(yàn)設(shè)計(jì)
5.3.2 詞向量訓(xùn)練過程與分析
5.3.3 HCRNN系列模型訓(xùn)練過程與分析
5.3.3.1 模型訓(xùn)練過程
5.3.3.2 CNN和BiLSTM的實(shí)驗(yàn)結(jié)果
5.3.3.3 基于機(jī)器學(xué)習(xí)的對(duì)比實(shí)驗(yàn)
5.3.3.4 HCRNN系列模型實(shí)驗(yàn)結(jié)果
5.3.3.5 微博情感分析數(shù)據(jù)集實(shí)驗(yàn)
5.3.4 不同詞向量之間的實(shí)驗(yàn)對(duì)比
5.3.5 文本增強(qiáng)策略實(shí)驗(yàn)與分析
5.3.6 實(shí)驗(yàn)總結(jié)
5.4 輿情監(jiān)控系統(tǒng)測(cè)試與原型實(shí)現(xiàn)
5.4.1 系統(tǒng)測(cè)試與實(shí)現(xiàn)
5.4.2 系統(tǒng)原型展示
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]論“后真相”時(shí)代網(wǎng)絡(luò)輿論的特點(diǎn)及其引導(dǎo)對(duì)策[J]. 程仕波. 思想理論教育. 2018(09)
[2]基于微博情感分析和社會(huì)網(wǎng)絡(luò)分析的霧霾輿情研究[J]. 何躍,朱婷婷. 情報(bào)科學(xué). 2018(07)
[3]基于SVM和CRF多特征組合的微博情感分析[J]. 李婷婷,姬東鴻. 計(jì)算機(jī)應(yīng)用研究. 2015(04)
[4]面向微博短文本的細(xì)粒度情感特征抽取方法[J]. 賀飛艷,何炎祥,劉楠,劉健博,彭敏. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)
[5]基于馬爾可夫鏈的輿情熱度趨勢(shì)分析[J]. 劉勘,李晶,劉萍. 計(jì)算機(jī)工程與應(yīng)用. 2011(36)
[6]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學(xué)報(bào). 2010(08)
[7]統(tǒng)計(jì)語言模型及漢語音字轉(zhuǎn)換的一些新結(jié)果[J]. 郭進(jìn). 中文信息學(xué)報(bào). 1993(01)
碩士論文
[1]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學(xué) 2012
本文編號(hào):3287910
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外相關(guān)研究
1.3 本文研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.4 本文的結(jié)構(gòu)安排
1.5 本章小結(jié)
第二章 文本情感分類技術(shù)基礎(chǔ)
2.1 情感分析概述
2.2 文本處理相關(guān)技術(shù)
2.2.1 文本預(yù)處理
2.2.2 經(jīng)典文本表示方法
2.3 經(jīng)典文本分類相關(guān)技術(shù)
2.3.1 K近鄰算法(KNN)
2.3.2 支持向量機(jī)(SVM)
2.3.3 樸素貝葉斯
2.4 本章小結(jié)
第三章 文本情感分類模型相關(guān)技術(shù)改進(jìn)與模型設(shè)計(jì)
3.1 引言
3.2 模型設(shè)計(jì)使用的理論基礎(chǔ)介紹
3.2.1 詞向量技術(shù)介紹
3.2.1.1 word2vec
3.2.1.2 Glove
3.2.2 常用網(wǎng)絡(luò)介紹
3.2.2.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2.2 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
3.2.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)
3.3 改進(jìn)的詞向量表示模型
3.3.1 基于CME的詞向量表示模型
3.3.2 基于AME的詞向量表示模型
3.4 文本數(shù)據(jù)增強(qiáng)策略設(shè)計(jì)
3.4.1 文本數(shù)據(jù)增強(qiáng)的必要性分析
3.4.2 基于EDA技術(shù)的文本數(shù)據(jù)增強(qiáng)策略
3.5 文本情感分類模型設(shè)計(jì)
3.5.1 基于HCRNN的文本情感分類模型結(jié)構(gòu)
3.5.1.1 輸入層設(shè)計(jì)
3.5.1.2 情感特征提取層設(shè)計(jì)
3.5.1.3 輸出層設(shè)計(jì)
3.5.1.4 損失函數(shù)
3.5.1.5 擬合問題與優(yōu)化訓(xùn)練過程
3.5.1.6 模型結(jié)構(gòu)圖
3.5.2 基于注意力機(jī)制的HCRNN-Att模型結(jié)構(gòu)
3.5.3 基于TF-IDF特征的THCRNN-Att模型結(jié)構(gòu)
3.6 本章小結(jié)
第四章 基于文本情感分析的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)
4.1 引言
4.2 系統(tǒng)設(shè)計(jì)目標(biāo)
4.2.1 系統(tǒng)設(shè)計(jì)難點(diǎn)
4.2.2 系統(tǒng)目標(biāo)
4.3 網(wǎng)絡(luò)部署
4.4 系統(tǒng)功能與架構(gòu)設(shè)計(jì)
4.5 系統(tǒng)模塊設(shè)計(jì)
4.5.1 數(shù)據(jù)采集模塊設(shè)計(jì)
4.5.2 數(shù)據(jù)預(yù)處理模塊設(shè)計(jì)
4.5.3 輿情分析模塊設(shè)計(jì)
4.6 本章小結(jié)
第五章 實(shí)驗(yàn)過程與結(jié)果分析
5.1 情感分類評(píng)價(jià)指標(biāo)
5.2 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)集
5.2.1 實(shí)驗(yàn)環(huán)境
5.2.2 實(shí)驗(yàn)數(shù)據(jù)
5.3 文本情感分類模型實(shí)驗(yàn)過程與結(jié)果分析
5.3.1 實(shí)驗(yàn)設(shè)計(jì)
5.3.2 詞向量訓(xùn)練過程與分析
5.3.3 HCRNN系列模型訓(xùn)練過程與分析
5.3.3.1 模型訓(xùn)練過程
5.3.3.2 CNN和BiLSTM的實(shí)驗(yàn)結(jié)果
5.3.3.3 基于機(jī)器學(xué)習(xí)的對(duì)比實(shí)驗(yàn)
5.3.3.4 HCRNN系列模型實(shí)驗(yàn)結(jié)果
5.3.3.5 微博情感分析數(shù)據(jù)集實(shí)驗(yàn)
5.3.4 不同詞向量之間的實(shí)驗(yàn)對(duì)比
5.3.5 文本增強(qiáng)策略實(shí)驗(yàn)與分析
5.3.6 實(shí)驗(yàn)總結(jié)
5.4 輿情監(jiān)控系統(tǒng)測(cè)試與原型實(shí)現(xiàn)
5.4.1 系統(tǒng)測(cè)試與實(shí)現(xiàn)
5.4.2 系統(tǒng)原型展示
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]論“后真相”時(shí)代網(wǎng)絡(luò)輿論的特點(diǎn)及其引導(dǎo)對(duì)策[J]. 程仕波. 思想理論教育. 2018(09)
[2]基于微博情感分析和社會(huì)網(wǎng)絡(luò)分析的霧霾輿情研究[J]. 何躍,朱婷婷. 情報(bào)科學(xué). 2018(07)
[3]基于SVM和CRF多特征組合的微博情感分析[J]. 李婷婷,姬東鴻. 計(jì)算機(jī)應(yīng)用研究. 2015(04)
[4]面向微博短文本的細(xì)粒度情感特征抽取方法[J]. 賀飛艷,何炎祥,劉楠,劉健博,彭敏. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)
[5]基于馬爾可夫鏈的輿情熱度趨勢(shì)分析[J]. 劉勘,李晶,劉萍. 計(jì)算機(jī)工程與應(yīng)用. 2011(36)
[6]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學(xué)報(bào). 2010(08)
[7]統(tǒng)計(jì)語言模型及漢語音字轉(zhuǎn)換的一些新結(jié)果[J]. 郭進(jìn). 中文信息學(xué)報(bào). 1993(01)
碩士論文
[1]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學(xué) 2012
本文編號(hào):3287910
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3287910.html
最近更新
教材專著