情感文本的識別與分類算法的研究與實現(xiàn)
發(fā)布時間:2023-03-26 19:00
近年來,互聯(lián)網(wǎng)中的社交媒體信息迅速增長,利用好這些網(wǎng)絡文本數(shù)據(jù),并挖掘和分析其中有價值的情感信息,是非常有意義的。所以情感傾向性分析任務已經(jīng)成為了自然語言處理領(lǐng)域的研究熱點。海量的網(wǎng)絡文本中,包含觀點句和非觀點句,其中的觀點句也就是主觀性文本才是情感分析研究的對象。因此本文首先實現(xiàn)了對主觀性文本的分析和提取,再對主觀文本進行了進一步的情感分析,研究其是否能夠輔助情感傾向性的計算。論文的主要工作包括:(1)在進行情感文本的識別過程中,本文將詞語的詞性特征作為主客觀分類的重要線索。根據(jù)詞性標注的結(jié)果總結(jié)了九類主觀特征的詞性種類。將詞性特征與詞向量拼接,結(jié)合卷積神經(jīng)網(wǎng)絡,并通過實驗確定了詞性向量的合理維度和卷積核的大小,設計了基于詞性特征和卷積神經(jīng)網(wǎng)絡的主客觀分類模型。根據(jù)實驗結(jié)果統(tǒng)計加入詞性特征使得模型準確率提高了 2%,并比傳統(tǒng)的基于N-POS和支持向量機的主客觀分類模型準確率提高了將近4%。(2)在進行主觀文本的情感傾向性計算時,文本中的轉(zhuǎn)折句和總結(jié)句影響著整個句子的整體傾向性。因此本文提出了基于主干分析的情感分析計算方法。本文總結(jié)了包含23個轉(zhuǎn)折性連詞和總結(jié)性連詞的連詞詞典,通過與連...
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 背景及意義
1.2 主客觀分類問題研究現(xiàn)狀
1.3 情感分析問題研究現(xiàn)狀
1.4 論文的主要內(nèi)容及結(jié)構(gòu)
1.4.1 主要研究內(nèi)容
1.4.2 論文結(jié)構(gòu)
2 基礎理論與技術(shù)
2.1 文本預處理和詞向量表示
2.1.1 分詞
2.1.2 詞性標注
2.1.3 詞向量相關(guān)理論
2.2 傳統(tǒng)機器學習文本分類算法
2.2.1 文本特征提取方法
2.2.2 樸素貝葉斯模型
2.2.3 支持向量機模型
2.3 基于深度學習的文本分類算法
2.3.1 人工神經(jīng)網(wǎng)絡
2.3.2 卷積神經(jīng)網(wǎng)絡
2.3.3 循環(huán)神經(jīng)網(wǎng)絡
2.3.4 長短期記憶網(wǎng)絡
2.4 分類結(jié)果評估
2.5 本章小結(jié)
3 基于詞性特征和卷積神經(jīng)網(wǎng)絡的主客觀識別模型
3.1 引言
3.2 詞語的詞性特征和向量表示
3.3 基于詞性特征的卷積神經(jīng)網(wǎng)絡模型
3.3.1 模型的結(jié)構(gòu)
3.3.2 模型的原理
3.4 模型評估
3.4.1 數(shù)據(jù)集
3.4.2 數(shù)據(jù)預處理和訓練詞向量
3.4.3 模型參數(shù)設置
3.4.4 模型對比實驗
3.4.5 實驗結(jié)果分析
3.5 本章小結(jié)
4 基于主干分析和權(quán)重詞向量的情感分類模型
4.1 句子主干分析
4.2 詞向量的情感權(quán)重計算
4.3 情感分類模型
4.4 實驗評估
4.4.1 實驗數(shù)據(jù)集
4.4.2 對比實驗分析
4.4.3 實驗結(jié)果分析
4.5 本章小結(jié)
5 總結(jié)和展望
參考文獻
作者簡歷及攻讀碩士學位期間取得的研究成果
學位論文數(shù)據(jù)集
本文編號:3771525
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 背景及意義
1.2 主客觀分類問題研究現(xiàn)狀
1.3 情感分析問題研究現(xiàn)狀
1.4 論文的主要內(nèi)容及結(jié)構(gòu)
1.4.1 主要研究內(nèi)容
1.4.2 論文結(jié)構(gòu)
2 基礎理論與技術(shù)
2.1 文本預處理和詞向量表示
2.1.1 分詞
2.1.2 詞性標注
2.1.3 詞向量相關(guān)理論
2.2 傳統(tǒng)機器學習文本分類算法
2.2.1 文本特征提取方法
2.2.2 樸素貝葉斯模型
2.2.3 支持向量機模型
2.3 基于深度學習的文本分類算法
2.3.1 人工神經(jīng)網(wǎng)絡
2.3.2 卷積神經(jīng)網(wǎng)絡
2.3.3 循環(huán)神經(jīng)網(wǎng)絡
2.3.4 長短期記憶網(wǎng)絡
2.4 分類結(jié)果評估
2.5 本章小結(jié)
3 基于詞性特征和卷積神經(jīng)網(wǎng)絡的主客觀識別模型
3.1 引言
3.2 詞語的詞性特征和向量表示
3.3 基于詞性特征的卷積神經(jīng)網(wǎng)絡模型
3.3.1 模型的結(jié)構(gòu)
3.3.2 模型的原理
3.4 模型評估
3.4.1 數(shù)據(jù)集
3.4.2 數(shù)據(jù)預處理和訓練詞向量
3.4.3 模型參數(shù)設置
3.4.4 模型對比實驗
3.4.5 實驗結(jié)果分析
3.5 本章小結(jié)
4 基于主干分析和權(quán)重詞向量的情感分類模型
4.1 句子主干分析
4.2 詞向量的情感權(quán)重計算
4.3 情感分類模型
4.4 實驗評估
4.4.1 實驗數(shù)據(jù)集
4.4.2 對比實驗分析
4.4.3 實驗結(jié)果分析
4.5 本章小結(jié)
5 總結(jié)和展望
參考文獻
作者簡歷及攻讀碩士學位期間取得的研究成果
學位論文數(shù)據(jù)集
本文編號:3771525
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3771525.html
最近更新
教材專著