基于LSTM的文檔級別情感分析方法研究
發(fā)布時間:2023-06-03 01:30
隨著以人為中心的Web2.0時代的蓬勃發(fā)展,互聯(lián)網(wǎng)中產(chǎn)生了大量關于人物,事件,產(chǎn)品等包含用戶情感的有價值的評論信息,文本情感分析技術能有效挖掘其價值,因此越來越受到關注。對于短文本的詞語級別以及句子級別的情感分析已經(jīng)開展了多年研究并取得較好成績,但是對于文檔級別情感分析,尤其是長文本的建模仍然是一個巨大的難題,雖然LSTM神經(jīng)網(wǎng)絡在長文本建模上取得了巨大的成功,但LSTM依然會存在對長序列學習不完整的問題,因此亟待研究新的篇章級情感分析方法。針對以上問題,本文設計并實現(xiàn)了一個基于的LSTM的分層神經(jīng)網(wǎng)絡結構并且嘗試提出了多種改進的方法。首先,本文提出了一種雙層LSTM的模型,第一層對文檔中每個句子進行詞到句子的建模,第二層是對文檔中的所有句子到文檔進行建模。其次,為了提高模型的訓練效果,本文提出了一種基于情感詞典的方法,來過濾掉一些客觀性句子,減少模型訓練的噪聲。最后,為了考慮句子中詞語間的空間結構,本文用Tree-LSTM代替?zhèn)鹘y(tǒng)的序列LSTM對詞語到句子進行建模,來得到更好的句子向量。實驗結果表明基于的LSTM的分層神經(jīng)網(wǎng)絡結構及其改進的方法在三個公開的大規(guī)模的文檔級別數(shù)據(jù)集上都具...
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究內(nèi)容和主要貢獻
1.3 論文組織結構
第2章 相關研究綜述
2.1 文檔級情感分析方法綜述
2.1.1 情感分析方法的發(fā)展
2.1.2 文檔級情感分析
2.2 循環(huán)神經(jīng)網(wǎng)絡
2.2.1 LSTM(長短期記憶神經(jīng)網(wǎng)絡)
2.2.2 Tree-LSTM(樹形長短期記憶神經(jīng)網(wǎng)絡)
第3章 基于分層的LSTM的文檔級情感分析
3.1 整體框架
3.2 數(shù)據(jù)預處理
3.2.1 情感詞典
3.2.2 基于情感詞典的句子級別情感分析方法
3.3 本章小結
第4章 基于分層的Tree-LSTM的文檔級情感分析方法研究
4.1 整體框架
4.2 詞到句子的建模
4.2.1 句法語義樹
4.3 句子到文檔的建模
4.3.1 卷積神經(jīng)網(wǎng)絡(CNN)
4.3.2 注意力模型(attention)
4.3.3 Bi-GRU與 attention結合
4.3.4 CNN與 attention結合
4.4 stacking集成
4.5 本章總結
第5章 實驗結果及分析
5.1 基于分層LSTM的相關實驗
5.1.1 實驗數(shù)據(jù)集和超參數(shù)的設置
5.1.2 Baseline模型
5.1.3 實驗結果和分析
5.1.4 詞向量和最大句子數(shù)量Maxn的選擇
5.2 基于分層的Tree-LSTM的相關實驗
5.2.1 實驗結果
5.2.2 CNN與 LSTM的實驗對比分析
5.2.3 集成學習實驗結果以及分析
5.2.4 實驗結論
第6章 總結和展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝
本文編號:3828405
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究內(nèi)容和主要貢獻
1.3 論文組織結構
第2章 相關研究綜述
2.1 文檔級情感分析方法綜述
2.1.1 情感分析方法的發(fā)展
2.1.2 文檔級情感分析
2.2 循環(huán)神經(jīng)網(wǎng)絡
2.2.1 LSTM(長短期記憶神經(jīng)網(wǎng)絡)
2.2.2 Tree-LSTM(樹形長短期記憶神經(jīng)網(wǎng)絡)
第3章 基于分層的LSTM的文檔級情感分析
3.1 整體框架
3.2 數(shù)據(jù)預處理
3.2.1 情感詞典
3.2.2 基于情感詞典的句子級別情感分析方法
3.3 本章小結
第4章 基于分層的Tree-LSTM的文檔級情感分析方法研究
4.1 整體框架
4.2 詞到句子的建模
4.2.1 句法語義樹
4.3 句子到文檔的建模
4.3.1 卷積神經(jīng)網(wǎng)絡(CNN)
4.3.2 注意力模型(attention)
4.3.3 Bi-GRU與 attention結合
4.3.4 CNN與 attention結合
4.4 stacking集成
4.5 本章總結
第5章 實驗結果及分析
5.1 基于分層LSTM的相關實驗
5.1.1 實驗數(shù)據(jù)集和超參數(shù)的設置
5.1.2 Baseline模型
5.1.3 實驗結果和分析
5.1.4 詞向量和最大句子數(shù)量Maxn的選擇
5.2 基于分層的Tree-LSTM的相關實驗
5.2.1 實驗結果
5.2.2 CNN與 LSTM的實驗對比分析
5.2.3 集成學習實驗結果以及分析
5.2.4 實驗結論
第6章 總結和展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝
本文編號:3828405
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3828405.html
最近更新
教材專著