基于長短時(shí)記憶網(wǎng)絡(luò)的網(wǎng)絡(luò)評(píng)論文本情感分類研究
發(fā)布時(shí)間:2021-07-20 01:36
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,各類信息不斷朝著多元化與海量化的方向發(fā)展。對(duì)各類信息進(jìn)行整理分析的需求呈現(xiàn)爆炸式增長。作為數(shù)據(jù)挖掘中的一項(xiàng)重要任務(wù),文本情感分類逐漸成為相關(guān)領(lǐng)域的研究熱點(diǎn)。傳統(tǒng)的文本情感分類方法大都基于人工設(shè)計(jì)特征并進(jìn)行提取的方法,但由于語義信息的抽象性,僅僅通過統(tǒng)計(jì)信息無法準(zhǔn)確捕捉深層的語義信息。為解決這一問題,本課題基于長短時(shí)記憶網(wǎng)絡(luò)(LSTM),設(shè)計(jì)了自動(dòng)提取文本特征的文本情感分類模型,并開展實(shí)驗(yàn)研究。針對(duì)文本中語句較長,單詞量較大,不利于語義信息提取的問題,本文采用分級(jí)網(wǎng)絡(luò)結(jié)構(gòu)思想,結(jié)合長短時(shí)記憶網(wǎng)絡(luò)進(jìn)行特征提取。利用文本“詞-句-篇”的結(jié)構(gòu)特點(diǎn),對(duì)文本結(jié)構(gòu)拆分,進(jìn)行二次特征提取過程,首先以詞為基本單位進(jìn)行單詞級(jí)的特征提取得到句子的特征向量,再以句子為基本單位進(jìn)行句子級(jí)的特征提取得到篇章級(jí)的特征表示,從而實(shí)現(xiàn)文本的特征提取完成分類任務(wù)。針對(duì)長短時(shí)記憶網(wǎng)絡(luò)在不同時(shí)刻所提取到的特征進(jìn)行選擇的問題,在網(wǎng)絡(luò)編碼階段引入注意力機(jī)制,并結(jié)合分級(jí)網(wǎng)絡(luò)結(jié)構(gòu)思想,構(gòu)建H-LSTM-AM模型;基于卷積神經(jīng)網(wǎng)絡(luò)對(duì)局部信息敏感的特點(diǎn),將卷積神經(jīng)網(wǎng)絡(luò)(CNN)引入到句子級(jí)的編碼中,構(gòu)建LSTM...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本表示研究現(xiàn)狀
1.2.2 機(jī)器學(xué)習(xí)在文本情感分類上的應(yīng)用
1.2.3 深度學(xué)習(xí)在文本情感分類上的應(yīng)用
1.3 本文的主要研究?jī)?nèi)容
第2章 深度學(xué)習(xí)相關(guān)研究
2.1 詞向量
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)及變種
2.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 長短時(shí)記憶網(wǎng)絡(luò)
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 注意力機(jī)制
2.5 本章小結(jié)
第3章 基于LSTM的文本情感分類模型設(shè)計(jì)
3.1 文本數(shù)據(jù)預(yù)處理
3.2 分級(jí)注意力模型結(jié)構(gòu)(H-LSTM-AM)
3.2.1 分級(jí)網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2 H-LSTM-AM模型
3.2.3 H-LSTM-AM模型訓(xùn)練
3.3 LSTM-CNN模型
3.3.1 TextCNN模型
3.3.2 LSTM-CNN模型
3.4 權(quán)重?fù)p失函數(shù)
3.4.1 樣本不均衡問題
3.4.2 權(quán)重?fù)p失函數(shù)
3.5 集成學(xué)習(xí)Bagging機(jī)制
3.6 本章小結(jié)
第4章 實(shí)驗(yàn)驗(yàn)證與分析
4.1 實(shí)驗(yàn)準(zhǔn)備與說明
4.1.1 實(shí)驗(yàn)數(shù)據(jù)集
4.1.2 評(píng)價(jià)指標(biāo)
4.1.3 實(shí)驗(yàn)環(huán)境
4.2 模型對(duì)比實(shí)驗(yàn)與分析
4.3 模型超參數(shù)調(diào)整
4.3.1 詞向量
4.3.2 隱藏層單元數(shù)
4.3.3 激活函數(shù)
4.4 權(quán)重?fù)p失函數(shù)有效性驗(yàn)證
4.5 集成學(xué)習(xí)有效性驗(yàn)證
4.6 模型可視化
4.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3291851
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本表示研究現(xiàn)狀
1.2.2 機(jī)器學(xué)習(xí)在文本情感分類上的應(yīng)用
1.2.3 深度學(xué)習(xí)在文本情感分類上的應(yīng)用
1.3 本文的主要研究?jī)?nèi)容
第2章 深度學(xué)習(xí)相關(guān)研究
2.1 詞向量
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)及變種
2.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 長短時(shí)記憶網(wǎng)絡(luò)
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 注意力機(jī)制
2.5 本章小結(jié)
第3章 基于LSTM的文本情感分類模型設(shè)計(jì)
3.1 文本數(shù)據(jù)預(yù)處理
3.2 分級(jí)注意力模型結(jié)構(gòu)(H-LSTM-AM)
3.2.1 分級(jí)網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2 H-LSTM-AM模型
3.2.3 H-LSTM-AM模型訓(xùn)練
3.3 LSTM-CNN模型
3.3.1 TextCNN模型
3.3.2 LSTM-CNN模型
3.4 權(quán)重?fù)p失函數(shù)
3.4.1 樣本不均衡問題
3.4.2 權(quán)重?fù)p失函數(shù)
3.5 集成學(xué)習(xí)Bagging機(jī)制
3.6 本章小結(jié)
第4章 實(shí)驗(yàn)驗(yàn)證與分析
4.1 實(shí)驗(yàn)準(zhǔn)備與說明
4.1.1 實(shí)驗(yàn)數(shù)據(jù)集
4.1.2 評(píng)價(jià)指標(biāo)
4.1.3 實(shí)驗(yàn)環(huán)境
4.2 模型對(duì)比實(shí)驗(yàn)與分析
4.3 模型超參數(shù)調(diào)整
4.3.1 詞向量
4.3.2 隱藏層單元數(shù)
4.3.3 激活函數(shù)
4.4 權(quán)重?fù)p失函數(shù)有效性驗(yàn)證
4.5 集成學(xué)習(xí)有效性驗(yàn)證
4.6 模型可視化
4.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3291851
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3291851.html
最近更新
教材專著