基于深度學習的評論文本情感分析
發(fā)布時間:2020-06-23 17:13
【摘要】:當前文本表示模型較難捕獲評論文本中結構詞或短語的意義。同時深度情感分析模型忽略評論文本的層次結構,而直接將整個評論視為一個超長句子處理,且無法以可視化的方式評估其對情感詞或句子的辨別能力。在許多現(xiàn)實場景中經常因數(shù)據(jù)集規(guī)模較小而不能滿足深度神經網(wǎng)絡模型訓練的要求。同時現(xiàn)有深度情感分析模型一般都是單任務模型,未能有效利用不同任務間可共享的特征信息。為解決上述問題,首先設計一種能將評論文本結構信息引入深度情感分析模型的標志識別策略(Mark Recognition Strategy,MRS),并基于MRS提出一種分層標志模型(Hierarchical Mark Neural Model,HMN),該模型采用“詞-句子-評論”的層次結構,使其不僅能夠區(qū)分詞的情感程度,還能辨別句子對整個評論情感的貢獻程度。再通過引入詞與句子級別的標志信息幫助模型處理帶有復雜結構的評論文本,并能用可視化的方式評估模型HMN對情感詞與句子的辨識能力。接著又提出一種基于模型HMN的遷移學習方法HMN-TF,該方法適用于模型HMN在小評論數(shù)據(jù)集上進行情感分析的場景,并針對模型的層次結構提出4種遷移參數(shù)微調(Fine-tuning)的策略。考慮到評論情感分析包括情感分類和觀點摘要抽取等任務,為此提出一種基于HMN的多任務模型HMN-MT,該模型以訓練并完成情感分類與觀點摘要抽取任務的方式來提升表現(xiàn)。為評估MRS、HMN、HMN-TF和HMN-MT的有效性,在Amazon in Singapore、Test Freaks和Amazon Fine Food評論數(shù)據(jù)集上開展實驗,并與評論文本情感分析的前沿模型在Accuracy與F1Score等指標上進行比較,其中模型HMN與最佳對比模型相比提升約1.6%,MRS最高可將深度神經網(wǎng)絡模型的表現(xiàn)提升6.7%,HMN-TF在小評論數(shù)據(jù)集上Test Freaks的效果提升1.7%,模型HMN-MT的表現(xiàn)與前沿模型相比也有略微提升。
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP18
【圖文】:
華 中 科 技 學 碩 學 位 論 但在 TestFreaks 數(shù)據(jù)集上,用 TriGrams 效果最好。實驗結果還表明 LR 在不同的數(shù)據(jù)集下從時間復雜度和準確率上都遠遠優(yōu)于 NB。
圖 5-4 HMN 準確率評估的表現(xiàn)比當前主流的機器學習與深度學習模型都優(yōu)秀,并且數(shù)據(jù)集規(guī)模對深度情感分析模型有非常大影響,HMN 在數(shù)據(jù)集規(guī)模較小時難以將表現(xiàn)調到最佳。表格 5-6 HMN 準確率數(shù)據(jù)集 對比算法評估指標Accuracy F1ScoreTestFBidLSTM 0.8151 0.8082TextCNN 0.8509 0.8500BidLSTM-AM 0.8629 0.8623HMN 0.8858 0.8746AmazonSBidLSTM 0.8867 0.8793TextCNN 0.9237 0.9187
本文編號:2727653
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP18
【圖文】:
華 中 科 技 學 碩 學 位 論 但在 TestFreaks 數(shù)據(jù)集上,用 TriGrams 效果最好。實驗結果還表明 LR 在不同的數(shù)據(jù)集下從時間復雜度和準確率上都遠遠優(yōu)于 NB。
圖 5-4 HMN 準確率評估的表現(xiàn)比當前主流的機器學習與深度學習模型都優(yōu)秀,并且數(shù)據(jù)集規(guī)模對深度情感分析模型有非常大影響,HMN 在數(shù)據(jù)集規(guī)模較小時難以將表現(xiàn)調到最佳。表格 5-6 HMN 準確率數(shù)據(jù)集 對比算法評估指標Accuracy F1ScoreTestFBidLSTM 0.8151 0.8082TextCNN 0.8509 0.8500BidLSTM-AM 0.8629 0.8623HMN 0.8858 0.8746AmazonSBidLSTM 0.8867 0.8793TextCNN 0.9237 0.9187
【參考文獻】
相關碩士學位論文 前2條
1 陸宇杰;中文微博情感分析及其應用[D];華東師范大學;2013年
2 劉洪君;微博網(wǎng)絡熱點話題發(fā)現(xiàn)技術研究[D];北京交通大學;2013年
本文編號:2727653
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2727653.html
最近更新
教材專著