基于混合神經網絡和BERT的文本方面級情感分析研究
發(fā)布時間:2021-12-09 22:58
隨著互聯(lián)網技術的發(fā)展,人類社會正邁進高度智能化和信息化階段。文本作為凝練的信息載體,一直都是人們信息交流的主要媒介。目前互聯(lián)網上積累了海量文本數據,其中包含了人們對商品、服務各方面的情感傾向。研究文本中的情感傾向能夠幫助商戶或服務提供方做出相關決策,具有重要商業(yè)價值和學術研究意義。近年來,文本方面級情感分析(Aspect-based Sentiment Analysis,ABSA)備受學者們的關注,其旨在分類出文本在不同方面上表達的情感傾向,更加貼近實際應用。根據方面的表述方式,ABSA可分為:方面詞情感分析(Aspect-term Sentiment Analysis,ATSA)和方面類別情感分析(Aspect-category Sentiment Analysis,ACSA)。ABSA的傳統(tǒng)解決方法通常為基于情感詞典方法和基于特征提取的機器學習方法;谇楦性~典方法的性能非常依賴于詞典的質量,基于特征提取的機器學習方法需要繁重的特征工程。針對傳統(tǒng)方法中的問題,深度學習方法可通過設計良好的模型來自動學習、提取與任務相關的特征,并突破傳統(tǒng)方法的性能瓶頸。因此,本文主要研究基于深度學習相...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:82 頁
【學位級別】:碩士
【部分圖文】:
圖1.1基于神經網絡的語言模型??Peters等[6丨提出越于多層雙向LSTM的深層語言模沏ELMo?(Embeddings?from??
量化技術的相關理論;其次介紹深度學習中常見的祌經網絡結構和原理,為后??面泥合祌經網絡的提出做準備;然后介紹祌經H絡的相關優(yōu)化方法和防止過擬合的??Dropout策略的原理;最后介紹應用在NLP任務上的兩類常用注意力機制,為后而??的BERT模型介紹和改進內容做準備。??2.1文本情感分析??文本情感分析實質是實現文本分類,旨在分類出文本屮的情感傾向。本文所要??研宄的方面級情感分析是其中的一類重要任務,根據Medhat等H和Xue等[2]對文本??情感分析的分級,可以大致總結為如圖2.1所示的幾類。??C?\??^?文檔級??r—??交本丨I?i感分析^??句子級??N.?/?^?方面詞情感分析1??、?方面級?^^??v.?;?\?? ̄方面類別情感分析?????y??圖2.1文本情感分析分類??文檔級情感分析旨在分類出主題文檔中的積極或者消極情感。句子級情感分析??分為兩步,首先確定句子中是否包含主觀觀點,如果包含則對其情感態(tài)度進行分析。??因為句子與短文檔具有等價關系,所以文捫級和切f級怙感分析本質相同,可以將??句子當作短文檔來進行文檔級情感分析。但是兩者都是將文本看作為一個整體來進??行分析,即一段文本對應一個情感傾向。??方面級情感分析旨在分類出文本在某些方面上的情感,并分為兩種情況。例如??在文本“這家店的食物雖然好吃,但是地段不行,找不到停車的地方”小,m明顯??其中既包含了積極情感又包含消極情感,所以文擋級和句子級情感分析相關方法不??適用于該文本。一種情況,方面類別情感分析通過賦予例如“菜品”、“位置”等情??感類別來對文本中不同類別進行細粒度的情感分類,使文本可以分
比于分詞更加直??接,一般情況下利用特定的標點符號來對段落進行切割。但是對于復雜的段落文本,??其中還有很多未考慮到的斷句模式,所以還需要設計正則表達式來對句子中需要被??斷句的部分進行精準分句。正則表達式描述的是一種字符串匹配的模式,如式2.1??所示,該表達式匹配的是常見的句子結尾標點符號。??[〇???!?\.?! ̄ ̄]|(/.{3})?(2.1)??2.3文本詞向置化技術??在NLP領域中很多深度學習模型都需要詞向量作為輸入。詞向量化是一類語??言建模和特征學習技術,如圖2.2所示,將詞匯表中的每個單詞映射至包含語義的??向量空間,相似的詞之間距離更近。這類技術通過轉置矩陣將高維度稀疏的詞向量??空間轉化為一個低維度稠密的詞向量空間。高維度的同向量為詞的獨熱編(One-??hot?Encoding),?即每個詞獨占一個維度,所以隨著詞匯表的擴大,每個詞向景呈現??高維度稀疏特性,不利于作為深度學習模型的輸入特征。??y?^???榨汁機??.z橙〒橘?子??水果7^/^?蘋果??Z—\果肉_,??圖2.2三維詞向量示意??11??
【參考文獻】:
期刊論文
[1]基于方面級的餐廳用戶評論細粒度情感分析[J]. 袁丁,章劍林,吳廣建. 軟件. 2019(08)
[2]一種用于基于方面情感分析的深度分層網絡模型[J]. 劉全,梁斌,徐進,周倩. 計算機學報. 2018(12)
碩士論文
[1]基于深度學習的文本情感分析研究及應用[D]. 楊騰佼.電子科技大學 2019
本文編號:3531461
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:82 頁
【學位級別】:碩士
【部分圖文】:
圖1.1基于神經網絡的語言模型??Peters等[6丨提出越于多層雙向LSTM的深層語言模沏ELMo?(Embeddings?from??
量化技術的相關理論;其次介紹深度學習中常見的祌經網絡結構和原理,為后??面泥合祌經網絡的提出做準備;然后介紹祌經H絡的相關優(yōu)化方法和防止過擬合的??Dropout策略的原理;最后介紹應用在NLP任務上的兩類常用注意力機制,為后而??的BERT模型介紹和改進內容做準備。??2.1文本情感分析??文本情感分析實質是實現文本分類,旨在分類出文本屮的情感傾向。本文所要??研宄的方面級情感分析是其中的一類重要任務,根據Medhat等H和Xue等[2]對文本??情感分析的分級,可以大致總結為如圖2.1所示的幾類。??C?\??^?文檔級??r—??交本丨I?i感分析^??句子級??N.?/?^?方面詞情感分析1??、?方面級?^^??v.?;?\?? ̄方面類別情感分析?????y??圖2.1文本情感分析分類??文檔級情感分析旨在分類出主題文檔中的積極或者消極情感。句子級情感分析??分為兩步,首先確定句子中是否包含主觀觀點,如果包含則對其情感態(tài)度進行分析。??因為句子與短文檔具有等價關系,所以文捫級和切f級怙感分析本質相同,可以將??句子當作短文檔來進行文檔級情感分析。但是兩者都是將文本看作為一個整體來進??行分析,即一段文本對應一個情感傾向。??方面級情感分析旨在分類出文本在某些方面上的情感,并分為兩種情況。例如??在文本“這家店的食物雖然好吃,但是地段不行,找不到停車的地方”小,m明顯??其中既包含了積極情感又包含消極情感,所以文擋級和句子級情感分析相關方法不??適用于該文本。一種情況,方面類別情感分析通過賦予例如“菜品”、“位置”等情??感類別來對文本中不同類別進行細粒度的情感分類,使文本可以分
比于分詞更加直??接,一般情況下利用特定的標點符號來對段落進行切割。但是對于復雜的段落文本,??其中還有很多未考慮到的斷句模式,所以還需要設計正則表達式來對句子中需要被??斷句的部分進行精準分句。正則表達式描述的是一種字符串匹配的模式,如式2.1??所示,該表達式匹配的是常見的句子結尾標點符號。??[〇???!?\.?! ̄ ̄]|(/.{3})?(2.1)??2.3文本詞向置化技術??在NLP領域中很多深度學習模型都需要詞向量作為輸入。詞向量化是一類語??言建模和特征學習技術,如圖2.2所示,將詞匯表中的每個單詞映射至包含語義的??向量空間,相似的詞之間距離更近。這類技術通過轉置矩陣將高維度稀疏的詞向量??空間轉化為一個低維度稠密的詞向量空間。高維度的同向量為詞的獨熱編(One-??hot?Encoding),?即每個詞獨占一個維度,所以隨著詞匯表的擴大,每個詞向景呈現??高維度稀疏特性,不利于作為深度學習模型的輸入特征。??y?^???榨汁機??.z橙〒橘?子??水果7^/^?蘋果??Z—\果肉_,??圖2.2三維詞向量示意??11??
【參考文獻】:
期刊論文
[1]基于方面級的餐廳用戶評論細粒度情感分析[J]. 袁丁,章劍林,吳廣建. 軟件. 2019(08)
[2]一種用于基于方面情感分析的深度分層網絡模型[J]. 劉全,梁斌,徐進,周倩. 計算機學報. 2018(12)
碩士論文
[1]基于深度學習的文本情感分析研究及應用[D]. 楊騰佼.電子科技大學 2019
本文編號:3531461
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3531461.html