基于混合神經(jīng)網(wǎng)絡(luò)和BERT的文本方面級情感分析研究
發(fā)布時間:2021-12-09 22:58
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人類社會正邁進(jìn)高度智能化和信息化階段。文本作為凝練的信息載體,一直都是人們信息交流的主要媒介。目前互聯(lián)網(wǎng)上積累了海量文本數(shù)據(jù),其中包含了人們對商品、服務(wù)各方面的情感傾向。研究文本中的情感傾向能夠幫助商戶或服務(wù)提供方做出相關(guān)決策,具有重要商業(yè)價值和學(xué)術(shù)研究意義。近年來,文本方面級情感分析(Aspect-based Sentiment Analysis,ABSA)備受學(xué)者們的關(guān)注,其旨在分類出文本在不同方面上表達(dá)的情感傾向,更加貼近實(shí)際應(yīng)用。根據(jù)方面的表述方式,ABSA可分為:方面詞情感分析(Aspect-term Sentiment Analysis,ATSA)和方面類別情感分析(Aspect-category Sentiment Analysis,ACSA)。ABSA的傳統(tǒng)解決方法通常為基于情感詞典方法和基于特征提取的機(jī)器學(xué)習(xí)方法;谇楦性~典方法的性能非常依賴于詞典的質(zhì)量,基于特征提取的機(jī)器學(xué)習(xí)方法需要繁重的特征工程。針對傳統(tǒng)方法中的問題,深度學(xué)習(xí)方法可通過設(shè)計(jì)良好的模型來自動學(xué)習(xí)、提取與任務(wù)相關(guān)的特征,并突破傳統(tǒng)方法的性能瓶頸。因此,本文主要研究基于深度學(xué)習(xí)相...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1基于神經(jīng)網(wǎng)絡(luò)的語言模型??Peters等[6丨提出越于多層雙向LSTM的深層語言模沏ELMo?(Embeddings?from??
量化技術(shù)的相關(guān)理論;其次介紹深度學(xué)習(xí)中常見的祌經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和原理,為后??面泥合祌經(jīng)網(wǎng)絡(luò)的提出做準(zhǔn)備;然后介紹祌經(jīng)H絡(luò)的相關(guān)優(yōu)化方法和防止過擬合的??Dropout策略的原理;最后介紹應(yīng)用在NLP任務(wù)上的兩類常用注意力機(jī)制,為后而??的BERT模型介紹和改進(jìn)內(nèi)容做準(zhǔn)備。??2.1文本情感分析??文本情感分析實(shí)質(zhì)是實(shí)現(xiàn)文本分類,旨在分類出文本屮的情感傾向。本文所要??研宄的方面級情感分析是其中的一類重要任務(wù),根據(jù)Medhat等H和Xue等[2]對文本??情感分析的分級,可以大致總結(jié)為如圖2.1所示的幾類。??C?\??^?文檔級??r—??交本丨I?i感分析^??句子級??N.?/?^?方面詞情感分析1??、?方面級?^^??v.?;?\?? ̄方面類別情感分析?????y??圖2.1文本情感分析分類??文檔級情感分析旨在分類出主題文檔中的積極或者消極情感。句子級情感分析??分為兩步,首先確定句子中是否包含主觀觀點(diǎn),如果包含則對其情感態(tài)度進(jìn)行分析。??因?yàn)榫渥优c短文檔具有等價關(guān)系,所以文捫級和切f級怙感分析本質(zhì)相同,可以將??句子當(dāng)作短文檔來進(jìn)行文檔級情感分析。但是兩者都是將文本看作為一個整體來進(jìn)??行分析,即一段文本對應(yīng)一個情感傾向。??方面級情感分析旨在分類出文本在某些方面上的情感,并分為兩種情況。例如??在文本“這家店的食物雖然好吃,但是地段不行,找不到停車的地方”小,m明顯??其中既包含了積極情感又包含消極情感,所以文擋級和句子級情感分析相關(guān)方法不??適用于該文本。一種情況,方面類別情感分析通過賦予例如“菜品”、“位置”等情??感類別來對文本中不同類別進(jìn)行細(xì)粒度的情感分類,使文本可以分
比于分詞更加直??接,一般情況下利用特定的標(biāo)點(diǎn)符號來對段落進(jìn)行切割。但是對于復(fù)雜的段落文本,??其中還有很多未考慮到的斷句模式,所以還需要設(shè)計(jì)正則表達(dá)式來對句子中需要被??斷句的部分進(jìn)行精準(zhǔn)分句。正則表達(dá)式描述的是一種字符串匹配的模式,如式2.1??所示,該表達(dá)式匹配的是常見的句子結(jié)尾標(biāo)點(diǎn)符號。??[〇???!?\.?! ̄ ̄]|(/.{3})?(2.1)??2.3文本詞向置化技術(shù)??在NLP領(lǐng)域中很多深度學(xué)習(xí)模型都需要詞向量作為輸入。詞向量化是一類語??言建模和特征學(xué)習(xí)技術(shù),如圖2.2所示,將詞匯表中的每個單詞映射至包含語義的??向量空間,相似的詞之間距離更近。這類技術(shù)通過轉(zhuǎn)置矩陣將高維度稀疏的詞向量??空間轉(zhuǎn)化為一個低維度稠密的詞向量空間。高維度的同向量為詞的獨(dú)熱編(One-??hot?Encoding),?即每個詞獨(dú)占一個維度,所以隨著詞匯表的擴(kuò)大,每個詞向景呈現(xiàn)??高維度稀疏特性,不利于作為深度學(xué)習(xí)模型的輸入特征。??y?^???榨汁機(jī)??.z橙〒橘?子??水果7^/^?蘋果??Z—\果肉_,??圖2.2三維詞向量示意??11??
【參考文獻(xiàn)】:
期刊論文
[1]基于方面級的餐廳用戶評論細(xì)粒度情感分析[J]. 袁丁,章劍林,吳廣建. 軟件. 2019(08)
[2]一種用于基于方面情感分析的深度分層網(wǎng)絡(luò)模型[J]. 劉全,梁斌,徐進(jìn),周倩. 計(jì)算機(jī)學(xué)報. 2018(12)
碩士論文
[1]基于深度學(xué)習(xí)的文本情感分析研究及應(yīng)用[D]. 楊騰佼.電子科技大學(xué) 2019
本文編號:3531461
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1基于神經(jīng)網(wǎng)絡(luò)的語言模型??Peters等[6丨提出越于多層雙向LSTM的深層語言模沏ELMo?(Embeddings?from??
量化技術(shù)的相關(guān)理論;其次介紹深度學(xué)習(xí)中常見的祌經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和原理,為后??面泥合祌經(jīng)網(wǎng)絡(luò)的提出做準(zhǔn)備;然后介紹祌經(jīng)H絡(luò)的相關(guān)優(yōu)化方法和防止過擬合的??Dropout策略的原理;最后介紹應(yīng)用在NLP任務(wù)上的兩類常用注意力機(jī)制,為后而??的BERT模型介紹和改進(jìn)內(nèi)容做準(zhǔn)備。??2.1文本情感分析??文本情感分析實(shí)質(zhì)是實(shí)現(xiàn)文本分類,旨在分類出文本屮的情感傾向。本文所要??研宄的方面級情感分析是其中的一類重要任務(wù),根據(jù)Medhat等H和Xue等[2]對文本??情感分析的分級,可以大致總結(jié)為如圖2.1所示的幾類。??C?\??^?文檔級??r—??交本丨I?i感分析^??句子級??N.?/?^?方面詞情感分析1??、?方面級?^^??v.?;?\?? ̄方面類別情感分析?????y??圖2.1文本情感分析分類??文檔級情感分析旨在分類出主題文檔中的積極或者消極情感。句子級情感分析??分為兩步,首先確定句子中是否包含主觀觀點(diǎn),如果包含則對其情感態(tài)度進(jìn)行分析。??因?yàn)榫渥优c短文檔具有等價關(guān)系,所以文捫級和切f級怙感分析本質(zhì)相同,可以將??句子當(dāng)作短文檔來進(jìn)行文檔級情感分析。但是兩者都是將文本看作為一個整體來進(jìn)??行分析,即一段文本對應(yīng)一個情感傾向。??方面級情感分析旨在分類出文本在某些方面上的情感,并分為兩種情況。例如??在文本“這家店的食物雖然好吃,但是地段不行,找不到停車的地方”小,m明顯??其中既包含了積極情感又包含消極情感,所以文擋級和句子級情感分析相關(guān)方法不??適用于該文本。一種情況,方面類別情感分析通過賦予例如“菜品”、“位置”等情??感類別來對文本中不同類別進(jìn)行細(xì)粒度的情感分類,使文本可以分
比于分詞更加直??接,一般情況下利用特定的標(biāo)點(diǎn)符號來對段落進(jìn)行切割。但是對于復(fù)雜的段落文本,??其中還有很多未考慮到的斷句模式,所以還需要設(shè)計(jì)正則表達(dá)式來對句子中需要被??斷句的部分進(jìn)行精準(zhǔn)分句。正則表達(dá)式描述的是一種字符串匹配的模式,如式2.1??所示,該表達(dá)式匹配的是常見的句子結(jié)尾標(biāo)點(diǎn)符號。??[〇???!?\.?! ̄ ̄]|(/.{3})?(2.1)??2.3文本詞向置化技術(shù)??在NLP領(lǐng)域中很多深度學(xué)習(xí)模型都需要詞向量作為輸入。詞向量化是一類語??言建模和特征學(xué)習(xí)技術(shù),如圖2.2所示,將詞匯表中的每個單詞映射至包含語義的??向量空間,相似的詞之間距離更近。這類技術(shù)通過轉(zhuǎn)置矩陣將高維度稀疏的詞向量??空間轉(zhuǎn)化為一個低維度稠密的詞向量空間。高維度的同向量為詞的獨(dú)熱編(One-??hot?Encoding),?即每個詞獨(dú)占一個維度,所以隨著詞匯表的擴(kuò)大,每個詞向景呈現(xiàn)??高維度稀疏特性,不利于作為深度學(xué)習(xí)模型的輸入特征。??y?^???榨汁機(jī)??.z橙〒橘?子??水果7^/^?蘋果??Z—\果肉_,??圖2.2三維詞向量示意??11??
【參考文獻(xiàn)】:
期刊論文
[1]基于方面級的餐廳用戶評論細(xì)粒度情感分析[J]. 袁丁,章劍林,吳廣建. 軟件. 2019(08)
[2]一種用于基于方面情感分析的深度分層網(wǎng)絡(luò)模型[J]. 劉全,梁斌,徐進(jìn),周倩. 計(jì)算機(jī)學(xué)報. 2018(12)
碩士論文
[1]基于深度學(xué)習(xí)的文本情感分析研究及應(yīng)用[D]. 楊騰佼.電子科技大學(xué) 2019
本文編號:3531461
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3531461.html
最近更新
教材專著