細(xì)粒度文本情感分析問題研究
發(fā)布時(shí)間:2021-08-28 09:43
隨著在線社交網(wǎng)絡(luò)的興起,大量的用戶在互聯(lián)網(wǎng)上發(fā)表文字表達(dá)自己的情感,其中既包含對(duì)生活、事件的情緒抒發(fā),又包含對(duì)產(chǎn)品各個(gè)方面的使用體驗(yàn)和評(píng)價(jià)。這些情感表達(dá)為文本情感分析研究提供了數(shù)據(jù)基礎(chǔ)。文本情感分析研究人們?cè)谖谋局斜磉_(dá)的情感、態(tài)度、觀點(diǎn)、情緒。細(xì)粒度情感分析是其中一個(gè)細(xì)分領(lǐng)域,研究細(xì)粒度的情感。細(xì)粒度情感分析在任務(wù)定義上、數(shù)據(jù)準(zhǔn)備上、方法有效性上,依然面臨著很多困難和挑戰(zhàn)。首先,針對(duì)細(xì)粒度情感極性的文本情緒分類研究,可用于抽取文本中的情緒,相關(guān)研究在輿情監(jiān)控中有較大的應(yīng)用價(jià)值。此前的情緒分類研究假設(shè)了文本中只有一種情緒,本文發(fā)現(xiàn)了社交網(wǎng)絡(luò)文本中包含多種情緒的現(xiàn)象。如何識(shí)別文本包含的所有情緒種類,尤其針對(duì)短文本的場(chǎng)景,是具有挑戰(zhàn)的。其次,如何將多種情感和方面對(duì)應(yīng)起來,此為方面級(jí)情感分析問題,這是針對(duì)細(xì)粒度情感對(duì)象的研究,它可進(jìn)一步分為兩類:針對(duì)方面詞和針對(duì)方面類別的情感分析。如何設(shè)計(jì)統(tǒng)一的方法,同時(shí)解決兩種方面級(jí)情感分析問題具有挑戰(zhàn)性。此外,方面級(jí)情感分析研究假設(shè)了文本中僅包含一種實(shí)體,然而社交網(wǎng)絡(luò)中,存在對(duì)多個(gè)實(shí)體、多個(gè)方面表達(dá)出多種情感的現(xiàn)象,如何有效建模、如何設(shè)計(jì)方法解決該問題也存...
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:129 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1:情感分析常見研宄問題??
圖1.3:論文主要工作與組織結(jié)構(gòu)關(guān)系圖??期記憶網(wǎng)絡(luò)建模上下文表示,利用多輪更新優(yōu)化實(shí)體和方面表示,并最終預(yù)測(cè)??情感。實(shí)驗(yàn)表明該方法的效果顯著優(yōu)于基線方法。進(jìn)一步研宄表明,本文的方??法在訓(xùn)練數(shù)據(jù)匱乏的(實(shí)體,方面)組合上表現(xiàn)出出色的結(jié)果,意味著實(shí)際應(yīng)??用中,數(shù)據(jù)標(biāo)注工作可以大幅簡(jiǎn)化。??第六章進(jìn)一步研宂實(shí)體方面級(jí)情感分析。相關(guān)研宄表明,多種端到端的深??度學(xué)習(xí)模型在復(fù)雜文本上效果表現(xiàn)均不理想。本文針對(duì)這一挑戰(zhàn),提出把依??存句法分析技術(shù)和端到端的深度學(xué)習(xí)相結(jié)合,構(gòu)建了?DT-CEA算法。DT-CEA??算法的主要思想是引入了基于依存樹的距離,使得基于位置的注意力層可以??有效解決長(zhǎng)插入語(yǔ)、長(zhǎng)定語(yǔ)造成的注意力分配偏差;同時(shí),借鑒了依存橋的思??想,構(gòu)建了依存門,控制依存信息的保留程度,通過對(duì)依存連接關(guān)系、依存方??向、依存類型的建模,修改了?LSTM算法中的隱藏層節(jié)點(diǎn)計(jì)算機(jī)制。實(shí)驗(yàn)表明,??DT-CEA將依存句法信息融入模型,可以有效地提升效果。尤其是在復(fù)雜文本??上和長(zhǎng)文本上,DT-CEA的優(yōu)勢(shì)格外明顯。??
Ut?=?WhyK?+?by?(2.15)??其中丨V和b是參數(shù),//是隱藏層的計(jì)算函數(shù)。圖2.3是循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意??圖。??循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度消失和梯度爆炸問題,研究者們?cè)O(shè)計(jì)了很多變體,??例如門控循環(huán)單元(GRU)?[89]、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)丨90]等,以及他們??的多層、雙向變體。??2.2.2門控循環(huán)單元??門控循環(huán)單兀(Gated?Recurrent?Unit,GRU)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種變體,??21??
【參考文獻(xiàn)】:
期刊論文
[1]基于表情符注意力機(jī)制的微博情感分析模型[J]. 譚皓,鄧樹文,錢濤,姬東鴻. 計(jì)算機(jī)應(yīng)用研究. 2019(09)
[2]融合Bi-LSTM和位置關(guān)系的對(duì)象級(jí)情感分析[J]. 鮑豪,李少童. 信息系統(tǒng)工程. 2018(03)
[3]一種用于基于方面情感分析的深度分層網(wǎng)絡(luò)模型[J]. 劉全,梁斌,徐進(jìn),周倩. 計(jì)算機(jī)學(xué)報(bào). 2018(12)
[4]面向變異短文本的快速聚類算法[J]. 黃永光,劉挺,車萬(wàn)翔,胡曉光. 中文信息學(xué)報(bào). 2007(02)
本文編號(hào):3368278
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:129 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1:情感分析常見研宄問題??
圖1.3:論文主要工作與組織結(jié)構(gòu)關(guān)系圖??期記憶網(wǎng)絡(luò)建模上下文表示,利用多輪更新優(yōu)化實(shí)體和方面表示,并最終預(yù)測(cè)??情感。實(shí)驗(yàn)表明該方法的效果顯著優(yōu)于基線方法。進(jìn)一步研宄表明,本文的方??法在訓(xùn)練數(shù)據(jù)匱乏的(實(shí)體,方面)組合上表現(xiàn)出出色的結(jié)果,意味著實(shí)際應(yīng)??用中,數(shù)據(jù)標(biāo)注工作可以大幅簡(jiǎn)化。??第六章進(jìn)一步研宂實(shí)體方面級(jí)情感分析。相關(guān)研宄表明,多種端到端的深??度學(xué)習(xí)模型在復(fù)雜文本上效果表現(xiàn)均不理想。本文針對(duì)這一挑戰(zhàn),提出把依??存句法分析技術(shù)和端到端的深度學(xué)習(xí)相結(jié)合,構(gòu)建了?DT-CEA算法。DT-CEA??算法的主要思想是引入了基于依存樹的距離,使得基于位置的注意力層可以??有效解決長(zhǎng)插入語(yǔ)、長(zhǎng)定語(yǔ)造成的注意力分配偏差;同時(shí),借鑒了依存橋的思??想,構(gòu)建了依存門,控制依存信息的保留程度,通過對(duì)依存連接關(guān)系、依存方??向、依存類型的建模,修改了?LSTM算法中的隱藏層節(jié)點(diǎn)計(jì)算機(jī)制。實(shí)驗(yàn)表明,??DT-CEA將依存句法信息融入模型,可以有效地提升效果。尤其是在復(fù)雜文本??上和長(zhǎng)文本上,DT-CEA的優(yōu)勢(shì)格外明顯。??
Ut?=?WhyK?+?by?(2.15)??其中丨V和b是參數(shù),//是隱藏層的計(jì)算函數(shù)。圖2.3是循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意??圖。??循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度消失和梯度爆炸問題,研究者們?cè)O(shè)計(jì)了很多變體,??例如門控循環(huán)單元(GRU)?[89]、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)丨90]等,以及他們??的多層、雙向變體。??2.2.2門控循環(huán)單元??門控循環(huán)單兀(Gated?Recurrent?Unit,GRU)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種變體,??21??
【參考文獻(xiàn)】:
期刊論文
[1]基于表情符注意力機(jī)制的微博情感分析模型[J]. 譚皓,鄧樹文,錢濤,姬東鴻. 計(jì)算機(jī)應(yīng)用研究. 2019(09)
[2]融合Bi-LSTM和位置關(guān)系的對(duì)象級(jí)情感分析[J]. 鮑豪,李少童. 信息系統(tǒng)工程. 2018(03)
[3]一種用于基于方面情感分析的深度分層網(wǎng)絡(luò)模型[J]. 劉全,梁斌,徐進(jìn),周倩. 計(jì)算機(jī)學(xué)報(bào). 2018(12)
[4]面向變異短文本的快速聚類算法[J]. 黃永光,劉挺,車萬(wàn)翔,胡曉光. 中文信息學(xué)報(bào). 2007(02)
本文編號(hào):3368278
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3368278.html
最近更新
教材專著