基于混合詞向量方法的細(xì)粒度短文本情感分析的研究
發(fā)布時(shí)間:2021-04-18 08:54
短文本情感分析是自然語言處理的熱點(diǎn)研究方向之一。使用基于深度學(xué)習(xí)的方法捕捉潛藏于文本的情感信息,是目前較為流行的一種短文本情感分析方法,但是它依賴數(shù)據(jù)集,在處理細(xì)粒度情感分析任務(wù)時(shí)準(zhǔn)確率較低;谇楦性~表與規(guī)則的方法常用于長文本分析。將這種方法引入細(xì)粒度短文本分析任務(wù)中,簡稱為混合詞向量方法,利用情感詞表能提取部分文本特征的特點(diǎn),針對詞向量語義稀疏的問題,改善詞向量對文本的描述能力,提高細(xì)粒度短文本情感分析的準(zhǔn)確性。用詞在詞表中的情感類別、文本的句法特征、文本包含的表情符號這幾個(gè)情感元素構(gòu)建情感元素向量,與詞向量合成,構(gòu)建混合詞向量,輸入深度學(xué)習(xí)網(wǎng)絡(luò)的Embedding層。同時(shí),采用雙向長短時(shí)記憶網(wǎng)絡(luò)搭配Attention機(jī)制構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)。使用流行的短文本數(shù)據(jù)集——中文微博——評估了混合詞向量方法的有效性與效率。將情感分析的粒度細(xì)分為厭惡、憤怒、悲傷、快樂四種,采用遠(yuǎn)監(jiān)督的方式標(biāo)注細(xì)粒度情感標(biāo)簽。實(shí)驗(yàn)證明,混合詞向量方法能夠有效改進(jìn)短文本詞向量表征能力不足以及情感特征不明顯問題,顯著改善細(xì)粒度短文本情感分析的準(zhǔn)確性,在數(shù)據(jù)集上取得了69.63%的準(zhǔn)確率,準(zhǔn)確率提升了7.12%。
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于情感詞表與規(guī)則的方法流程圖
情感分析方法法進(jìn)行文本情感分析是近年來的研究分類、文本生成、自動問答系統(tǒng)等問網(wǎng)絡(luò)的基本原理,然后介紹循環(huán)神經(jīng)ficial Neural Networks)最開始被用于生理信息的一種模型。隨后研究人員發(fā)作用。構(gòu)是對大腦神經(jīng)元的模擬,它的基礎(chǔ)結(jié)絡(luò)模型是由多個(gè)神經(jīng)元連接構(gòu)成的,
工神經(jīng)網(wǎng)絡(luò)稱為前向神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),有環(huán)的人工神經(jīng)網(wǎng)絡(luò)稱為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks)。2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)元帶有反饋機(jī)制,可以處理序列數(shù)據(jù)。與前向神經(jīng)網(wǎng)絡(luò)不同循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入為當(dāng)前時(shí)刻的輸入和之前時(shí)刻的輸出。這就意味著循環(huán)神經(jīng)網(wǎng)絡(luò)能夠處理文本上下文之間的信息,很適合文本情感分析任務(wù)的需求。循環(huán)神經(jīng)網(wǎng)絡(luò)隨時(shí)間展開的結(jié)構(gòu)如圖 2-3 所示,t 時(shí)刻的輸入為 xt,t 時(shí)刻的隱藏狀態(tài)為 ht,隱藏狀態(tài)更新的計(jì)算公式為式 2-7。 = ( + + ) (2-7)其中,U 是輸入到隱藏層的權(quán)值矩陣,W 是隱藏層到隱藏層的權(quán)值矩陣,b 是偏置項(xiàng),f 是非線性激活函數(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于微博的細(xì)粒度情感分析[J]. 敦欣卉,張?jiān)魄?楊鎧西. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(07)
[2]細(xì)粒度情感分析的酒店評論研究[J]. 李鳴,吳波,宋陽,朱夢堯,徐志廣,張宏俊. 傳感器與微系統(tǒng). 2016(12)
[3]基于句法分析的跨語言情感分析[J]. 陳強(qiáng),何炎祥,劉續(xù)樂,孫松濤,彭敏,李飛. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)
[4]中文情緒識別方法研究[J]. 劉歡歡,李壽山,周國棟,李逸薇. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(02)
[5]中文文本情感分析研究綜述[J]. 陸文星,王燕飛. 計(jì)算機(jī)應(yīng)用研究. 2012(06)
[6]面向汽車領(lǐng)域的軟文識別研究[J]. 唐都鈺,王大亮,趙凱,秦兵,劉挺. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2012(03)
[7]基于漢語情感詞表的句子情感傾向分類研究[J]. 王素格,楊安娜,李德玉. 計(jì)算機(jī)工程與應(yīng)用. 2009(24)
碩士論文
[1]基于深度學(xué)習(xí)的微博評論情感傾向性分析[D]. 胡西祥.哈爾濱工業(yè)大學(xué) 2017
[2]基于循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情文本情感分析技術(shù)研究[D]. 李松如.華僑大學(xué) 2017
[3]基于深度特征提取的文本情感極性分類研究[D]. 田竹.山東大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[5]基于深度學(xué)習(xí)的文本情感分析[D]. 王雪嬌.吉林大學(xué) 2016
[6]中文微博細(xì)粒度情感判別研究[D]. 陳闖闖.南華大學(xué) 2016
[7]面向多類標(biāo)分類的隨機(jī)森林算法研究[D]. 趙亞紅.哈爾濱工業(yè)大學(xué) 2014
[8]微博客細(xì)粒度情感分析技術(shù)的研究與實(shí)現(xiàn)[D]. 付連鵬.東北大學(xué) 2014
[9]中文微博細(xì)粒度情緒識別研究[D]. 雷龍艷.南華大學(xué) 2014
[10]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大學(xué) 2013
本文編號:3145197
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于情感詞表與規(guī)則的方法流程圖
情感分析方法法進(jìn)行文本情感分析是近年來的研究分類、文本生成、自動問答系統(tǒng)等問網(wǎng)絡(luò)的基本原理,然后介紹循環(huán)神經(jīng)ficial Neural Networks)最開始被用于生理信息的一種模型。隨后研究人員發(fā)作用。構(gòu)是對大腦神經(jīng)元的模擬,它的基礎(chǔ)結(jié)絡(luò)模型是由多個(gè)神經(jīng)元連接構(gòu)成的,
工神經(jīng)網(wǎng)絡(luò)稱為前向神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),有環(huán)的人工神經(jīng)網(wǎng)絡(luò)稱為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks)。2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)元帶有反饋機(jī)制,可以處理序列數(shù)據(jù)。與前向神經(jīng)網(wǎng)絡(luò)不同循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入為當(dāng)前時(shí)刻的輸入和之前時(shí)刻的輸出。這就意味著循環(huán)神經(jīng)網(wǎng)絡(luò)能夠處理文本上下文之間的信息,很適合文本情感分析任務(wù)的需求。循環(huán)神經(jīng)網(wǎng)絡(luò)隨時(shí)間展開的結(jié)構(gòu)如圖 2-3 所示,t 時(shí)刻的輸入為 xt,t 時(shí)刻的隱藏狀態(tài)為 ht,隱藏狀態(tài)更新的計(jì)算公式為式 2-7。 = ( + + ) (2-7)其中,U 是輸入到隱藏層的權(quán)值矩陣,W 是隱藏層到隱藏層的權(quán)值矩陣,b 是偏置項(xiàng),f 是非線性激活函數(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于微博的細(xì)粒度情感分析[J]. 敦欣卉,張?jiān)魄?楊鎧西. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(07)
[2]細(xì)粒度情感分析的酒店評論研究[J]. 李鳴,吳波,宋陽,朱夢堯,徐志廣,張宏俊. 傳感器與微系統(tǒng). 2016(12)
[3]基于句法分析的跨語言情感分析[J]. 陳強(qiáng),何炎祥,劉續(xù)樂,孫松濤,彭敏,李飛. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)
[4]中文情緒識別方法研究[J]. 劉歡歡,李壽山,周國棟,李逸薇. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(02)
[5]中文文本情感分析研究綜述[J]. 陸文星,王燕飛. 計(jì)算機(jī)應(yīng)用研究. 2012(06)
[6]面向汽車領(lǐng)域的軟文識別研究[J]. 唐都鈺,王大亮,趙凱,秦兵,劉挺. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2012(03)
[7]基于漢語情感詞表的句子情感傾向分類研究[J]. 王素格,楊安娜,李德玉. 計(jì)算機(jī)工程與應(yīng)用. 2009(24)
碩士論文
[1]基于深度學(xué)習(xí)的微博評論情感傾向性分析[D]. 胡西祥.哈爾濱工業(yè)大學(xué) 2017
[2]基于循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情文本情感分析技術(shù)研究[D]. 李松如.華僑大學(xué) 2017
[3]基于深度特征提取的文本情感極性分類研究[D]. 田竹.山東大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[5]基于深度學(xué)習(xí)的文本情感分析[D]. 王雪嬌.吉林大學(xué) 2016
[6]中文微博細(xì)粒度情感判別研究[D]. 陳闖闖.南華大學(xué) 2016
[7]面向多類標(biāo)分類的隨機(jī)森林算法研究[D]. 趙亞紅.哈爾濱工業(yè)大學(xué) 2014
[8]微博客細(xì)粒度情感分析技術(shù)的研究與實(shí)現(xiàn)[D]. 付連鵬.東北大學(xué) 2014
[9]中文微博細(xì)粒度情緒識別研究[D]. 雷龍艷.南華大學(xué) 2014
[10]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大學(xué) 2013
本文編號:3145197
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3145197.html
最近更新
教材專著