基于改進(jìn)的Multi-Channel CNN-LSTM模型在Twitter文本情感分析中的應(yīng)用
發(fā)布時(shí)間:2022-02-10 15:50
近年來隨著4G技術(shù)的大規(guī)模商用和移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,社交媒體平臺(tái)每天產(chǎn)生海量用戶社交信息。為了及時(shí)了解人們的看法和情緒傾向,需要對(duì)用戶發(fā)表的觀點(diǎn)進(jìn)行文本情感分析。基于情感詞典和機(jī)器學(xué)習(xí)為代表的傳統(tǒng)情感分析方法存在一些不足,如嚴(yán)重依賴情感詞典及人工維護(hù)文本特征。當(dāng)前,以CNN-LSTM為代表的深度學(xué)習(xí)模型彌補(bǔ)了傳統(tǒng)方法的缺陷,但在不同情感粒度單元的側(cè)重點(diǎn)不同,而忽視了整體情感判斷。本文提出了基于Multi-Channel CNN-LSTM的英文文本情感分析方法,具體創(chuàng)新點(diǎn)如下:1、目前使用廣泛的單通道CNN-LSTM在特殊語境下表現(xiàn)不佳,這是因?yàn)樵~中所蘊(yùn)涵的信息不足,某些字信息結(jié)合單詞信息可以更好地分析。本文將其改為多輸入通道,分為詞通道和字通道,使得能夠同時(shí)接受詞級(jí)別(word-level)向量和字級(jí)別(char-level)向量進(jìn)行分析,再將兩個(gè)通道輸出向量進(jìn)行融合,進(jìn)入全連接層和Softmax層進(jìn)行分類。此舉能解決依賴分詞質(zhì)量和不能有效處理序列數(shù)據(jù)的問題。經(jīng)過改進(jìn)后的模型與CNN-LSTM模型對(duì)比,能夠在Sentiment140數(shù)據(jù)集上將Accuracy指標(biāo)從0.81提升至0.8...
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Onehot矩陣圖示
圖 2-2 卷積圖示的特征矩陣 ,卷積核大小為 k×k,填充(padding)輸出矩陣大小為 N×N,那么有:21M p kNstep 入 5×5 的特征矩陣,使用 3×3 大小的卷積核進(jìn)行adding),那么輸出矩陣的維度 N=(5-3)/1+1=3,即 的矩陣。以圖中黑色矩形框選的部分為例,將框住,再將每一位相乘的結(jié)果相加,就是輸出矩陣對(duì)應(yīng)) ×5+0×4+1×2+(-1) ×3+0×4+1×5=0,所以輸出期記憶理論[41]最早由Hochreiter和Schmidhuber等人
圖 2-4 Attention 計(jì)算過程率分布的時(shí)候,由于對(duì)于輸入句子 X 中任意制的模型理論上表現(xiàn)更好,但也存在一定問低等問題,特別是訓(xùn)練樣本量非常大的時(shí)候語言處理與文本情感分析子領(lǐng)域里應(yīng)用比較技術(shù)、卷積神經(jīng)網(wǎng)絡(luò)模型、LSTM 模型和 A背景、發(fā)展歷程、數(shù)學(xué)原理推導(dǎo)與證明、所模型或技術(shù)的細(xì)節(jié)、特點(diǎn)、優(yōu)勢和劣勢。并對(duì)包含字嵌入,是將單詞(字符)文本映射到
本文編號(hào):3619107
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Onehot矩陣圖示
圖 2-2 卷積圖示的特征矩陣 ,卷積核大小為 k×k,填充(padding)輸出矩陣大小為 N×N,那么有:21M p kNstep 入 5×5 的特征矩陣,使用 3×3 大小的卷積核進(jìn)行adding),那么輸出矩陣的維度 N=(5-3)/1+1=3,即 的矩陣。以圖中黑色矩形框選的部分為例,將框住,再將每一位相乘的結(jié)果相加,就是輸出矩陣對(duì)應(yīng)) ×5+0×4+1×2+(-1) ×3+0×4+1×5=0,所以輸出期記憶理論[41]最早由Hochreiter和Schmidhuber等人
圖 2-4 Attention 計(jì)算過程率分布的時(shí)候,由于對(duì)于輸入句子 X 中任意制的模型理論上表現(xiàn)更好,但也存在一定問低等問題,特別是訓(xùn)練樣本量非常大的時(shí)候語言處理與文本情感分析子領(lǐng)域里應(yīng)用比較技術(shù)、卷積神經(jīng)網(wǎng)絡(luò)模型、LSTM 模型和 A背景、發(fā)展歷程、數(shù)學(xué)原理推導(dǎo)與證明、所模型或技術(shù)的細(xì)節(jié)、特點(diǎn)、優(yōu)勢和劣勢。并對(duì)包含字嵌入,是將單詞(字符)文本映射到
本文編號(hào):3619107
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3619107.html
最近更新
教材專著