基于深度學(xué)習(xí)的中文微博情感分析研究
發(fā)布時(shí)間:2020-12-25 17:59
隨著信息化時(shí)代的到來,互聯(lián)網(wǎng)使用人數(shù)越來越多,數(shù)據(jù)成為商業(yè)活動(dòng)中一種重要的資源,海量的數(shù)據(jù)存在著大量有價(jià)值的信息。微博,作為一種新的社交媒體已被大眾廣泛接受。在內(nèi)容方面,微博涉及的話題豐富多樣、參與度高;從用戶角度上分析,微博可以滿足用戶的個(gè)性化要求,實(shí)時(shí)溝通交流與情感傾訴。微博傳播信息的能力十分強(qiáng)大,每天都產(chǎn)生海量的數(shù)據(jù)。通過對(duì)中文微博進(jìn)行情感分析研究,能在網(wǎng)絡(luò)輿情監(jiān)測(cè)、商品市場(chǎng)營(yíng)銷、方針政策意見反饋等方面發(fā)揮極大的作用。目前,已有的情感分析研究大多基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于規(guī)則詞典的方法,存在諸多的不足,例如標(biāo)注代價(jià)過高和移植性較差等。且中文微博具有篇幅短小、語法特殊、詞匯新穎等特點(diǎn),已有的方法不能很好地處理微博數(shù)據(jù)。為解決上述問題,本文將使用深度學(xué)習(xí)的方法,分別從情感評(píng)價(jià)對(duì)象抽取和情感分類兩個(gè)方面展開研究,具體如下:1.提出了一種基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的中文微博情感評(píng)價(jià)對(duì)象抽取方法。方法首先通過構(gòu)建雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型,將評(píng)價(jià)對(duì)象抽取任務(wù)轉(zhuǎn)化為序列標(biāo)注任務(wù);再利用注意力機(jī)制,計(jì)算注意力分配概率分布,提高序列的表達(dá)能力;最后結(jié)合機(jī)器學(xué)習(xí)方法中的條件隨機(jī)場(chǎng)算法規(guī)劃文本序列的最優(yōu)標(biāo)注路...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CRF和LSTM的對(duì)比實(shí)驗(yàn)結(jié)果;
圖 3.2 CRF 和 LSTM 的對(duì)比實(shí)驗(yàn)結(jié)果 可以看出 CRF 方法的實(shí)驗(yàn)結(jié)果中準(zhǔn)確率和召回率均比較低,,F(xiàn)1 值為 47.5%。召回率偏低的原因主要是因?yàn)槭?CRF 學(xué)習(xí)求抽取的對(duì)象較為復(fù)雜、前后跨度較大時(shí)便會(huì)有所不足,會(huì)整,當(dāng)評(píng)價(jià)對(duì)象是由多個(gè)字組成的長(zhǎng)詞語時(shí),抽取的結(jié)果可成的詞語,并不完整,從而降低準(zhǔn)確率和召回率,影響模型TM 模型在準(zhǔn)確率和召回率方面得到的值分別為 62.5%和 45.準(zhǔn)確率和召回率均優(yōu)于 CRF,增益為 3.9%和 5.4%。主要因,雖然實(shí)驗(yàn)的語料都存在評(píng)價(jià)對(duì)象復(fù)雜和前后跨度大的問適應(yīng)解決長(zhǎng)期依賴的問題,通過門結(jié)構(gòu)能夠獲得到跨度較大利用上下文信息決定當(dāng)前單元值的輸出,相較于 CRF 的局部完整的情感對(duì)象,獲得的結(jié)果更好。
圖 3.3 LSTM 和雙向 LSTM 的對(duì)比實(shí)驗(yàn)結(jié)果以看出雙向 LSTM 的準(zhǔn)確率和召回率兩方面均略優(yōu)于單 46.6%,增益為 0.6%和 1.2%。單向 LSTM 只能利用文本的狀態(tài),雙向 LSTM 模型通過實(shí)現(xiàn)兩個(gè)方向相反的 LS史的上下文的特征信息,而反向 LSTM 捕獲了未來的上 LSTM 能獲取更多的上下文特征信息,可以同時(shí)利用雙前值進(jìn)行計(jì)算,所以在準(zhǔn)確率和召回率方面均有所提高型和融合模型的對(duì)比實(shí)驗(yàn)
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合詞性特征與卷積神經(jīng)網(wǎng)絡(luò)的文本情感分析[J]. 何鴻業(yè),鄭瑾,張祖平. 計(jì)算機(jī)工程. 2018(11)
[2]基于AWCRF模型的微博情感傾向分類方法[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,梁禮欣. 計(jì)算機(jī)工程. 2017(07)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[4]基于分類關(guān)聯(lián)規(guī)則的微博情緒分析[J]. 劉思,朱福喜,陽小蘭,劉世超. 計(jì)算機(jī)工程與設(shè)計(jì). 2016(12)
[5]用于微博情感分析的一種情感語義增強(qiáng)的深度學(xué)習(xí)模型[J]. 何炎祥,孫松濤,牛菲菲,李飛. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[6]基于長(zhǎng)短期記憶多維主題情感傾向性分析模型[J]. 滕飛,鄭超美,李文. 計(jì)算機(jī)應(yīng)用. 2016(08)
[7]基于CRFs和領(lǐng)域本體的中文微博評(píng)價(jià)對(duì)象抽取研究[J]. 丁晟春,吳婧嬋媛,李霄. 中文信息學(xué)報(bào). 2016(04)
[8]基于語義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J]. 江騰蛟,萬常選,劉德喜,劉喜平,廖國(guó)瓊. 計(jì)算機(jī)學(xué)報(bào). 2017(03)
[9]基于多特征融合的中文微博評(píng)價(jià)對(duì)象抽取方法[J]. 李景玉,張仰森,蔣玉茹. 計(jì)算機(jī)應(yīng)用研究. 2016(02)
[10]基于神經(jīng)網(wǎng)絡(luò)的微博情感分析[J]. 蘇小英,孟環(huán)建. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(12)
碩士論文
[1]基于深度學(xué)習(xí)的文本情感分類研究[D]. 朱少杰.哈爾濱工業(yè)大學(xué) 2014
本文編號(hào):2938130
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CRF和LSTM的對(duì)比實(shí)驗(yàn)結(jié)果;
圖 3.2 CRF 和 LSTM 的對(duì)比實(shí)驗(yàn)結(jié)果 可以看出 CRF 方法的實(shí)驗(yàn)結(jié)果中準(zhǔn)確率和召回率均比較低,,F(xiàn)1 值為 47.5%。召回率偏低的原因主要是因?yàn)槭?CRF 學(xué)習(xí)求抽取的對(duì)象較為復(fù)雜、前后跨度較大時(shí)便會(huì)有所不足,會(huì)整,當(dāng)評(píng)價(jià)對(duì)象是由多個(gè)字組成的長(zhǎng)詞語時(shí),抽取的結(jié)果可成的詞語,并不完整,從而降低準(zhǔn)確率和召回率,影響模型TM 模型在準(zhǔn)確率和召回率方面得到的值分別為 62.5%和 45.準(zhǔn)確率和召回率均優(yōu)于 CRF,增益為 3.9%和 5.4%。主要因,雖然實(shí)驗(yàn)的語料都存在評(píng)價(jià)對(duì)象復(fù)雜和前后跨度大的問適應(yīng)解決長(zhǎng)期依賴的問題,通過門結(jié)構(gòu)能夠獲得到跨度較大利用上下文信息決定當(dāng)前單元值的輸出,相較于 CRF 的局部完整的情感對(duì)象,獲得的結(jié)果更好。
圖 3.3 LSTM 和雙向 LSTM 的對(duì)比實(shí)驗(yàn)結(jié)果以看出雙向 LSTM 的準(zhǔn)確率和召回率兩方面均略優(yōu)于單 46.6%,增益為 0.6%和 1.2%。單向 LSTM 只能利用文本的狀態(tài),雙向 LSTM 模型通過實(shí)現(xiàn)兩個(gè)方向相反的 LS史的上下文的特征信息,而反向 LSTM 捕獲了未來的上 LSTM 能獲取更多的上下文特征信息,可以同時(shí)利用雙前值進(jìn)行計(jì)算,所以在準(zhǔn)確率和召回率方面均有所提高型和融合模型的對(duì)比實(shí)驗(yàn)
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合詞性特征與卷積神經(jīng)網(wǎng)絡(luò)的文本情感分析[J]. 何鴻業(yè),鄭瑾,張祖平. 計(jì)算機(jī)工程. 2018(11)
[2]基于AWCRF模型的微博情感傾向分類方法[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,梁禮欣. 計(jì)算機(jī)工程. 2017(07)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[4]基于分類關(guān)聯(lián)規(guī)則的微博情緒分析[J]. 劉思,朱福喜,陽小蘭,劉世超. 計(jì)算機(jī)工程與設(shè)計(jì). 2016(12)
[5]用于微博情感分析的一種情感語義增強(qiáng)的深度學(xué)習(xí)模型[J]. 何炎祥,孫松濤,牛菲菲,李飛. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[6]基于長(zhǎng)短期記憶多維主題情感傾向性分析模型[J]. 滕飛,鄭超美,李文. 計(jì)算機(jī)應(yīng)用. 2016(08)
[7]基于CRFs和領(lǐng)域本體的中文微博評(píng)價(jià)對(duì)象抽取研究[J]. 丁晟春,吳婧嬋媛,李霄. 中文信息學(xué)報(bào). 2016(04)
[8]基于語義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J]. 江騰蛟,萬常選,劉德喜,劉喜平,廖國(guó)瓊. 計(jì)算機(jī)學(xué)報(bào). 2017(03)
[9]基于多特征融合的中文微博評(píng)價(jià)對(duì)象抽取方法[J]. 李景玉,張仰森,蔣玉茹. 計(jì)算機(jī)應(yīng)用研究. 2016(02)
[10]基于神經(jīng)網(wǎng)絡(luò)的微博情感分析[J]. 蘇小英,孟環(huán)建. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(12)
碩士論文
[1]基于深度學(xué)習(xí)的文本情感分類研究[D]. 朱少杰.哈爾濱工業(yè)大學(xué) 2014
本文編號(hào):2938130
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2938130.html
最近更新
教材專著