天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學(xué)習(xí)的文本情緒多標(biāo)簽分類方法研究

發(fā)布時(shí)間:2020-03-19 13:25
【摘要】:互聯(lián)網(wǎng)的快速發(fā)展給電子商務(wù)平臺和社交平臺注入了新的活力,交互網(wǎng)站的數(shù)量迅速增加,人們越來越傾向于通過社交媒介來發(fā)表自己的意見和看法。因此,大量的包含人們情感和情緒的文本數(shù)據(jù)累積于互聯(lián)網(wǎng)上,如何有效的利用自然語言處理技術(shù)來分析和挖掘這類數(shù)據(jù)并提取出有價(jià)值的信息,已經(jīng)成為網(wǎng)絡(luò)輿情監(jiān)控、用戶消費(fèi)行為分析和電子商務(wù)交互等領(lǐng)域關(guān)注的熱點(diǎn)課題。對于文本情感分析而言,傳統(tǒng)的基于單標(biāo)簽的有監(jiān)督學(xué)習(xí)方法已經(jīng)難以滿足多樣性的文本處理需求,開展對文本的情感和情緒進(jìn)行多標(biāo)簽分類具有重要的理論意義和應(yīng)用價(jià)值。在自然語言處理領(lǐng)域,深度學(xué)習(xí)技術(shù)可將文本數(shù)據(jù)進(jìn)行分布式表示,再通過構(gòu)建復(fù)雜網(wǎng)絡(luò)來學(xué)習(xí)數(shù)據(jù)的深層次抽象特征,以避免繁瑣的特征構(gòu)建工作。因此,本文基于深度學(xué)習(xí)方法,開展文本情緒的多標(biāo)簽分類方法研究。具體內(nèi)容和結(jié)論如下:(1)文本情緒多標(biāo)簽分類問題分析。通過對文本情感數(shù)據(jù)的分析,對文本中存在的多種情感信息,確定了以細(xì)粒度的方式來進(jìn)行文本的情感分類。(2)融合標(biāo)簽特征的情緒多標(biāo)簽分類。當(dāng)文本對應(yīng)多個(gè)情感標(biāo)簽時(shí),每個(gè)標(biāo)簽都包含著文本的不同信息,標(biāo)簽中的信息量相對較大,合理的利用標(biāo)簽特征將更加有利于文本的表示,從而提高文本多標(biāo)簽分類的性能。本文提出一種融合標(biāo)簽特征的卷積神經(jīng)網(wǎng)絡(luò)模型的情緒文本多標(biāo)簽分類方法。該方法利用卷積神經(jīng)網(wǎng)絡(luò)對文本及其對應(yīng)的情緒標(biāo)簽分別進(jìn)行特征抽取,最后將情緒文本特征和標(biāo)簽特征融合作為對文本的整體表示對文本的多標(biāo)簽進(jìn)行分類。我們在NLPCC2014的中文微博情緒分析數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),平均精確率達(dá)到了0.6227,從而表明了使用標(biāo)簽特征的CNN模型可以提升微博情緒分類的性能。(3)分層注意力的LSTM文本多標(biāo)簽分類。為了利用句子的結(jié)構(gòu)和層次信息對文本進(jìn)行深層次的表示,同時(shí)又利用標(biāo)簽之間的相關(guān)性信息,本文給出一種基于層次結(jié)構(gòu)和注意力模型的循環(huán)神經(jīng)網(wǎng)絡(luò)的文本情緒多標(biāo)簽分類方法。該方法分為編碼和解碼兩個(gè)過程,編碼過程將情緒文本從詞到句子,再到文本逐層進(jìn)行表示,并加入詞到句子的注意力以及句子到文本的注意力,自下向上對情緒文本進(jìn)行表示。解碼時(shí)使用循環(huán)神經(jīng)網(wǎng)絡(luò)對文本進(jìn)行多標(biāo)簽表示。在文獻(xiàn)[47]數(shù)據(jù)集上,平均精確率達(dá)到了0.6086。
【圖文】:

模型圖,模型圖,上下文信息


術(shù) 的文本表示從大量的文本中挖掘文本的情緒信息,對一的形式以方便計(jì)算機(jī)去讀取和處理這些法之一,它能夠?qū)⒏呔S的稀疏空間上的詞,大大降低了詞表示的復(fù)雜度。2013 年,出世,它利用詞的上下文信息在百萬級和度量出詞與詞之間的相似性,收到很多 N了深度學(xué)習(xí)技術(shù)在自然語言處理領(lǐng)域的快分別為:CBOW 模型和 Skip-gram 模型。型使用詞的上下文信息來預(yù)測中心詞,其詞對應(yīng)的詞向量,而輸出就是這特定的一

模型圖,模型圖


圖 2.2 Skip-gram 模型圖為一種詞向量表示方法,它在訓(xùn)練時(shí)不僅利用的順序信息和語義信息,因而它能夠更加準(zhǔn)上提高了 NLP 任務(wù)的性能,本文使用 word量。46]等人模擬人腦處理信號時(shí)的分層處理機(jī)制,出深度學(xué)習(xí)的概念。隨著深度學(xué)習(xí)技術(shù)的不深度學(xué)習(xí)的主要模型之一,卷積神經(jīng)網(wǎng)絡(luò)在于是研究人員逐漸開始將其應(yīng)用于其他領(lǐng)域文本分類任務(wù)中,并取得了不錯(cuò)的分類性能結(jié)構(gòu):輸入層、卷積層、池化層、輸出層。入文本句子中詞語的詞向量,這些詞向量既可
【學(xué)位授予單位】:山西大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.1;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 汪明霓;BASIC文本系統(tǒng)[J];計(jì)算機(jī)應(yīng)用研究;1988年01期

2 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期

3 婁道國;李若斌;劉冰;張冬冬;;云計(jì)算下各分散文本數(shù)據(jù)的全方位集成融合方法[J];科技通報(bào);2019年02期

4 潘大勝;;不確定噪聲下海量文本數(shù)據(jù)的模糊挖掘算法研究[J];微電子學(xué)與計(jì)算機(jī);2017年09期

5 王珊珊;馮利鑫;;基于新詞識別的大數(shù)據(jù)聊天文本輿情熱點(diǎn)挖掘[J];電子商務(wù);2018年01期

6 陳曉峰;如何在flash中讀入外部文本數(shù)據(jù)[J];電腦知識與技術(shù);2004年13期

7 馬欣欣;林克;;大文本數(shù)據(jù)快速分析統(tǒng)計(jì)理論與算法[J];電子元器件與信息技術(shù);2019年01期

8 施瑞朗;;基于社交平臺數(shù)據(jù)的文本分類算法研究[J];電子科技;2018年10期

9 張玉紅;陳偉;胡學(xué)鋼;;一種面向不完全標(biāo)記的文本數(shù)據(jù)流自適應(yīng)分類方法[J];計(jì)算機(jī)科學(xué);2016年12期

10 袁鵬;江媛媛;;多元化文本數(shù)據(jù)的智能提取[J];測繪與空間地理信息;2015年09期

相關(guān)會議論文 前10條

1 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國控制與決策學(xué)術(shù)年會論文集[C];1997年

2 陳光強(qiáng);楊樹強(qiáng);張曉輝;李潤恒;賈焰;;面向海量文本數(shù)據(jù)的多任務(wù)并行調(diào)度加載技術(shù)研究與實(shí)現(xiàn)[A];第15屆全國信息存儲技術(shù)學(xué)術(shù)會議論文集[C];2008年

3 周純潔;黎],

本文編號:2590282


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2590282.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶89c2d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com