天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 統(tǒng)計學(xué)論文 >

基于Capsule Network的多源新聞評論細粒度情感分析

發(fā)布時間:2021-09-29 19:25
  伴隨著移動互聯(lián)網(wǎng)以及智能終端設(shè)備普及范圍的不斷擴大,讀者獲取新聞資訊的途徑越來越豐富,在這樣的背景下移動新聞客戶端成為了讀者最主要的新聞獲取渠道之一,相較于報紙、電視等傳統(tǒng)新聞媒介,其優(yōu)勢是新聞媒體與讀者雙方的互動更為密切,具體表現(xiàn)為讀者在閱讀新聞后通常會以發(fā)表評論的方式反饋自己的看法,同時媒體也會通過發(fā)起投票等形式主動獲取讀者的情感態(tài)度。為了幫助新聞媒體更便捷地獲取讀者的情緒反饋,同時盡可能多地挖掘出讀者評論中蘊含的價值,本文希望能夠找到一種有效的自動情感挖掘方式。文本情感分析的方法多種多樣,從依靠情感詞典及句法結(jié)構(gòu),到依賴人工挑選特征的機器學(xué)習(xí)方法,再到實現(xiàn)了自動特征提取的深度學(xué)習(xí)方法,文本情感挖掘工作越來越高效且準確性不斷提升。本文分析并總結(jié)了讀者情緒分析的研究現(xiàn)狀,結(jié)合目前深度學(xué)習(xí)領(lǐng)域新提出的膠囊神經(jīng)網(wǎng)絡(luò)模型,深入研究了對由新聞引發(fā)的讀者情緒進行自動判別的方法,主要工作內(nèi)容包括:第一,本文摒棄了傳統(tǒng)“非褒即貶”的二分類方法,綜合考慮常用的文本情感劃分方式及真實新聞評論數(shù)據(jù)集的情感分布特點,最終確定將讀者評論劃分為“憤怒”、“悲傷”、“支持”、“其他”四個類別。第二,本文融合了讀... 

【文章來源】:上海師范大學(xué)上海市

【文章頁數(shù)】:54 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于Capsule Network的多源新聞評論細粒度情感分析


技術(shù)路線圖

過程圖,膠囊,動態(tài)路由,神經(jīng)網(wǎng)絡(luò)


上海師范大學(xué)碩士學(xué)位論文第3章改進動態(tài)路由的膠囊神經(jīng)網(wǎng)絡(luò)模型16的信息損失也較為嚴重,于是膠囊神經(jīng)網(wǎng)絡(luò)摒棄了池化結(jié)構(gòu),在網(wǎng)絡(luò)間采用動態(tài)路由的方式有選擇地進行特征傳遞,增大相似度高的高層特征與低層特征之間的連接強度,實現(xiàn)對于不同類別特征的區(qū)別對待,很大程度上減少了有效信息的損失。膠囊神經(jīng)網(wǎng)絡(luò)在各層網(wǎng)絡(luò)間的特征傳遞方式如圖3-1所示:圖3-1膠囊神經(jīng)網(wǎng)絡(luò)中的動態(tài)路由過程其中iu為低層網(wǎng)絡(luò)中的向量膠囊,jv為高層網(wǎng)絡(luò)中的膠囊,實際上jv可以看作是iu的聚類中心,而動態(tài)路由實則是基于聚類思想實現(xiàn)的特征整合,實現(xiàn)由低層膠囊到高層膠囊的非線性映射。3.1.2模型結(jié)構(gòu)為了使膠囊神經(jīng)網(wǎng)絡(luò)能夠應(yīng)用于自然語言處理任務(wù)中,本文修改了其網(wǎng)絡(luò)結(jié)構(gòu),初步構(gòu)建的膠囊神經(jīng)網(wǎng)絡(luò)模型由5層網(wǎng)絡(luò)構(gòu)成,下面將分別對這5部分進行詳細介紹說明。1.N-gram卷積層膠囊神經(jīng)網(wǎng)絡(luò)中的第一層為N-gram卷積層,用于初步提取文本的局部特征。本文使用了與TextCNN相同的特征提取方式,即通過使用幾種不同窗口大小的濾波器來提取文本詞向量矩陣的N-gram特征,目的在于獲取不同粒度大小的語義信息。假設(shè)LVXR表示輸入語句的詞向量矩陣,其中L是句子的長度,V是詞向量的維度,ViXR為句子中第i個詞對應(yīng)的V維詞向量,N-gram卷積層中用于

分布情況,情感,類別,數(shù)據(jù)集


上海師范大學(xué)碩士學(xué)位論文第4章多源新聞評論細粒度情感分析27這兩類情感同“無情緒”類一同歸入“其他”類別中。在進行初步合并后發(fā)現(xiàn),由于評論文本較為簡短,絕大部分僅表達單一情感,但也存在部分評論能夠反映讀者的多種情緒。在本文采集的一萬條評論數(shù)據(jù)中有9072條表達了上述四類情感中的一種,同時有928條評論表達了兩種及以上情感,表4-2對這類帶有多重情感標(biāo)簽的評論進行了展示:表4-2表達多種情感的評論文本樣例評論文本情感類別看到他的生活環(huán)境不禁淚目,中國有如此少年何愁國不富民不強悲傷、支持拐賣孩子罪無可。『⒆硬胚@么小太讓人心疼了憤怒、悲傷一個男人打護士你好意思的嗎!支持民警拘留他!憤怒、支持于是本文最終確定將新聞評論劃分為“支持”、“憤怒”、“悲傷”、“其他”這四個類別,本文所使用的評論數(shù)據(jù)集的情感類別分布情況如圖4-1所示圖4-1讀者評論數(shù)據(jù)集情感類別分布由圖4-1可以看出,除了“其他”類別外,其余三個類別的占比較為平均,在30%左右,“其他”這一類別中包含了“恐懼”、“驚訝”、“無情緒”三類情感,其中“恐懼”與“驚訝”占比較小,“無情緒”類占全部“其他”類樣本的95.7%。

【參考文獻】:
期刊論文
[1]基于CapsNet的中文文本分類研究[J]. 馮國明,張曉冬,劉素輝.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(12)
[2]基于Word2Vec的情感詞典自動構(gòu)建與優(yōu)化[J]. 楊小平,張中夏,王良,張永俊,馬奇鳳,吳佳楠,張悅.  計算機科學(xué). 2017(01)
[3]基于語義約束LDA的商品特征和情感詞提取[J]. 彭云,萬常選,江騰蛟,劉德喜,劉喜平,廖國瓊.  軟件學(xué)報. 2017(03)
[4]基于依存句法的博文情感傾向分析研究[J]. 馮時,付永陳,陽鋒,王大玲,張一飛.  計算機研究與發(fā)展. 2012(11)
[5]基于語義理解的文本情感分類方法研究[J]. 聞彬,何婷婷,羅樂,宋樂,王倩.  計算機科學(xué). 2010(06)

碩士論文
[1]基于依存句法的句子級細粒度情感計算[D]. 趙黎光.華南理工大學(xué) 2015



本文編號:3414325

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3414325.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7d349***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com