天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于主題模型的文本情感分析研究

發(fā)布時(shí)間:2018-07-07 23:24

  本文選題:文本情感分析 + 主題情感混合模型; 參考:《太原理工大學(xué)》2017年碩士論文


【摘要】:互聯(lián)網(wǎng)中各類評(píng)論信息數(shù)量巨大、變化迅速,海量的評(píng)論表達(dá)著信息發(fā)布者的情感傾向,這些信息對(duì)于政府部門的輿情監(jiān)控、企業(yè)的經(jīng)營(yíng)決策和個(gè)人的購(gòu)買決定,都起著至關(guān)重要的作用。但通過(guò)人工收集分析這些數(shù)據(jù)不僅成本較高,也無(wú)法滿足時(shí)效性要求,因此文本情感分析受到了學(xué)術(shù)界與工業(yè)界的廣泛關(guān)注。主題模型是能夠從大規(guī)模離散數(shù)據(jù)集中自動(dòng)提取隱含語(yǔ)義信息的生成概率模型。近年來(lái),主題模型在文本分類、圖像分類、熱點(diǎn)事件監(jiān)測(cè)、多文檔自動(dòng)文摘、推薦系統(tǒng)等領(lǐng)域得到了廣泛應(yīng)用。主題情感混合模型以主題模型為基礎(chǔ),可以無(wú)監(jiān)督地提取語(yǔ)料的主題信息和對(duì)應(yīng)的情感傾向,在文本情感分析領(lǐng)域得到了越來(lái)越多的關(guān)注。本文針對(duì)長(zhǎng)文本和短文本的不同特性,分別提出了詞加權(quán)LDA算法(Weighted Latent Dirichlet Allocation Algorithm,WLDA)和BJSTM模型(Biterm Joint Sentiment Topic Model,BJSTM)。針對(duì)長(zhǎng)文本,本文針對(duì)現(xiàn)有主題/情感聯(lián)合分析方法中主題間區(qū)分度較低的問題提出了WLDA算法。通過(guò)在吉布斯采樣中對(duì)不同詞匯賦予不同權(quán)重,增強(qiáng)了具有情感傾向的詞匯在采樣過(guò)程中的影響,從而改善了主題間的區(qū)分性。實(shí)驗(yàn)表明,與JST模型(Joint Sentiment/Topic model,JST)相比,WLDA不僅在采樣中迭代速度快,也能夠更好地實(shí)現(xiàn)主題提取和情感分類。由于短文本具有稀疏性,面向短文本的主題/情感聯(lián)合分析方法較少,本文針對(duì)這一問題提出適用于短文本的BJSTM模型。該方法為BTM模型(Biterm Topic Model,BTM)增加情感層,對(duì)每個(gè)雙詞的情感和主題進(jìn)行采樣。BJSTM模型充分利用了語(yǔ)料級(jí)別的豐富詞匯共現(xiàn)和詞頻信息,從某種程度上降低了短文本特征稀疏對(duì)主題/情感聯(lián)合分析的影響。實(shí)驗(yàn)表明,與JST和SSTM(Short-text sentiment-topic model,SSTM)相比,BJSTM模型在情感分類和主題關(guān)鍵詞提取方面都取得了良好效果。
[Abstract]:There are a lot of comments on the Internet, which are changing rapidly and expressing the emotional tendency of the information publishers. These comments monitor the public opinion of the government, the business decisions of the enterprises and the purchase decisions of the individuals. All play a vital role. However, it is not only expensive to collect and analyze these data manually, but also can not meet the requirements of timeliness. Therefore, text emotional analysis has been widely concerned by academia and industry. Topic model is a generation probability model which can automatically extract implicit semantic information from large scale discrete data sets. In recent years, topic models have been widely used in the fields of text classification, image classification, hot spot event monitoring, multi-document automatic summarization, recommendation system and so on. Subject emotion mixed model is based on topic model, which can extract subject information and corresponding emotional tendency of corpus without supervision, and has been paid more and more attention in the field of text emotion analysis. According to the different characteristics of long text and short text, this paper presents weighted Latent Dirichlet Allocation algorithm WLDA and BJSTM (BJSTM). For the long text, the WLDA algorithm is proposed to solve the problem of low discrimination among the existing methods of topic / emotion joint analysis. By assigning different weights to different words in Gibbs sampling, the influence of affective predisposition words on the sampling process is enhanced, and the distinction between subjects is improved. Experimental results show that WLDA not only has a faster iterative speed in sampling than JST (Joint topic Model JST), but also can achieve better topic extraction and emotional classification. Due to the sparsity of short text and the lack of subject / emotion joint analysis methods for short text, a BJSTM model for short text is proposed in this paper. This method adds affective layer to BTM (Biterm topic Model BTM), and takes full advantage of the abundant lexical co-occurrence and word frequency information at corpus level. To some extent, it reduces the influence of the sparse text features on the thematic / emotional joint analysis. The experimental results show that the BJSTM model has a good effect on emotion classification and topic keyword extraction compared with JST and SSTM (Short-text sentiment-topic Model SSTM).
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 邵華;李楊;丁遠(yuǎn);劉鳳臣;;基于詞對(duì)主題模型的中分辨率遙感影像土地利用分類[J];農(nóng)業(yè)工程學(xué)報(bào);2016年22期

2 王亞民;胡悅;;基于BTM的微博輿情熱點(diǎn)發(fā)現(xiàn)[J];情報(bào)雜志;2016年11期

3 吳斌;吉佳;孟琳;石川;趙惠東;李儀清;;基于遷移學(xué)習(xí)的唐詩(shī)宋詞情感分析[J];電子學(xué)報(bào);2016年11期

4 王杰;李德玉;王素格;;面向非平衡文本情感分類的TSF特征選擇方法[J];計(jì)算機(jī)科學(xué);2016年10期

5 李博;陳志剛;黃瑞;鄭祥云;;基于LDA模型的音樂推薦算法[J];計(jì)算機(jī)工程;2016年06期

6 熊蜀峰;姬東鴻;;面向產(chǎn)品評(píng)論分析的短文本情感主題模型[J];自動(dòng)化學(xué)報(bào);2016年08期

7 江騰蛟;萬(wàn)常選;劉德喜;劉喜平;廖國(guó)瓊;;基于語(yǔ)義分析的評(píng)價(jià)對(duì)象-情感詞對(duì)抽取[J];計(jì)算機(jī)學(xué)報(bào);2017年03期

8 馬長(zhǎng)林;謝羅迪;王夢(mèng);司琪;;基于主題情感混合模型的細(xì)粒度觀點(diǎn)挖掘[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年S1期

9 歐陽(yáng)繼紅;劉燕輝;李熙銘;周曉堂;;基于LDA的多粒度主題情感混合模型[J];電子學(xué)報(bào);2015年09期

10 梁軍;柴玉梅;原慧斌;高明磊;昝紅英;;基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J];中文信息學(xué)報(bào);2015年05期

相關(guān)博士學(xué)位論文 前2條

1 張小平;主題模型及其在中醫(yī)臨床診療中的應(yīng)用研究[D];北京交通大學(xué);2011年

2 張紫瓊;在線中文評(píng)論情感分類問題研究[D];哈爾濱工業(yè)大學(xué);2010年

相關(guān)碩士學(xué)位論文 前3條

1 朱琥珀;基于主題模型的新聞標(biāo)題分類方法研究[D];安徽大學(xué);2016年

2 徐宇婷;基于排序主題模型的自動(dòng)文摘及評(píng)價(jià)系統(tǒng)[D];大連海事大學(xué);2014年

3 商任翔;基于主題模型的中醫(yī)藥隱含語(yǔ)義信息挖掘[D];浙江大學(xué);2013年

,

本文編號(hào):2106617

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2106617.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶962aa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日本妇女高清一区二区三区| 中文字幕精品人妻一区| 日韩中文无线码在线视频| 亚洲午夜福利视频在线| 久久精品国产第一区二区三区| 久久99精品日韩人妻| 九九热这里只有免费精品| 午夜资源在线观看免费高清| 日本免费熟女一区二区三区| 精品人妻久久一品二品三品| 国产精品色热综合在线| 尤物天堂av一区二区| 色欧美一区二区三区在线| 东京热电东京热一区二区三区| 亚洲日本中文字幕视频在线观看 | 99久热只有精品视频最新| 日本精品中文字幕人妻| 久久精品国产熟女精品| 午夜福利视频日本一区| 国产欧洲亚洲日产一区二区| 麻豆tv传媒在线观看| 欧美有码黄片免费在线视频| 亚洲一区二区精品国产av| 国产欧美日韩在线一区二区| 日韩人妻精品免费一区二区三区 | 男人和女人草逼免费视频| 亚洲天堂精品一区二区| 中文字幕日产乱码一区二区| 亚洲国产中文字幕在线观看| 国产美女网红精品演绎| 黄色国产一区二区三区| 熟女一区二区三区国产| 最近日韩在线免费黄片| 九九九热视频最新在线| 激情内射亚洲一区二区三区| 亚洲中文字幕有码在线观看| 不卡中文字幕在线免费看| 中文字幕五月婷婷免费| 国产精品激情在线观看| 久久精品伊人一区二区| 亚洲中文字幕高清乱码毛片|