天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

面向微博短文本的情感新詞發(fā)現(xiàn)與傾向性研究

發(fā)布時(shí)間:2019-04-29 12:51
【摘要】:在社交網(wǎng)絡(luò)風(fēng)靡全球的時(shí)代,涌現(xiàn)出許多新的詞語甚至新的表情符號(hào),他們往往伴隨著社會(huì)熱點(diǎn)新聞一起出現(xiàn),就像是網(wǎng)絡(luò)輿論的風(fēng)向標(biāo)。如何有效地從海量微博信息中提取網(wǎng)絡(luò)新詞并進(jìn)行情感分析,對(duì)于微博內(nèi)容的話題追蹤、輿情分析等起到重要作用。這些新詞包含著比較強(qiáng)烈的情感,在一定程度上代表了用戶的情感。然而現(xiàn)有的文本傾向性分析主要集中在產(chǎn)品評(píng)論、新聞報(bào)道等領(lǐng)域,目前針對(duì)微博新詞的傾向性分析仍采用傳統(tǒng)的方法,缺少對(duì)微博新詞相關(guān)特征的分析,故而效果較差。本文的主要研究工作包含以下三個(gè)方面:第一,本文設(shè)計(jì)并實(shí)現(xiàn)了一種基于重復(fù)串統(tǒng)計(jì)的方法抽取候選新詞,使用廣義后綴樹抽取所有可能的候選詞串。第二,本文提出了一種語言規(guī)則與統(tǒng)計(jì)結(jié)合的新詞檢測算法對(duì)候選新詞進(jìn)行過濾。本文對(duì)比了幾種經(jīng)典統(tǒng)計(jì)量在新詞檢測時(shí)的表現(xiàn),最終選擇互信息作為內(nèi)部統(tǒng)計(jì)量、左右鄰接信息熵作為外部統(tǒng)計(jì)量。本文還在對(duì)普通新詞與情感新詞的區(qū)分上進(jìn)行了思考與分析。第三,最后,本文在實(shí)踐的基礎(chǔ)上,提出了一種基于神經(jīng)網(wǎng)絡(luò)的新詞情感判定算法。利用情感新詞的上下文信息對(duì)情感詞進(jìn)行極性判定,使用詞向量來表征新詞的語義與語法特征,該方法有效地結(jié)合了局部上下文與全局上下文信息。本文采用多原語言模型通過對(duì)上下文聚類來確定詞匯的多義詞向量,以此對(duì)新詞進(jìn)行語義上的解析,判定其在不同上下文中的情感傾向。
[Abstract]:In the age of social networks sweeping the world, many new words and even new emojis have emerged. They often come along with the social hot news, just like the vane of online public opinion. How to effectively extract new words from massive Weibo information and carry out emotional analysis plays an important role in the topic tracking and public opinion analysis of Weibo content. These neologisms contain strong emotions, which to some extent represent the feelings of the user. However, the existing text orientation analysis mainly focuses on the field of product review, news report and so on. At present, the traditional method is still used for the tendency analysis of Weibo neologisms, and the analysis of the related features of Weibo neologisms is lacking, so the effect is poor. The main research work of this paper includes the following three aspects: first, this paper designs and implements a method based on repeated string statistics to extract candidate new words, and uses generalized suffix tree to extract all possible candidate strings. Secondly, this paper proposes a new word detection algorithm based on the combination of language rules and statistics to filter the candidate neologisms. This paper compares the performance of several classical statistics in neologism detection, and finally chooses mutual information as internal statistic and left and right adjacency information entropy as external statistic. This paper also thinks and analyzes the distinction between ordinary neologisms and emotional neologisms. Thirdly, on the basis of practice, this paper proposes a new word emotion decision algorithm based on neural network. Using the context information of emotion new words to judge the polarity of emotion words, the word vector is used to represent the semantic and grammatical features of the new words. This method combines the local context and the global context information effectively. In this paper, a multi-source language model is used to determine the polysemous vector of words by clustering the context, and then the semantic analysis of new words is carried out to determine their affective tendency in different contexts.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 周超;嚴(yán)馨;余正濤;洪旭東;線巖團(tuán);;融合詞頻特性及鄰接變化數(shù)的微博新詞識(shí)別[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2015年03期

2 楊陽;劉龍飛;魏現(xiàn)輝;林鴻飛;;基于詞向量的情感新詞發(fā)現(xiàn)方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2014年11期

3 張海軍;劉戰(zhàn)東;木妮娜;;基于逐層剪枝的中文高頻重復(fù)模式快速提取算法[J];計(jì)算機(jī)科學(xué);2014年05期

4 霍帥;張敏;劉奕群;馬少平;;基于微博內(nèi)容的新詞發(fā)現(xiàn)方法[J];模式識(shí)別與人工智能;2014年02期

5 安艷輝;高雙喜;劉宗敏;;基于BP網(wǎng)絡(luò)的字符識(shí)別系統(tǒng)設(shè)計(jì)[J];河北省科學(xué)院學(xué)報(bào);2012年01期

6 紀(jì)娟;;神經(jīng)網(wǎng)絡(luò)模型在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中的應(yīng)用[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2011年01期

7 林自芳;蔣秀鳳;;基于詞內(nèi)部模式的新詞識(shí)別[J];計(jì)算機(jī)與現(xiàn)代化;2010年11期

8 王素格;李德玉;魏英杰;宋曉雷;;基于同義詞的詞匯情感傾向判別方法[J];中文信息學(xué)報(bào);2009年05期

9 賀敏;龔才春;張華平;程學(xué)旗;;一種基于大規(guī)模語料的新詞識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2007年21期

10 羅智勇;宋柔;;基于多特征的自適應(yīng)新詞識(shí)別[J];北京工業(yè)大學(xué)學(xué)報(bào);2007年07期

相關(guān)碩士學(xué)位論文 前7條

1 杜振雷;面向微博短文本的情感分析研究[D];北京信息科技大學(xué);2013年

2 蘇其龍;微博新詞發(fā)現(xiàn)研究[D];哈爾濱工業(yè)大學(xué);2013年

3 薩合多拉·木巴拉克;基于條件隨機(jī)域算法的哈薩克語基本形容詞短語的識(shí)別[D];新疆大學(xué);2013年

4 唐都鈺;領(lǐng)域自適應(yīng)的中文情感分析詞典構(gòu)建研究[D];哈爾濱工業(yè)大學(xué);2012年

5 丁溪源;基于大規(guī)模語料的中文新詞抽取算法的設(shè)計(jì)與實(shí)現(xiàn)[D];南京理工大學(xué);2011年

6 劉利剛;中文名實(shí)體識(shí)別與新詞發(fā)現(xiàn)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年

7 崔世起;中文新詞檢測與分析[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年

,

本文編號(hào):2468257

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2468257.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d09c3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲精品有码中文字幕在线观看| 久久精品久久精品中文字幕| 欧美国产日产综合精品| 日本高清视频在线播放| 激情五月激情婷婷丁香| 婷婷伊人综合中文字幕| 男人和女人干逼的视频| 亚洲一区在线观看蜜桃| 欧美做爰猛烈叫床大尺度| 婷婷九月在线中文字幕| 欧美国产日产综合精品| 午夜精品福利视频观看| 欧美日韩国产自拍亚洲| 国产精品福利精品福利| 久草热视频这里只有精品| 亚洲综合伊人五月天中文| 国产精品亚洲综合天堂夜夜| 日本高清二区视频久二区| 成人精品视频在线观看不卡| 国产日韩中文视频一区| 亚洲熟女一区二区三四区| 麻豆果冻传媒一二三区| 午夜视频成人在线免费| 亚洲国产成人爱av在线播放下载| 欧美一区二区黑人在线| 国产不卡最新在线视频| 暴力性生活在线免费视频| 亚洲日本中文字幕视频在线观看| 亚洲精品偷拍视频免费观看| 中文字幕人妻av不卡| 色婷婷丁香激情五月天| 大香伊蕉欧美一区二区三区| 国产日韩欧美在线播放| 日韩一区二区三区在线日| 日本一区不卡在线观看| 亚洲中文在线男人的天堂| 99精品人妻少妇一区二区人人妻| 九九热精彩视频在线免费| 日本一区不卡在线观看| 激情五月天免费在线观看| 亚洲欧美日产综合在线网|