天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

微博短文本細(xì)粒度情感分析

發(fā)布時(shí)間:2018-05-11 19:08

  本文選題:微博短文本 + 機(jī)器學(xué)習(xí) ; 參考:《北京郵電大學(xué)》2016年碩士論文


【摘要】:微博作為是移動互聯(lián)網(wǎng)起步最早也發(fā)展最快的業(yè)務(wù)之一,在經(jīng)歷了最初幾年的高速增長和熱捧之后,一度有些沉寂。但是,伴隨著4G網(wǎng)絡(luò)、WiFi網(wǎng)絡(luò)大規(guī)模覆蓋,移動終端智能設(shè)備的極速增長,越來越多的人頻繁地使用微博。移動端用戶的增長,讓微博有了日活躍用戶超過1億的基礎(chǔ);谠擙嫶蟮挠脩羧后w,利用微博文本對用戶進(jìn)行情感分析,不僅有利于新生代商業(yè)模式探索、社會輿情監(jiān)控與分析,而且對人工智能發(fā)展的積極意義也不容小覷。文本情感分析為人工智能在人類情感領(lǐng)域的探索做出了積極的貢獻(xiàn)。微博具有典型的網(wǎng)絡(luò)語言特點(diǎn),語法規(guī)范性差、口語化、新詞匯層出不窮、大量的表情符號和文本噪聲等。基于傳統(tǒng)規(guī)范書面語言詞典的微博情感分析效果差強(qiáng)人意。為了解決這個(gè)問題,本文一方面通過對傳統(tǒng)情感詞典進(jìn)行網(wǎng)絡(luò)語言的擴(kuò)充,構(gòu)建了新的適用于微博文本分析的詞典,并通過實(shí)驗(yàn)驗(yàn)證了詞典的有效性;另一方面,使用對特殊情感詞匯依賴性小的遞歸自動編碼機(jī)(Recursive Autoencoder,RAE)模型,性能得到了提高。含有否定詞的文本情感判別較.為復(fù)雜,否定詞的加入可能使原文本情感極性發(fā)生轉(zhuǎn)變,也可能極性保持不變,程度有所削弱。傳統(tǒng)本文傳統(tǒng)的情感分析方法通常對文本模型進(jìn)行簡化,假設(shè)一個(gè)詞語僅和其前一個(gè)詞語有關(guān),對含有否定詞的文本的積極/消極判別較差。遞歸神經(jīng)張量網(wǎng)絡(luò)(Recursive Neural Tensor Network,RNTN)模型沒有進(jìn)行類似簡化,保持了詞向量之間的強(qiáng)相關(guān)性。本文通過對RNTN模型的訓(xùn)練,使其在含有否定詞中文文本情感極性判別上達(dá)到了 80.7%的精度。RNTN模型對詞語或短語級細(xì)粒度情感分析上表現(xiàn)出色,而且不需要大量的人工標(biāo)注;RAE模型作為較為成熟的深度學(xué)習(xí)模型,拋棄了傳統(tǒng)的詞袋模型,利用層次結(jié)構(gòu)和成分語義來進(jìn)行情感分類;SVM作為傳統(tǒng)機(jī)器學(xué)習(xí)方法,通用性強(qiáng),適用范圍廣。結(jié)合以上方法的特點(diǎn)以及情感分類的任務(wù)目標(biāo),本文設(shè)計(jì)了微博短文本的雙極性、細(xì)粒度情感分類方案,首先使用SVM對微博篇章進(jìn)行主客觀分類,RAE和RNTN對判定為主觀情感的文本的每一個(gè)句子進(jìn)行正負(fù)極性判斷,并選出極性最強(qiáng)的句子,該句子的情感極性即為整個(gè)微博的情感極性。若RAE和RNTN評判語句極性一致,即為最終結(jié)果。本文設(shè)計(jì)方案F值、召回率、準(zhǔn)確率均高于基于融合特征的方法。通過實(shí)驗(yàn)證明了系統(tǒng)的可行性和高效性。
[Abstract]:As one of the earliest and fastest growing mobile Internet services, Weibo has been quiet for a while after its rapid growth and popularity in the first few years. However, with the large-scale coverage of 4G networks and the rapid growth of smart devices in mobile terminals, more and more people frequently use Weibo. The growth of mobile users has given Weibo a daily base of more than 100m active users. Based on this huge group of users, the use of Weibo text for emotional analysis of users is not only conducive to the exploration of the new generation of business models, monitoring and analysis of social public opinion, but also positive significance for the development of artificial intelligence can not be underestimated. Text emotion analysis has made a positive contribution to the exploration of artificial intelligence in the field of human emotion. Weibo has the characteristics of typical network language, poor grammar, colloquial, new vocabulary, a large number of emoji and text noise and so on. The effect of Weibo affective analysis based on the traditional standard written language dictionary is unsatisfactory. In order to solve this problem, on the one hand, this paper constructs a new dictionary suitable for Weibo text analysis by extending the traditional emotional dictionary, and proves the validity of the dictionary through experiments; on the other hand, The performance is improved by using the recursive autocoder rae model, which has small dependency on special emotional vocabulary. The text emotion discriminates with negative words. For complexity, the addition of negative words may change the emotional polarity of the original text, or keep the polarity unchanged, and weaken the degree of the original text. The traditional affective analysis method in this paper usually simplifies the text model, assuming that a word is only related to the previous word, and the positive / negative discrimination of the text containing negative words is poor. Recursive Neural Tensor Network (RNT) model of recurrent neural Zhang Liang network is not simplified, and the strong correlation between word vectors is maintained. In this paper, the RNTN model is trained to achieve a precision of 80.7% in judging the affective polarity of the Chinese text with negative words. The model performs well in the fine-grained emotional analysis of words or phrases. Moreover, it does not need a large number of manual tagged rae model as a more mature in-depth learning model, abandoned the traditional word bag model, using hierarchical structure and component semantics to carry out emotion classification and SVM as the traditional machine learning method, it has strong generality. The scope of application is wide. Combining the characteristics of the above methods and the task goal of emotion classification, this paper designs a bipolar, fine-grained emotional classification scheme for Weibo short text. Firstly, SVM is used to classify Weibo texts subjectively and objectively. Rae and RNTN judge each sentence as subjective and negative, and select the most polar sentence. The emotional polarity of the sentence is the emotional polarity of the whole Weibo. If the polarity of RAE and RNTN judgment statements is the same, it is the final result. In this paper, F value, recall rate and accuracy are higher than those based on fusion feature. The feasibility and efficiency of the system are proved by experiments.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1;TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王寧;鈔柯;羅嬪;;實(shí)現(xiàn)細(xì)粒度訪問控制的元模型研究[J];大連理工大學(xué)學(xué)報(bào);2012年03期

2 孫偉;李艷靈;周文勇;;細(xì)粒度基于傳遞功能的約束委托模型[J];信陽師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2013年03期

3 夏汛;陳玲;;基于攔截器的細(xì)粒度權(quán)限設(shè)計(jì)[J];福建電腦;2012年11期

4 歐陽純萍;陽小華;雷龍艷;徐強(qiáng);余穎;劉志明;;多策略中文微博細(xì)粒度情緒分析研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期

5 史大偉;袁天偉;;一種粗細(xì)粒度結(jié)合的動態(tài)污點(diǎn)分析方法[J];計(jì)算機(jī)工程;2014年03期

6 原子;于莉莉;劉超;;引入缺陷的細(xì)粒度軟件變更識別方法[J];北京航空航天大學(xué)學(xué)報(bào);2014年09期

7 戢彥泓,郭常杰,鐘玉琢,孫立峰;基于細(xì)粒度可擴(kuò)展編碼的多源視頻流化方案[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年04期

8 涂登彪;譚光明;孫凝暉;;無鎖同步的細(xì)粒度并行介度中心算法[J];軟件學(xué)報(bào);2011年05期

9 張宇軒;魏廷存;樊曉椏;張萌;;面向流體系的細(xì)粒度異步訪存調(diào)度[J];計(jì)算機(jī)應(yīng)用研究;2012年03期

10 王寬;;基于細(xì)粒度調(diào)整的同步播放控制算法[J];山西電子技術(shù);2008年05期

相關(guān)會議論文 前10條

1 張智軍;沈f ;朱偉;;文本組織方式對介紹性文章搜索績效的影響研究[A];中國人類工效學(xué)學(xué)會第六次學(xué)術(shù)交流會論文摘要匯編[C];2003年

2 岳福新;白玫;;淺析英語旅游信息文本的寫作與翻譯[A];譯學(xué)辭典與翻譯研究——第四屆全國翻譯學(xué)辭典與翻譯理論研討會論文集[C];2007年

3 劉全升;姚天f ;黃高輝;劉軍;宋鴻彥;;漢語意見型主觀性文本類型體系的研究[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會會議論文集[C];2008年

4 葉蘊(yùn)芳;楊榆;羅鑫;徐國愛;;Appfuse系統(tǒng)中細(xì)粒度權(quán)限控制的研究與實(shí)現(xiàn)[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年

5 江偉玉;高能;劉澤藝;林雪燕;;一種云計(jì)算中的多重身份認(rèn)證與授權(quán)方案[A];第27次全國計(jì)算機(jī)安全學(xué)術(shù)交流會論文集[C];2012年

6 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細(xì)粒度并行結(jié)構(gòu)與實(shí)現(xiàn)[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年

7 李俊青;謝圣獻(xiàn);劉廣亮;陳晨;;P2P網(wǎng)絡(luò)基于蟻群優(yōu)化的動態(tài)細(xì)粒度訪問控制框架[A];2008年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2008年

8 房毅憲;王寶文;王永茂;;基于偏差遞歸神經(jīng)網(wǎng)絡(luò)的股價(jià)預(yù)測(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年

9 劉勇;沈毅;胡恒章;;遞歸神經(jīng)網(wǎng)絡(luò)自適應(yīng)濾波器[A];1998年中國智能自動化學(xué)術(shù)會議論文集(上冊)[C];1998年

10 趙英凱;蔡寧;;基于對角遞歸神經(jīng)網(wǎng)絡(luò)的肟化投酮量在線預(yù)估[A];1998年中國智能自動化學(xué)術(shù)會議論文集(上冊)[C];1998年

相關(guān)重要報(bào)紙文章 前10條

1 李承貴;學(xué)術(shù)視域中的文本[N];社會科學(xué)報(bào);2001年

2 山東 王霞;巧將文本數(shù)值變數(shù)字[N];電子報(bào);2006年

3 江蘇 許向前;在課件中讓文本滾動起來[N];電腦報(bào);2004年

4 趙曉濤;巡展中的三大熱門[N];網(wǎng)絡(luò)世界;2007年

5 遼寧 鳴澗;為光盤制作漂亮的封套[N];電腦報(bào);2002年

6 ;制作CD封套[N];電腦報(bào);2002年

7 廣東 Pcking;FlashMX 2004新功能實(shí)戰(zhàn)[N];電腦報(bào);2003年

8 王先明 李尹蒂;關(guān)于義和團(tuán)各種記憶文本類型比較[N];團(tuán)結(jié)報(bào);2010年

9 樂天邋編譯;編織一張更好的Web[N];計(jì)算機(jī)世界;2007年

10 黎驪/文 [美] Tom M.Mitchell 著;機(jī)器學(xué)習(xí)與智能化社會[N];中國郵政報(bào);2003年

相關(guān)博士學(xué)位論文 前10條

1 付興兵;基于屬性基加密的細(xì)粒度訪問控制機(jī)制研究[D];電子科技大學(xué);2016年

2 閆琰;基于深度學(xué)習(xí)的文本表示與分類方法研究[D];北京科技大學(xué);2016年

3 劉健;基于近似文本分析的意見挖掘[D];上海大學(xué);2007年

4 陳潔倩;閱讀理解的文本類型和答題形式對外語水平的效力[D];上海外國語大學(xué);2006年

5 時(shí)杰;關(guān)系數(shù)據(jù)庫細(xì)粒度訪問控制研究[D];華中科技大學(xué);2010年

6 劉桂蘭;論重譯的世俗化取向[D];上海外國語大學(xué);2011年

7 朱倩;面向自由文本的細(xì)粒度關(guān)系抽取的關(guān)鍵技術(shù)研究[D];江蘇大學(xué);2011年

8 余a\;基于Simulink模型的細(xì)粒度多線程技術(shù)研究[D];浙江大學(xué);2014年

9 趙永昌;一類時(shí)滯靜態(tài)遞歸神經(jīng)網(wǎng)絡(luò)的動力學(xué)行為研究[D];中國海洋大學(xué);2010年

10 高海賓;擾動作用下遞歸神經(jīng)網(wǎng)絡(luò)穩(wěn)定性研究[D];燕山大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 左正;微博短文本細(xì)粒度情感分析[D];北京郵電大學(xué);2016年

2 趙黎光;基于依存句法的句子級細(xì)粒度情感計(jì)算[D];華南理工大學(xué);2015年

3 李星宇;一種細(xì)粒度Cloud-RAN框架與關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2014年

4 酈麗珍;基于Open vSwitch虛擬網(wǎng)絡(luò)的細(xì)粒度訪問控制[D];復(fù)旦大學(xué);2013年

5 姚亮;數(shù)據(jù)訪問控制中基于中間代理的用戶撤銷方法[D];西安電子科技大學(xué);2014年

6 占文平;面向產(chǎn)品評論的情感分析技術(shù)研究[D];浙江工商大學(xué);2015年

7 廖純;基于句法和語義的話題細(xì)粒度情感分析的研究[D];北京理工大學(xué);2016年

8 李毅;屬性層級觀點(diǎn)挖掘技術(shù)的研究與應(yīng)用[D];石家莊鐵道大學(xué);2016年

9 周志華;聊天系統(tǒng)文本情感細(xì)粒度分類研究與應(yīng)用[D];西南交通大學(xué);2015年

10 康海蒙;基于細(xì)粒度監(jiān)控的Spark優(yōu)化研究[D];哈爾濱工業(yè)大學(xué);2016年

,

本文編號:1875200

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1875200.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8aa18***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com