天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于深度學(xué)習(xí)的文本情感分析

發(fā)布時間:2018-02-28 22:18

  本文關(guān)鍵詞: 文本情感分析 深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) 循環(huán)神經(jīng)網(wǎng)絡(luò) 出處:《吉林大學(xué)》2016年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著Web 2.0時代的蓬勃發(fā)展,互聯(lián)網(wǎng)上出現(xiàn)了大量的數(shù)據(jù)。人們在博客,微博,產(chǎn)品評論,電影評論,網(wǎng)絡(luò)討論群等區(qū)域留下了非常多的文本信息。這些非結(jié)構(gòu)化的文本中包含了作者的思想,情感,觀點以及看法。如果能夠從這些非結(jié)構(gòu)化的數(shù)據(jù)中提取出情感數(shù)據(jù),將會推動自動抉擇支持、網(wǎng)絡(luò)輿情風(fēng)險分析、信息預(yù)警、商品銷售的發(fā)展,在科研以及實際應(yīng)用中具有非常大的價值。傳統(tǒng)的用于解決文本情感分析問題的方法包括基于知識的方法,基于統(tǒng)計的方法以及混合的方法。在數(shù)據(jù)量不大或者語義不夠豐富的時候,這些方法能夠取得一定的效果。但是隨著數(shù)據(jù)量越來越大,表達(dá)方式越來越豐富,傳統(tǒng)的方法已經(jīng)無法有效地解決這一類問題,新的方法亟待提出。深度學(xué)習(xí)自2006年以來獲得了人學(xué)術(shù)界以及工業(yè)界廣泛的關(guān)注。雖然在整體架構(gòu)上,基于深度學(xué)習(xí)的方法與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相似,但是由于采用了不同的數(shù)據(jù)表示方式以及訓(xùn)練方式,梯度擴散、過擬合等問題得到了有效地解決。目前,在圖像識別,語音識別等領(lǐng)域,基于深度學(xué)習(xí)的方法已經(jīng)取得了比傳統(tǒng)的機器學(xué)習(xí)方法更好的效果。卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中兩個比較有效的模型,前者適合從數(shù)據(jù)中提取出局部特征,而后者能夠有效地分析時序數(shù)據(jù)。單獨地使用這兩個模型中的一個難以在文本情感分析任務(wù)中取得令人滿意的效果,因此出現(xiàn)了由二者共同構(gòu)成的混合模型。本文針對混合模型中存在的缺陷做出了三點改進(jìn):優(yōu)化輸入向量序列,將文本轉(zhuǎn)化為等長的輸入向量序列;提出一種新的激活函數(shù),有效緩解了梯度消失的問題并提高了模型的泛化能力;使用Max Pooling技術(shù)提取局部特征的最大值。從Yelp2015數(shù)據(jù)集的實驗結(jié)果可以看出,本文提出的三點改進(jìn)是有效的。此外,本文針對模型中比較重要的參數(shù)做了多組對比實驗,研究了這些參數(shù)對于模型的影響。
[Abstract]:With the rapid development of the Web 2.0 era, there is a lot of data on the Internet. People on blogs, Weibo, product reviews, movie reviews, Web discussion groups and other areas leave a lot of text information. These unstructured texts contain the author's thoughts, feelings, opinions and opinions. If emotional data can be extracted from these unstructured data, Will promote the development of automatic choice support, network public opinion risk analysis, information early warning, commodity sales, It has great value in scientific research and practical application. The traditional methods used to solve the problem of text emotion analysis include knowledge-based methods. Methods based on statistics and mixed methods. When the amount of data is small or semantic is not rich enough, these methods can achieve certain results. But as the amount of data increases, the expression becomes more and more abundant. Traditional methods have not been able to solve such problems effectively, and new methods need to be proposed. Since 2006, in-depth learning has received extensive attention in both academia and industry, although in the overall framework, The method based on depth learning is similar to the traditional neural network, but the problems such as different data representation and training, gradient diffusion and over-fitting are solved effectively. In the field of speech recognition, the method based on depth learning has achieved better results than traditional machine learning methods. Convolution neural network and cyclic neural network are two more effective models in depth learning. The former is suitable for extracting local features from the data, while the latter can effectively analyze temporal data. In this paper, three improvements are made to the defects of the mixed model: optimizing the input vector sequence, transforming the text into the equal length input vector sequence, and proposing a new activation function. The problem of gradient disappearance is effectively alleviated and the generalization ability of the model is improved. The maximum value of local feature is extracted by using Max Pooling technique. The experimental results of Yelp2015 dataset show that the three improvements proposed in this paper are effective. In this paper, the effects of these parameters on the model are studied.
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李盛瑜;何文;;一種對聊天文本進(jìn)行特征選取的方法研究[J];計算機科學(xué);2007年05期

2 蔣志方;祝翠玲;吳強;;一個對不帶類別標(biāo)記文本進(jìn)行分類的方法[J];計算機工程;2007年12期

3 趙鋼;;從復(fù)雜文本中導(dǎo)入數(shù)據(jù)的方法[J];中國審計;2007年18期

4 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計算機科學(xué);2002年08期

5 李建中,楊艷,張艷秋;并行文本管理原型系統(tǒng)PDoc的功能與總體框架[J];哈爾濱工業(yè)大學(xué)學(xué)報;2004年09期

6 覃曉;元昌安;彭昱忠;丁超;;基于基因表達(dá)式編程的Web文本分類研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年03期

7 諶志群;;文本趨勢挖掘綜述[J];情報科學(xué);2010年02期

8 王亞民;劉洋;;含附件文本的分類算法研究[J];情報雜志;2012年08期

9 江偉;潘昊;;基于優(yōu)化的多核學(xué)習(xí)方法的Web文本分類的研究[J];計算機技術(shù)與發(fā)展;2013年10期

10 陳福海;C++中用>>和<<重載實現(xiàn)文本文件的方便存取[J];現(xiàn)代計算機;1997年05期

相關(guān)會議論文 前10條

1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復(fù)制文本檢測[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年

2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國控制與決策學(xué)術(shù)年會論文集[C];1997年

3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類中的應(yīng)用[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2002年

4 李文波;孫樂;黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

5 黃云平;孫樂;李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

6 蔣勇;陳曉靜;;一種多方向手寫文本行提取方法[A];第二十七屆中國控制會議論文集[C];2008年

7 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復(fù)制文本檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年

8 胡俊;黃厚寬;;一種基于SVM的可視化文本分類的方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年

9 勞錦明;韋崗;;文本壓縮技術(shù)研究的新進(jìn)展[A];開創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國青年通信學(xué)術(shù)會議論文集[C];2001年

10 江荻;;藏語文本信息處理的歷程與進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

相關(guān)重要報紙文章 前1條

1 戴洪玲;向Excel中快速輸入相同文本[N];中國電腦教育報;2004年

相關(guān)博士學(xué)位論文 前10條

1 宋歌;基于聚類森林的文本流分類方法研究[D];哈爾濱工業(yè)大學(xué);2014年

2 韓開旭;基于支持向量機的文本情感分析研究[D];東北石油大學(xué);2014年

3 鄭立洲;短文本信息抽取若干技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2016年

4 韓磊;漢語句義結(jié)構(gòu)模型分析及其文本表示方法研究[D];北京理工大學(xué);2016年

5 胡明涵;面向領(lǐng)域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué) ;2009年

6 孫曉華;基于聚類的文本機會發(fā)現(xiàn)關(guān)鍵問題研究[D];哈爾濱工程大學(xué);2010年

7 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年

8 霍躍紅;典籍英譯譯者文體分析與文本的譯者識別[D];大連理工大學(xué);2010年

9 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2006年

10 李自強;大規(guī)模文本分類的若干問題研究[D];電子科技大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 王軼霞;基于半監(jiān)督遞歸自編碼的情感分類研究[D];內(nèi)蒙古大學(xué);2015年

2 金傳鑫;氣象文本分類特征選擇方法及其在MapReduce上的實現(xiàn)[D];南京信息工程大學(xué);2015年

3 李少卿;不良文本及其變體信息的檢測過濾技術(shù)研究[D];復(fù)旦大學(xué);2014年

4 董秦濤;基于文本的個人情感狀態(tài)分析研究[D];蘭州大學(xué);2015年

5 鐘文波;搜索引擎中關(guān)鍵詞分類方法評估及推薦應(yīng)用[D];華南理工大學(xué);2015年

6 黃晨;基于新詞識別和時間跨度的微博熱點研究[D];上海交通大學(xué);2015年

7 陳紅陽;中文微博話題發(fā)現(xiàn)技術(shù)研究[D];重慶理工大學(xué);2015年

8 王s,

本文編號:1549211


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1549211.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb31b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com